Stability AI가 최신 텍스트-이미지 AI 모델인 Stable Diffusion 3를 출시하며 빠르게 진화하는 생성 AI 분야에서 괄목할 만한 발전을 이루었습니다. 이 새로운 모델은 이미지 품질, 텍스트 렌더링 및 복잡한 프롬프트 이해 능력에서 놀라운 개선을 보여주며, 동시에 리소스 효율성도 높였습니다.
Stable Diffusion 3는 단순한 점진적 업그레이드가 아닙니다. AI가 텍스트에서 이미지를 처리하고 생성하는 방식에 대한 패러다임 전환을 나타내는 획기적인 아키텍처인 MMDiT(Multimodal Diffusion Transformer)를 도입했습니다.
Stable Diffusion 3의 새로운 기능은 무엇인가요?
- 향상된 이미지 품질: Stable Diffusion 3는 전문 아티스트가 만든 이미지 품질에 버금가는 시각적으로 더 매력적이고 사실적인 이미지를 생성합니다.
- 탁월한 타이포그래피: 가장 눈에 띄는 개선 사항 중 하나는 이전 AI 모델에게 악명 높은 어려운 작업이었던 이미지 내에서 명확하고 읽기 쉬운 텍스트를 생성하는 모델의 능력입니다.
- 더욱 깊어진 프롬프트 이해: 이제 사용자는 매우 구체적이고 미묘한 프롬프트를 작성할 수 있으며 Stable Diffusion 3는 사용자의 비전을 멋진 시각적 자료로 정확하게 변환합니다.
- 리소스 효율성: 향상된 기능에도 불구하고 Stable Diffusion 3는 더 효율적으로 설계되어 더 적은 처리 능력과 메모리가 필요하므로 더 많은 청중이 접근할 수 있습니다.
Stable Diffusion 3는 어떻게 작동하나요?
Stable Diffusion 3의 마법은 혁신적인 MMDiT 아키텍처에 있습니다. 이 새로운 시스템은 이미지 및 언어 데이터에 대해 별도의 가중치 세트를 사용하여 AI가 텍스트와 시각적 정보를 독립적으로 더 잘 이해하고 처리할 수 있도록 합니다. 이러한 관심사 분리를 통해 둘 사이의 더욱 정교한 상호 작용이 가능해 시각적으로 놀라울 뿐만 아니라 입력 텍스트를 정확하게 반영하는 이미지를 생성할 수 있습니다.
Stable Diffusion 3: 경쟁 제품을 능가하다

Stability AI는 Stable Diffusion 3를 DALL·E 3, Midjourney v6 및 Ideogram v1과 같은 다른 주요 텍스트-이미지 모델과 비교하여 광범위한 인간 선호도 평가를 수행했습니다. 결과는 자명합니다. Stable Diffusion 3는 이미지 품질, 프롬프트 준수 및 타이포그래피에서 경쟁 제품만큼 좋거나 더 나은 순위를 일관되게 유지합니다.
Stable Diffusion 3: 생성 예시




미래를 위한 확장
Stability AI는 또한 다양한 수의 매개변수를 사용하여 Stable Diffusion 3 모델을 훈련하는 철저한 확장 연구를 수행했습니다. 결과는 더 큰 모델 크기에서 성능이 명확하고 일관되게 향상되어 이 기술의 미래에 대한 더 큰 잠재력을 시사합니다.
라이선스 및 가용성
Stable Diffusion 3는 현재 Stability 비상업적 연구 커뮤니티 라이선스에 따라 출시되어 학술 연구 및 개인 프로젝트와 같은 비상업적 용도로 무료로 사용할 수 있습니다. 상업용 라이선스는 전문 아티스트, 디자이너 및 기업을 위해 Stability AI를 통해 제공됩니다.
Stable Diffusion 3: 크기 및 종류
공개적으로 출시되어 다운로드 가능:
- SD3 Medium – 20억 개의 매개변수 모델로, https://huggingface.co/stabilityai/stable-diffusion-3-medium에서 다운로드할 수 있습니다.
Stability AI API를 통해서만 사용 가능
- SD3 Large – 80억 개의 매개변수 모델
- SD3 Large Turbo – 추론 시간이 더 빠른 80억 개의 매개변수 모델
AI 이미지 생성의 미래
Stable Diffusion 3는 단순한 기술적 혁신이 아니라 창의성의 미래를 엿볼 수 있는 기회입니다. 고급 기능과 사용자 친화적인 디자인을 갖춘 이 모델은 시각적 콘텐츠를 만들고 상호 작용하는 방식을 혁신할 수 있는 잠재력을 가지고 있습니다. 자신의 기술의 경계를 넓히는 전문 아티스트부터 가장 거친 상상력을 현실로 만드는 개인에 이르기까지 Stable Diffusion 3는 이미지 생성 환경을 민주화하고 재정의할 준비가 되어 있습니다.
자료
- Stable Diffusion 3 Medium 저장소: https://huggingface.co/stabilityai/stable-diffusion-3-medium
- 연구 논문: https://arxiv.org/pdf/2403.03206