스테이블 디퓨전 3와 스테이블 디퓨전 3 터보를 Stability AI 개발자 플랫폼 API에서 사용할 수 있게 되었음을 발표했습니다. 스테이블 디퓨전 3 연구 논문에서 밝힌 바와 같이 사람의 선호도 평가를 기반으로 한 타이포그래피와 프롬프트 팔로잉 측면에서 DALL-E 3 및 Midjourney v6와 같은 최첨단 text-to-image 생성 시스템과 동등하거나 더 뛰어난 성능을 발휘합니다. 새로운 멀티모달 확산 트랜스포머(MMDiT) 아키텍처는 이미지와 언어 표현에 별도의 가중치 세트를 사용하여 이전 버전의 안정적 확산에 비해 텍스트 이해 및 철자 기능을 극대화 시켰습니다.현재 API를 통해 이 모델을 사용할 수 있지만, 공개 릴리스에 앞서 모델을 개선하기 위해 지속적으로 노력하고 있다고 합니다..
Stable Diffusion 3는 가장 최신에 나온 Stable Diffusion 모델입니다. Stable Diffusion Cascade 및 Stable Diffusion XL과 같은 이전 모델보다 텍스트 생성 및 프롬프트 팔로잉 성능이 뛰어납니다.현재 Stable Diffusion 3은 API로 제공되고 있습니다. API 연동에 대해서는 다른 포스팅에서 자세히 다뤄보겠습니다.그럼 본격적으로 3개의 모델에 대해 비교해보겠습니다. 텍스트 렌더링읽기 쉬운 텍스트를 생성하는 것은 모든 AI 이미지 생성기에게 오랫동안 어려운 숙제였습니다. Stable Diffusion 1.5는 이 작업을 제대로 수행하지 못했고, Stable Diffusion XL은 이를 개선했습니다. 그리고 스테이블 캐스케이드는 비약적인 ..