스테이블 디퓨전 3와 스테이블 디퓨전 3 터보를 Stability AI 개발자 플랫폼 API에서 사용할 수 있게 되었음을 발표했습니다. 스테이블 디퓨전 3 연구 논문에서 밝힌 바와 같이 사람의 선호도 평가를 기반으로 한 타이포그래피와 프롬프트 팔로잉 측면에서 DALL-E 3 및 Midjourney v6와 같은 최첨단 text-to-image 생성 시스템과 동등하거나 더 뛰어난 성능을 발휘합니다. 새로운 멀티모달 확산 트랜스포머(MMDiT) 아키텍처는 이미지와 언어 표현에 별도의 가중치 세트를 사용하여 이전 버전의 안정적 확산에 비해 텍스트 이해 및 철자 기능을 극대화 시켰습니다.현재 API를 통해 이 모델을 사용할 수 있지만, 공개 릴리스에 앞서 모델을 개선하기 위해 지속적으로 노력하고 있다고 합니다..
인공지능 기술이 빠르게 발전하고 있는 요즘, 이미지 생성 분야에서는 특히 놀라운 발전이 이뤄지고 있습니다. 많은 생성형 이미지AI(Midjourney,DALL·E 3 등)가 있지만 그 중에서도 Stable Diffusion AI는 주목할 만한 도구 중 하나입니다. 이 글에서는 스테이블 디퓨전에 대한 기본 정리와 함께 이것을 선택해야 하는 이유에 대해 말해볼까 합니다.Stable Diffusion AI란Stable Diffusion은 2022년에 출시 된텍스트 및 이미지 프롬프트에서 고유한 실사 이미지를 생성하는 생성형 인공 지능(생성형 AI) 모델입니다. Stable Diffusion을 우리말로 바꾸면 '안정적인 확산' 입니다. 작동 원리를 보면 왜 이런 이름이 붙여 졌는지 알 수 있죠. Stable D..