인공지능 기술이 빠르게 발전하고 있는 요즘, 이미지 생성 분야에서는 특히 놀라운 발전이 이뤄지고 있습니다. 많은 생성형 이미지AI(Midjourney,DALL·E 3 등)가 있지만 그 중에서도 Stable Diffusion AI는 주목할 만한 도구 중 하나입니다.
이 글에서는 스테이블 디퓨전에 대한 기본 정리와 함께 이것을 선택해야 하는 이유에 대해 말해볼까 합니다.
Stable Diffusion AI란
Stable Diffusion은 2022년에 출시 된텍스트 및 이미지 프롬프트에서 고유한 실사 이미지를 생성하는 생성형 인공 지능(생성형 AI) 모델입니다.
Stable Diffusion을 우리말로 바꾸면 '안정적인 확산' 입니다. 작동 원리를 보면 왜 이런 이름이 붙여 졌는지 알 수 있죠.
Stable Diffusion은 이미지를 생성하기 위해 확률적인 과정을 사용하는데, 이 기술은 한번 압축된 이미지를 점진적으로 향상시키면서 노이즈를 점차적으로 감소시키는 방식으로 작동합니다. 이러한 과정이 마치 물리학에서의 확산(diffusion)과 수학적으로 매우 비슷하기 때문에 우리는 이러한 방식으로 작동하는 AI들을 diffusion모델이라고 하고 그 중 이미지를 다루는 모델 하나가 Stable Diffusion입니다. (텍스트를 다루는 diffusion모델은 유명한 chatGPT가 있습니다.)
Stable Diffusion의 작동 원리에 대한 더 자세한 내용은 다음 포스트에 다뤄보기로 하고 이제 Stable Diffusion을 선택해야하는 이유에 대해 알아보겠습니다.
1.오픈소스
Stable Diffusion은 진정한 의미의 오픈소스 모델입니다. 코드와 모델 가중치가 모두 공개되어 있어 누구나 자유롭게 수정하고 확장할 수 있는 장점이 있습니다. 이렇게 해서 탄생된 Stable Diffusion만의 대표적인 GUI인 AUTOMATIC1111과 ComfyUI가 있습니다. 이 외에도 오픈소스를 활용한 다양한 프로그램들이 존재하고 있습니다만 거의 대부분 사람들이 위 두개의 GUI를 사용하고 있습니다.
2.모델의 유연성
Stable Diffusion의 오픈소스 특성 덕분에 사용자는 프롬프트 엔지니어링, 파인튜닝, 모델 앙상블 등을 통해 모델을 맞춤화할 수 있습니다. 이러한 점들은 타 이미지 생성형 ai 보다 모델의 유연성이 월등히 높은 것을 알 수 있습니다.
(미드저니와 달리는 제공하는 제한적인 모델들만 사용할 수 있습니다.)
유저들이 커스터마이징하고 자체적으로 학습한 이미지 모델들을 자유롭게 사용가능하며 이는 더 창의적인 이미지 생성과 자유로운 활동을 할 수 있음을 의미합니다.
3.이미지 생성의 유연성과 커스터마이징
스테이블 디퓨전은 인페인팅 옵션을 통해 이미지 일부만 재생성하고 아웃페인팅을 통해 이미지를 확장할 수 있습니다. 또한 Image-to-Image, depth-to-image, instruct-pix2pix, controlNet 등 다양한 방법으로 컴포지션이나 포즈도 제어할 수 있습니다. 이러한 사항들은 초기에 사용한 경험이 없는 분들은 이해하기 어려울 수 있어 단점으로 다가오실 수 있지만 적응이 되면 다른 생성형 ai들로 하기 어려운 나만의 이미지를 만들수 있습니다.
4.활발한 커뮤니티와 자료들
오픈소스 답게 다양한 GUI가 존재하고 그로 인해 커뮤니티와 유저수가 많고 딥하게 연구하는 사람들이 자기만의 스테이블 디퓨전 사용법들과 이미지 소스들을 공유하고 있습니다. 아래는 ComfyUI의 workflow를 다운받을 수 있는 사이트인데 누구나 무료로 다운 받을 수 있고 그대로 적용해 응용이 가능합니다. 현재 국내 커뮤니티에서는 아카라이브에서 많은 정보들을 볼 수 있었는데 더 많은 정보를 얻으려면 아직까진 해외 사이트를 많이 참조 해야하는 단점아닌 단점이 있습니다.
5.낮은 비용
DALL-E 3, Midjourney는 일정 금액의 사용료를 지불해야 합니다. 하지만 스테이블 디퓨전은 한번 세팅으로 무료로 계속해서 사용가능합니다. 이는 특히 대량의 이미지 생성이 필요한 작업에서 Stable Diffusion의 비용 효율성이 크게 작용합니다.
하지만 고사양 컴퓨터를 요구하기 때문에 구글의 colab을 사용하거나 부품을 업그레이드 해야하는 비용이 발생할 수는 있습니다.
이 외에도 스테이블 디퓨전만의 장점들이 많은데 대표적으로 5가지로 나눠봤습니다. 처음 생성형 이미지 ai를 접하시는 분들은 조금 낯설고 진입장벽이 있어 입문을 꺼려하시는 분이 많을 거라고 예상됩니다. 하지만 원하는 이미지를 자유롭게 생성하고 퀄리티 또한 높이고 싶으신 분들은 스테이블 디퓨전을 사용해보시는걸 권장드립니다.
'Stable Diffusion' 카테고리의 다른 글
스테이블 디퓨전 실사 이미지 맞춤 체크포인트 모델 top3 추천 (0) | 2024.04.26 |
---|
생성형 이미지 AI 중 스테이블 디퓨전에 관한 내용을 주로 다룹니다.
포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!