![스테이블 디퓨전(Stable diffusion) 매개변수(parameters) 알아보기](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FoPj6R%2FbtsGYS8f6VQ%2F6OG598GQlR7HH1EmnyaT2k%2Fimg.png)
안녕하세요, SDmaster 입니다. 스테이블 디퓨전으로 우리는 cfg, stpes 등 다양한 것들을 조정하면서 이미지를 생성합니다.
우리는 그러한 것들을 매개변수(parameters)라고 하며 이러한 매개변수에 따라 이미지가 다르게 생성되는 걸 확인할 수 있습니다.
오늘은 이 매개변수에 어떠한 것이 있고 각각의 역할이 무엇인지 알아보겠습니다.
CFG Scale
CFG Scale(분류 안내 척도)은 모델이 프롬프트를 얼마나 따르게 할 것인지를 제어하는 매개변수입니다.
1 - 대부분 프롬프트를 무시합니다.
3 - 더 창의적으로 행동합니다.
7 - 프롬프트 준수와 자유 사이의 적절한 균형을 유지합니다.
15 - 프롬프트를 더 많이 준수합니다.
30 - 프롬프트를 엄격하게 따릅니다.
다음은 동일한 무작위 시드를 사용하여 CFG 척도를 높이는 몇 가지 예입니다.
<pdata-ke-size="size16">베이스 프롬프트는 다음과 같습니다
Postive
xxmixgirl, (masterpiece:1.0), (highest quality:1.12), (HDR:1.0)
a girl with long hair looking at viewer, with a teal background and a indigo sky
constant, vaporwave colors, a character portrait, synchronization
detailed, realistic, 8k uhd, high quality
Negative
(worst quality, low quality, illustration, 3d, 2d, painting, cartoons, sketch)
tooth, open mouth
일반적으로 1과 30의 두 극단적인 값은 피하는 것이 좋습니다.해당 체크포인트에서 권장하는 값은 8이었습니다. 개인적으로도 CFG Scale 값이 7일때 이미지가 가장 자연스럽게 나온 것 같습니다.
권장 사항: 우선 7로 시작하여 프롬프트를 더 많이 따르도록 하려면 더 높이는 식으로 방향을 잡는 게 좋습니다.
Sampling steps
샘플링 단계가 증가할수록 품질이 향상됩니다. 일반적으로 Euler 샘플러를 사용했을 때 20단계 정도면 고품질의 선명한 이미지를 얻을 수 있습니다.
더 높은 값으로 올라갈수록 이미지가 미묘하게 달라지지만 반드시 이미지 퀄리티가 높아지는 것은 아닙니다.
30steps를 넘어가면 시간만 더 오래 걸리고 이미지의 퀄리티 차이는 거의없는 걸 확인할 수 있습니다.
권장 사항: 20~30단계. 화질이 낮다고 생각되면 더 높게 조정하시면 됩니다.
Sampling Methods
사용 중인 GUI에 따라 다양한 샘플링 방법을 선택할 수 있습니다. 결과는 같아야 하지만 수치 편향으로 인해 약간 다를 수 있습니다. 그러나 여기에는 정답이 없으며 이미지가 좋아 보이는 것이 유일한 기준이므로 어떤 샘플러가 내가 뽑는 이미지와 잘 어울리게 나오는지 확인하시고 사용하시는게 좋습니다.
모든 방법이 똑같이 만들어지는 것은 아닙니다. 아래는 다양한 방법의 처리 시간입니다.
권장 사항: 실사 이미지를 뽑으실 땐 DPM++ 2M Karras를 추천해 드립니다. 그 외엔 SDE가 들어간 샘플러를 추천해 드립니다.
Seed
값을 -1로 설정하면 매번 무작위 시드를 사용합니다. 새로운 이미지를 계속 생성해서 원하는 느낌의 이미지가 나올 때까지는 Seed값을 -1로 해둔 상태로 생성하시는 게 유용합니다.
반면에 이 값을 고정하면 새로 생성할 때마다 동일한 이미지가 생성됩니다.
권장 사항: -1로 해두고 원하는 이미지가 나오면 Seed값을 고정한 채 미세 조정해 주는 것을 추천해 드립니다.
Image Size
출력 이미지의 크기입니다. 스테이블 디퓨전 v1은 512×512 이미지로 학습되므로 이 크기에서 너무 많이 벗어나면 오브젝트가 중복되는 등의 문제가 발생할 수 있습니다. 그래서 처음에는 512x512로 이미지를 생성한 뒤 Upsclae기법으로 사진의 품질을 올리는 것이 일반적입니다.
최근에 나온 SDXL모델 같은 경우는 1024x1024로 학습되어 처음 이미지를 생성할 때부터 512x512 이상의 사이즈를 선택할 수 있습니다.
v1 모델의 경우 : 이미지 크기를 512×512로 설정하세요. 그렇지 않으면 512×768 또는 768×512로 설정합니다.
SDXL 모델의 경우 : 이미지 크기를 1024x1024로 하셔도 무방합니다.
Batch Size
배치 크기는 매번 생성되는 이미지의 수입니다. 최종 이미지는 무작위 시드에 따라 크게 달라지므로 항상 한 번에 몇 개의 이미지를 생성하는 것이 좋습니다. 이렇게 하면 현재 프롬프트가 무엇을 할 수 있는지 잘 파악할 수 있습니다.
그렇다고 너무 많은 이미지를 한꺼번에 생성하는 것은 시간 대비 효율성이 낮으므로 추천해 드리는 배치 사이즈 사이의 숫자를 추천해 드립니다.
권장 사항: Batch size는 4 ~ 8로 설정하세요.
이번 포스팅에서는 이미지 변경을 위한 매개변수(parameters)에 대해 알아봤습니다. 각 수치를 조정해 보시면서 이미지를 만들다 보시면 미세한 차이 하나로도 이미지가 확연히 바뀌는 경우도 있습니다.
동일한 프롬프트에서 수치를 바꿔가며 어떻게 이미지가 달라지는지 확인해 보시는 것을 추천드립니다.
'Stable Diffusion > 튜토리얼' 카테고리의 다른 글
ComfyUI StableDiffusion3 Medium 설치 방법 및 필수 정리 (0) | 2024.06.20 |
---|---|
Clip skip(CLIP Set Last Layer)이 도대체 뭘까? (1) | 2024.05.31 |
Stable Diffusion LoRA 기본 가이드(1) (0) | 2024.05.08 |
Stable Diffusion을 다루기 위한 프롬프트 작성 기본 가이드 (0) | 2024.05.07 |
'Stable Diffusion' 도대체 어떻게 이미지를 만들어 내는걸까? (0) | 2024.04.23 |
생성형 이미지 AI 중 스테이블 디퓨전에 관한 내용을 주로 다룹니다.
포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!