Maximize Seus Resultados com Stable Diffusion 3: Dicas e Estratégias

Tecnologia Inteligência Artificial Design

A Stability AI lançou recentemente o Stable Diffusion 3 (SD3), um modelo de texto para imagem com 2 bilhões de parâmetros que se destaca em fotorealismo e adesão a prompts, disponível para uso comercial desde 18 de junho de 2024.

Imagem gerada utilizando Dall-E 3

O Stable Diffusion 3 da Stability AI introduz um modelo avançado para a geração de imagens a partir de textos, permitindo uma melhor adesão a prompts longos e detalhados. A versão Medium possui três codificadores de texto diferentes, oferecendo flexibilidade de uso em dispositivos com diferentes capacidades de memória.

Uma das principais inovações do SD3 é a capacidade de aceitar prompts com até 10.000 caracteres, superando a limitação anterior de 77 tokens. Esse avanço permite uma descrição mais rica e complexa das imagens desejadas. No entanto, é importante notar que prompts negativos não funcionam como esperado, variando a saída sem eliminar elementos indesejados.

Os usuários devem escolher a configuração do SD3 que melhor se adapta ao seu hardware, considerando a memória VRAM disponível. A escolha correta dos pesos do modelo e dos parâmetros de configuração, como número de passos e escala de orientação, pode resultar em imagens significativamente melhores.

Use prompts longos e descritivos para melhor adesão.
Escolha a versão do codificador de texto com base na VRAM disponível.
Evite prompts negativos, pois não proporcionam os resultados esperados.
Experimente configurações de 28 passos e uma escala de orientação entre 3.5 e 4.5.
Utilize a recomendação de dimensões de imagem para melhores resultados.

Além disso, as novas funcionalidades permitem que os usuários experimentem diferentes combinações de prompts para cada codificador de texto, embora ainda não existam técnicas definidas que maximizem essa funcionalidade. Os parâmetros experimentais, como o novo "shift", também oferecem oportunidades para melhorar a qualidade da imagem.

O Stable Diffusion 3 representa um avanço significativo na geração de imagens a partir de texto, proporcionando aos usuários mais controle e flexibilidade. Ao implementar as dicas e estratégias mencionadas, é possível otimizar os resultados. Para mais conteúdos sobre tecnologia e inteligência artificial, assine nossa newsletter e tenha acesso a atualizações diárias.