Stable Diffusion 3.5 Large é Lançado no Hugging Face Hub com Novidades Impressionantes

Tecnologia Inteligência Artificial Desenvolvimento de Software

O lançamento do Stable Diffusion 3.5 Large no Hugging Face Hub no dia 22 de outubro de 2024 traz melhorias significativas em relação à versão anterior, incluindo um novo modelo de 8 bilhões de parâmetros e funcionalidades avançadas em inferência e treinamento.

Create an image in a Corporate, Flat, and 2D Linear style that showcases the launch of the Stable Diffusion 3.5 Large on Hugging Face Hub on October 22, 2024. The image should be a graphic representation of the Stable Diffusion 3.5 model, featuring elements of artificial intelligence such as circuits and performance graphs. Also include illustrations of images generated by the model. The image should have a white, textureless background. Additional elements include vibrant colors to capture attention and reflect creativity, and prominent text that includes the title of the article for quick identification of the topic.

Imagem gerada utilizando Dall-E 3

O Stable Diffusion 3.5 Large é uma atualização importante em relação ao modelo Stable Diffusion 3, disponível no Hugging Face Hub. Esta nova versão apresenta um modelo de 8 bilhões de parâmetros que utiliza um processo de destilação em tempo para gerar imagens com poucas etapas de inferência. O artigo detalha como utilizar essa nova versão no código Diffusers e as otimizações realizadas em seu funcionamento.

Entre as melhorias do SD3.5-large, destaca-se a adoção de *QK normalization* para treinar grandes modelos de Transformer, bem como a implementação de duas camadas de atenção, uma inovação em relação ao SD3-medium que utilizava apenas uma. O texto também menciona que outros componentes, como o text encoder e o variational autoencoder (VAE), permanecem consistentes com as versões anteriores.

Os usuários interessados em acessar o modelo precisam instalar a versão mais recente do Diffusers e seguir algumas etapas de registro no Hugging Face. O artigo fornece exemplos de código para download e uso do SD3.5, incluindo um método otimizado que gera uma imagem em apenas quatro etapas de inferência.

Instalação da versão mais recente do Diffusers.
Registro e login no Hugging Face Hub.
Código para download e execução do modelo SD3.5.
Utilização de estratégias de quantização para otimização.
Exemplos de treinamento e ajustes do modelo.

O artigo também discute como o uso de quantização pode otimizar o uso de memória durante a inferência, permitindo que modelos de grande porte sejam treinados em hardware de consumo. Exemplos de código e referências são fornecidos para ajudar os interessados a implementar e experimentar com o SD3.5.

Com a chegada do Stable Diffusion 3.5 Large, novas possibilidades se abrem para desenvolvedores e artistas que buscam eficiência e qualidade na geração de imagens. A inovação no campo da inteligência artificial, especialmente em modelos generativos, continua a evoluir e promete resultados impressionantes. Para mais conteúdos atualizados diariamente sobre tecnologias emergentes, assine nossa newsletter!

FONTES:

REDATOR

Gino AI

7 de novembro de 2024 às 09:42:41

PUBLICAÇÕES RELACIONADAS

Keywords Studios Lança Soluções de IA para Desenvolvimento de Jogos

Cohere Lança Modelo de IA Multilíngue Command A com Impulsionamento para Empresas

Create a vector, flat, corporate-style image showcasing the new technology, Gemma 3, presented by Google on March 12, 2025. Visualize this in a futuristic 2D linear perspective setting with emphasis on AI and data. Incorporate small robots interacting with data and performance graphs reflecting Gemma 3's efficiency compared to other models, symbolizing its accessibility and functionality on smaller devices. Paint the scene against a pure white, textureless background, and infuse it with vibrant colors to attract attention and reflect innovation and modernity.

Google Lança Modelo Gemma 3 com Janela de Contexto Expandida

A South Asian female scientist at the forefront of advanced research is seen working in a laboratory setting, symbolizing the progress of science and technology. She's surrounded by essential laser equipment pertaining to photonics research, indicative of her involvement in the development of novel nanoparticles that can oscillate between dark and bright states when exposed to light. These elements are visualized in a vectorial, corporate, flat art style against a white, textureless background. Perspective is 2D, keeping in line with the flat art theme.

Nanopartículas Bistáveis: O Futuro dos Computadores Opcionais