top of page

Gino News

quinta-feira, 7 de novembro de 2024

Stable Diffusion 3.5 Large é Lançado no Hugging Face Hub com Novidades Impressionantes

Tecnologia Inteligência Artificial Desenvolvimento de Software

O lançamento do Stable Diffusion 3.5 Large no Hugging Face Hub no dia 22 de outubro de 2024 traz melhorias significativas em relação à versão anterior, incluindo um novo modelo de 8 bilhões de parâmetros e funcionalidades avançadas em inferência e treinamento.

Create an image in a Corporate, Flat, and 2D Linear style that showcases the launch of the Stable Diffusion 3.5 Large on Hugging Face Hub on October 22, 2024. The image should be a graphic representation of the Stable Diffusion 3.5 model, featuring elements of artificial intelligence such as circuits and performance graphs. Also include illustrations of images generated by the model. The image should have a white, textureless background. Additional elements include vibrant colors to capture attention and reflect creativity, and prominent text that includes the title of the article for quick identification of the topic.

Imagem gerada utilizando Dall-E 3

O Stable Diffusion 3.5 Large é uma atualização importante em relação ao modelo Stable Diffusion 3, disponível no Hugging Face Hub. Esta nova versão apresenta um modelo de 8 bilhões de parâmetros que utiliza um processo de destilação em tempo para gerar imagens com poucas etapas de inferência. O artigo detalha como utilizar essa nova versão no código Diffusers e as otimizações realizadas em seu funcionamento.


Entre as melhorias do SD3.5-large, destaca-se a adoção de *QK normalization* para treinar grandes modelos de Transformer, bem como a implementação de duas camadas de atenção, uma inovação em relação ao SD3-medium que utilizava apenas uma. O texto também menciona que outros componentes, como o text encoder e o variational autoencoder (VAE), permanecem consistentes com as versões anteriores.


Os usuários interessados em acessar o modelo precisam instalar a versão mais recente do Diffusers e seguir algumas etapas de registro no Hugging Face. O artigo fornece exemplos de código para download e uso do SD3.5, incluindo um método otimizado que gera uma imagem em apenas quatro etapas de inferência.


  1. Instalação da versão mais recente do Diffusers.

  2. Registro e login no Hugging Face Hub.

  3. Código para download e execução do modelo SD3.5.

  4. Utilização de estratégias de quantização para otimização.

  5. Exemplos de treinamento e ajustes do modelo.


O artigo também discute como o uso de quantização pode otimizar o uso de memória durante a inferência, permitindo que modelos de grande porte sejam treinados em hardware de consumo. Exemplos de código e referências são fornecidos para ajudar os interessados a implementar e experimentar com o SD3.5.


Com a chegada do Stable Diffusion 3.5 Large, novas possibilidades se abrem para desenvolvedores e artistas que buscam eficiência e qualidade na geração de imagens. A inovação no campo da inteligência artificial, especialmente em modelos generativos, continua a evoluir e promete resultados impressionantes. Para mais conteúdos atualizados diariamente sobre tecnologias emergentes, assine nossa newsletter!


FONTES:

    1. Hugging Face

    2. Hugging Face SD3.5

    3. Documentação do Diffusers

    4. Colab Notebook de exemplo

    5. Artigo sobre treinamento LoRA

    REDATOR

    Gino AI

    7 de novembro de 2024 às 09:42:41

    PUBLICAÇÕES RELACIONADAS

    Illustrate a 2D, linear perspective image in a corporate, flat and vector style. The image has a textureless, white background. In the foreground, focus on a central figure who symbolizes a leadership role in AI, but not specifically Stephen Peacock. He is explaining the application of AI in game development. Include a visual context of the game development environment and a logo symbolizing an international game development provider, but not specifically the Keywords Studios logo.

    Keywords Studios Lança Soluções de IA para Desenvolvimento de Jogos

    Illustrate a Canadian AI startup, Cohere's new generative model, Command A, showcased for business applications. This future technology, reported on March 13, 2025, requires just two GPUs, offering enhanced multilingual performance and doubling the context capacity to 256,000 tokens. The image must represent Command A's AI model in a corporate environment, with graphics representing its performance and integration across various platforms. Adopt a 2D linear perspective and flat vector style and maintain a white, texture-less background. Additional elements should include a performance graph, showcasing Command A's efficiency and speed, Cohere's logo, visual elements of various languages symbolizing the model's multilingual capability, and an office environment for the model's business application context.

    Cohere Lança Modelo de IA Multilíngue Command A com Impulsionamento para Empresas

    Create a vector, flat, corporate-style image showcasing the new technology, Gemma 3, presented by Google on March 12, 2025. Visualize this in a futuristic 2D linear perspective setting with emphasis on AI and data. Incorporate small robots interacting with data and performance graphs reflecting Gemma 3's efficiency compared to other models, symbolizing its accessibility and functionality on smaller devices. Paint the scene against a pure white, textureless background, and infuse it with vibrant colors to attract attention and reflect innovation and modernity.

    Google Lança Modelo Gemma 3 com Janela de Contexto Expandida

    A South Asian female scientist at the forefront of advanced research is seen working in a laboratory setting, symbolizing the progress of science and technology. She's surrounded by essential laser equipment pertaining to photonics research, indicative of her involvement in the development of novel nanoparticles that can oscillate between dark and bright states when exposed to light. These elements are visualized in a vectorial, corporate, flat art style against a white, textureless background. Perspective is 2D, keeping in line with the flat art theme.

    Nanopartículas Bistáveis: O Futuro dos Computadores Opcionais

    Fique por dentro das últimas novidades em IA

    Obtenha diariamente um resumo com as últimas notícias, avanços e pesquisas relacionadas a inteligência artificial e tecnologia.

    Obrigado pelo envio!

    logo genai

    GenAi Br © 2024

    • LinkedIn
    bottom of page