top of page

Gino News

sábado, 22 de julho de 2023

Stable Audio Open: Novo Modelo de Texto para Áudio da Stability AI

Tecnologia Inteligência Artificial Áudio

A Stability AI lançou o Stable Audio Open, um modelo de texto para áudio com pesos abertos, treinado com dados de Creative Commons. Disponível no Hugging Face, o modelo permite uso não comercial e comercial limitado, gerando áudio estéreo de alta qualidade a 44.1kHz a partir de prompts de texto.

Create a corporate flat vector design illustration with a 2D linear perspective against a white, textureless backdrop. The image should depict a digital soundwave emanating from a text prompt on a computer, illustrating high-quality stereo audio's conversion from text. A computer represents the user interface for generating audio from text. A digital sound wave symbolizes the high-quality stereo audio output. The text prompt indicates the textual input converted into audio. Incorporate elements like GPUs in the background pointing to the model's accessibility with consumer GPUs, along with sound and music icons highlighting its applications in sound and music design.

Imagem gerada utilizando Dall-E 3

O Stable Audio Open é um modelo de texto para áudio desenvolvido pela Stability AI, utilizando dados licenciados sob Creative Commons. Ele pode gerar áudio estéreo de alta qualidade a 44.1kHz a partir de prompts de texto e está disponível para uso em GPUs de consumo, tornando-o acessível para fins acadêmicos e artísticos.


  1. Um autoencoder que comprime formas de onda em uma sequência gerenciável.

  2. Um embutimento de texto baseado em T5 para condicionamento de texto.

  3. Um modelo de difusão baseado em transformador (DiT) operando no espaço latente do autoencoder.


O modelo foi treinado com quase 500.000 gravações licenciadas sob CC-0, CC-BY ou CC-Sampling+, provenientes de Freesound e Free Music Archive. A curadoria do conteúdo garantiu a exclusão de material protegido por direitos autorais, utilizando ferramentas como o PANNs e a Audible Magic.


- Design de som: efeitos sonoros e foley. - Criação de amostras: loops de bateria e amostras musicais. - Aplicações comerciais e de marketing: branding de áudio e sons de marca. - Projetos acadêmicos: pesquisa em síntese de áudio e musicologia.


O Stable Audio Open pode ser ajustado para personalizar a geração de áudio, adaptando-se às necessidades específicas de diferentes indústrias e projetos criativos, com treinamento local possível em GPUs A6000.


A introdução do Stable Audio Open representa um avanço significativo na IA de áudio de código aberto. Com sua capacidade de gerar áudio estéreo de alta qualidade e acessibilidade para pesquisadores e artistas, o modelo promete expandir as fronteiras do que é possível na geração de áudio com IA.


 
FONTES:
  1. Stable Audio Open research paper

  2. Hugging Face

  3. Stability AI Community License

  4. Stable Audio 2.0

  5. PANNs

  6. Audible Magic

  7. Stable Audio Open demo

  8. Twitter

  9. Instagram

  10. [LinkedIn](https://www.linkedin.com/company/stability-ai/?viewAsMember=true)

  11. [Discord Community](https://discord.gg/stablediffusion)

REDATOR

Gino AI

27 de setembro de 2024 às 20:18:26

PUBLICAÇÕES RELACIONADAS

Create a 2D, linear perspective image that echoes a corporate and tech-savvy feel. The backdrop is white and textureless, ornamented with an abstract representation of accompanying networks and circuits. Foreground highlights a futuristic interface populated with a group of AI agents, symbolizing the two points, diversity and unity. Interspersed are a variety of AI icons depicting various tasks they can perform. A robotic hand representation is also prominently displayed, symbolizing the supportive functions the system provides to users. Additionally, sprinkle the scene with performance graphs that illustrate the effectiveness and benchmarks of the multitasking AI system compared to competitors. Capture elements of Flat and Vector design styles in the composition.

Manus: O Novo Sistema de IA que Promete Revolucionar Tarefas Autônomas

Create an image in a 2D, linear perspective that visualizes a user interacting with a large-scale language model within a digital environment. The image should be in a vector-based flat corporate design with a white, textureless background. Display charts that show comparisons between performance metrics of Length Controlled Policy Optimization (LCPO) models and traditional methods. Also, include reasoning flows to illustrate the model's decision-making process. To symbolize the real-time application of the model in business operations, include elements of a digital environment. Use cool colors to convey a sense of advanced technology and innovation.

Nova Técnica Revoluciona Otimização de Raciocínio em Modelos de Linguagem

Illustrate a 2D, linear perspective image in a corporate, flat and vector style. The image has a textureless, white background. In the foreground, focus on a central figure who symbolizes a leadership role in AI, but not specifically Stephen Peacock. He is explaining the application of AI in game development. Include a visual context of the game development environment and a logo symbolizing an international game development provider, but not specifically the Keywords Studios logo.

Keywords Studios Lança Soluções de IA para Desenvolvimento de Jogos

Create a 2D, vector-styled illustration with a white and untextured background, conveying corporate aesthetic. Depict the intersection of technology and entertainment, featuring elements of gaming and artificial intelligence. Incorporate graphic elements representing the evolution of games in the digital era, and artificial intelligence icons to symbolize technological integration in game development. Use bright, vibrant colors to convey emotion and innovation in the gaming industry. This image should not contain any identifiable figures or characters and should maintain a flat, linear perspective.

Desafios para Netflix Games após saída do vice-presidente de IA generativa

Fique por dentro das últimas novidades em IA

Obtenha diariamente um resumo com as últimas notícias, avanços e pesquisas relacionadas a inteligência artificial e tecnologia.

Obrigado pelo envio!

logo genai

GenAi Br © 2024

  • LinkedIn
bottom of page