Stable Audio Open: Modelo Open Source para Criação de Áudio

Tecnologia Inovação Música

A Stability AI lançou o Stable Audio Open, um modelo de código aberto para a geração de amostras de áudio e efeitos sonoros de até 47 segundos a partir de prompts de texto. Este avanço visa capacitar designers de som, músicos e comunidades criativas ao permitir a criação de batidas de bateria, riffs de instrumentos e sons ambientes.

Create a flat, corporate style 2D vector image in a linear perspective. The image should have a white, textureless background. The main focus is a computer, emanating musical notes and sound waves from its screen, signifying the creation of audio. The words 'Stable Audio Open' should prominently feature in the image, signifying the name of the model. The predominant color palette for the image should be shades of blue and white to symbolize innovation and technology.

Imagem gerada utilizando Dall-E 3

O Stable Audio Open é um modelo de texto-para-áudio que permite a geração de até 47 segundos de dados de áudio de alta qualidade a partir de um simples prompt de texto. Ele é especialmente treinado para criar batidas de bateria, riffs de instrumentos, sons ambientes, gravações foley e outros elementos de produção de áudio. A principal vantagem deste lançamento open source é que os usuários podem ajustar o modelo com seus próprios dados de áudio personalizados.

Geração de batidas de bateria
Criação de riffs de instrumentos
Produção de sons ambientes
Gravações foley
Elementos de produção de áudio

Diferente do produto comercial Stable Audio, que produz faixas completas de até três minutos com estrutura musical coerente, o Stable Audio Open é especializado em amostras de áudio e efeitos sonoros. Este modelo proporciona uma visão sobre a IA generativa para design de som, priorizando o desenvolvimento responsável ao lado das comunidades criativas.

- Modelo treinado com dados do Freesound e do Free Music Archive - Disponível para download no Hugging Face - Encoraja feedback de designers de som, músicos e desenvolvedores

O Stable Audio Open representa um passo importante para a geração de áudio aberta e responsável. A Stability AI convida a comunidade a explorar as capacidades do modelo e a contribuir com feedback para futuras melhorias.

O lançamento do Stable Audio Open abre novas possibilidades para a criação de áudio generativo, permitindo que músicos e designers de som personalizem e aprimorem suas produções. Com a continuidade da pesquisa e o desenvolvimento colaborativo, a Stability AI espera expandir ainda mais as capacidades da geração de áudio aberta.