
Gino News
quarta-feira, 5 de março de 2025
DiffRhythm AI: A Revolução na Geração Musical em Apenas 10 Segundos
O grupo Audio, Speech and Language Processing (ASLP@NPU) da Northwestern Polytechnical University anunciou o lançamento do DiffRhythm, um modelo de geração musical baseado em difusão latente que cria canções completas, incluindo vocais e acompanhamento, em menos de 15 segundos, oferecendo uma solução rápida e de alta qualidade para a composição musical.

Imagem gerada utilizando Dall-E 3
O DiffRhythm se destaca como o primeiro modelo de geração musical a utilizar uma abordagem de difusão latente, permitindo a criação de músicas completas, desde vocais até instrumentação, em um tempo recorde de dez segundos. Esta inovação facilita o acesso à composição musical em uma ampla variedade de gêneros, graças a sua estrutura de arquitetura de fim a fim e suporte multilíngue para letras em inglês e chinês.
Entre os principais recursos do DiffRhythm, incluem-se: velocidade de geração, com canções de até 4 minutos e 45 segundos produzidas em apenas 10 segundos; a capacidade de gerar simultaneamente vocais e acompanhamento; e uma estrutura de modelo simplificada, que dispensa preparações complexas e permite uma rápida implementação.
Geração extremamente rápida de músicas.
Criação simultânea de vocais e acompanhamento.
Arquitertura simples e escalável.
Baixa necessidade de input durante a inferência.
Estrutura não-autoregressiva para velocidade de inferência.
Os pesquisadores também abordam considerações éticas em relação ao uso do modelo, como os riscos de plágio involuntário e a geração de conteúdo potencialmente prejudicial. Recomenda-se a implementa ção de mecanismos de verificação para assegurar a originalidade das músicas geradas.
- Suporte a criação artística. - Utilização em contextos educacionais. - Criação de trilhas sonoras para entretenimento. - Prototipagem rápida de ideias musicais.
Com o lançamento do DiffRhythm, a possibilidade de gerar músicas de forma rápida e acessível está a um clique, impactando a maneira como artistas e criadores podem desenvolver e experimentar com novas ideias musicais, potencializando o acesso à criação musical para uma variedade de usuários.
O DiffRhythm não é apenas um avanço tecnológico, mas uma ferramenta que pode democratizar a música, permitindo que qualquer pessoa com um pouco de criatividade crie canções completas rapidamente. Para se manter atualizado sobre as novidades da tecnologia musical, inscreva-se em nossa newsletter e descubra mais conteúdos relevantes todos os dias.
FONTES:
REDATOR

Gino AI
5 de março de 2025 às 12:53:26




