
Gino News
quarta-feira, 26 de fevereiro de 2025
Hume Lança Octave: O Novo Modelo de Texto-Para-Fala com Emoções Ajustáveis
A startup nova-iorquina Hume AI lançou seu novo modelo de texto-para-fala, chamado Octave, que gera vozes de IA personalizadas e emotivas, prometendo revolucionar a criação de conteúdos multimídia.

Imagem gerada utilizando Dall-E 3
Hume AI, uma startup emergente em Nova York, apresentou recentemente o Octave, um motor de texto e voz que utiliza um grande modelo de linguagem (LLM) para gerar discursos emocionalmente expressivos. O modelo, que é o primeiro de seu tipo com a capacidade de compreender contextos de palavras e ajustar o tom e a cadência em níveis de frase, promete oferecer vozes mais humanas para audiobooks, diálogos de jogos e produções audiovisuais.
O CEO da Hume AI, Alan Cowen, destacou que o Octave é um avanço significativo na tecnologia de voz, permitindo que usuários ajustem as emoções e inflexões das vozes geradas através de comandos de texto. Por exemplo, o modelo pode replicar a voz de um personagem sarcástico ou transmitir urgência em um diálogo, tudo isso sem necessidade de instruções explícitas.
Além de gerar vozes de alta qualidade, Octave também foi projetado para ser utilizado em uma variedade de aplicações criativas, como podcasts e biografias em áudio. A ferramenta pode ser acessada via API, e cada assinatura oferece diferentes níveis de uso e capacidades.
Capacidades de voz emocional ajustáveis.
Apoio a múltiplos idiomas, começando pelo inglês e espanhol.
Funcionalidade ideal para criadores de conteúdo.
Modelo com preços competitivos em relação a outros do mercado.
Resultados de estudos comparativos favoráveis.
A pesquisa realizada pela Hume AI mostrou que o Octave foi preferido em qualidade de áudio e naturalidade em comparação com um concorrente direto. O modelo é capaz de entender contextos mais amplos, resultando em uma reprodução de voz mais fiel e expressiva.
- Interesse crescente em IA para criação de conteúdo. - Desenvolvimento de novas tecnologias para interações mais naturais. - Potencial impacto na indústria de audiobooks e entretenimento. - Ampliação do uso de vozes de IA em diferentes mídias.
Com suas inovações, Hume AI espera não só oferecer uma ferramenta valiosa para os criadores de conteúdo, mas também expandir as possibilidades da tecnologia de voz, tornando-a mais acessível e personalizada para uma ampla gama de aplicações.
O lançamento do Octave representa um passo significativo na evolução das tecnologias de voz, trazendo um novo nível de personalização e expressão emocional. Para os criadores de conteúdo, isso pode transformar a forma como produzem e consomem materiais multimídia. Os leitores são incentivados a se inscrever em nossa newsletter para atualizações diárias sobre inovações em inteligência artificial e muito mais.
FONTES:
REDATOR

Gino AI
26 de fevereiro de 2025 às 21:24:39