
Gino News
quarta-feira, 23 de outubro de 2024
Meta Lança Spirit LM: Novo Modelo de Linguagem Multimodal Open Source
Em um lançamento que combina texto e fala, a Meta apresentou o Spirit LM, seu primeiro modelo de linguagem multimodal open source, disponível sob uma licença não comercial, visando melhorar a expressividade e a naturalidade das interações em AI ao integrar entradas e saídas de texto e fala.

Imagem gerada utilizando Dall-E 3
A Meta acaba de lançar o Spirit LM, um modelo de linguagem multimodal open source que permite a interação entre texto e fala de maneira mais natural e expressiva. Esse lançamento ocorre em meio a um crescente interesse em inteligência artificial que integra diferentes formas de comunicação, especialmente com a proximidade do Halloween 2024.
Desenvolvido pela equipe de Fundamental AI Research (FAIR) da Meta, o Spirit LM foi projetado para superar limitações dos modelos de voz existentes, proporcionando uma geração de fala que captura qualidades expressivas humanas como tom e emoção. Disponível apenas para uso não comercial, o modelo concede direitos para uso, reprodução e modificação, mas não para distribuição comercial.
Com duas versões disponíveis, Spirit LM Base e Spirit LM Expressive, o modelo consegue processar e gerar fala utilizando tokens fonéticos e emocionais. Essa abordagem permite gerar respostas de maneira mais envolvente, adequando-se a aplicações práticas como assistentes virtuais e bots de atendimento ao cliente.
Spirit LM Base: Geração de fala utilizando tokens fonéticos.
Spirit LM Expressive: Inclui tokens de emoção para interações mais ricas.
Compete com modelos como GPT-4o e Hume’s EVI 2.
Modelo disponível apenas para fins de pesquisa não comercial.
Meta busca incentivar a pesquisa em AI multimodal.
O Spirit LM está inserido em um contexto mais amplo de pesquisa da Meta, que busca desenvolver modelos que não só avançam a tecnologia de inteligência artificial, mas também contribuem para a acessibilidade e aplicabilidade no cotidiano. Análises posteriores podem revelar seu impacto em áreas como medicina e serviços ao consumidor.
- Integração de texto e fala em AI. - Aumento da expressividade nas interações. - Potencial de inovação para assistentes virtuais. - Modelo open source que promove pesquisa. - Aplicável em diversas indústrias.
A inovação trazida pelo Spirit LM é promissora, pois pode moldar o futuro das interações com inteligência artificial, tornando-as mais humanas e acessíveis. Esse avanço, se bem explorado, pode levar a uma nova era de assistentes virtuais e aplicações interativas em diversos setores.
O lançamento do Spirit LM pela Meta representa um avanço crucial na integração de texto e fala em AI, com potenciais impactos significativos em diversas aplicações. Os interessados em acompanhar as últimas inovações em tecnologia e ciência da computação podem se inscrever em nossa newsletter, onde encontrarão conteúdos atualizados diariamente.
FONTES:
REDATOR

Gino AI
23 de outubro de 2024 às 10:40:47