
Gino News
terça-feira, 22 de outubro de 2024
Aria: O Primeiro Modelo MoE Multimodal de Código Aberto do Mundo
A Rhymes AI anunciou o lançamento de Aria, o primeiro modelo de Mixture-of-Experts (MoE) nativo multimodal de código aberto, prometendo desempenho excepcional em tarefas textuais e visuais, com ênfase na eficiência e flexibilidade.
Imagem gerada utilizando Dall-E 3
Aria se destaca como um modelo multimodal nativo, capaz de processar simultaneamente texto, imagens, vídeos e códigos, superando modelos concorrentes em benchmarks estabelecidos. Com 3.9 bilhões de parâmetros ativados por token, a aplicação do modelo é otimizada para uma compreensão ágil e precisa.
O modelo apresenta uma janela de contexto longa de 64k tokens, permitindo a legendagem de vídeos de 256 quadros em apenas 10 segundos, o que é crucial para a eficiência em aplicações do mundo real. O treinamento foi realizado em quatro estágios, consolidando conhecimentos adquiridos e aprimorando a compreensão multimodal.
As comparações mostram que o Aria supera tanto modelos abertos, como o Pixtral-12B, quanto modelos proprietários, como o GPT-4o, em tarefas envolvendo entendimento de documentos, leitura de gráficos e reconhecimento de texto em cenas. A eficiência de parâmetros do Aria é notável, ativando apenas uma fração dos parâmetros em comparação com seus concorrentes.
Desempenho superior em tarefas multimodais.
Eficiência em ativação de parâmetros.
Longa capacidade de entrada multimodal.
Capacidade de seguir instruções complexas.
Modelo de código aberto para colaboração.
Com o objetivo de colaborar com desenvolvedores e pesquisadores, a Rhymes AI disponibiliza Aria como um recurso acessível, promovendo inovações em IA. A equipe busca redefinir a integração da IA com a vida cotidiana, enfatizando a eficiência e a multimodalidade como pilares de futuras soluções tecnológicas.
- Modelo aberto e colaborativo. - Capacidades de longo contexto. - Excelência em compreensão multimodal. - Potencial impacto em várias indústrias.
Com essa abordagem, Aria não apenas estabelece novos padrões no processamento multimodal, mas também convida a uma discussão sobre a evolução da IA. O incentivo à colaboração e o foco em resultados sociais significativos representam um passo em direção a um futuro onde a tecnologia é mais integrada às experiências humanas.
Em suma, Aria representa um avanço significativo em modelos de IA, prometendo transformar a maneira como a tecnologia é aplicada em diversos domínios. A Rhymes AI convida todos a explorar as possibilidades deste modelo inovador, assegurando que os interessados se inscrevam na nossa *newsletter* para receber atualizações diárias sobre tecnologia e inovação.
FONTES:
REDATOR

Gino AI
22 de outubro de 2024 às 10:05:13