
Gino News
sexta-feira, 24 de janeiro de 2025
Transformando Aprendizado: Novo Modelo de IA da Sakana Elimina Necessidade de Re-treinamento
Pesquisadores do laboratório Sakana AI desenvolveram o Transformer², um modelo de linguagem autoadaptativo que permite que máquinas aprendam novas tarefas sem a necessidade de re-treinamento, utilizando uma abordagem inovadora em inferência.

Imagem gerada utilizando Dall-E 3
A Sakana AI, focada em algoritmos inspirados na natureza, apresentou um modelo de linguagem chamado Transformer², que se destaca por sua capacidade de aprender novas tarefas sem passar pelo complexo processo de fine-tuning tradicional. Ao invés disso, o modelo ajusta seus parâmetros de forma dinâmica durante a inferência, alinhando-se às solicitações dos usuários.
Normalmente, adaptar modelos de linguagem grande (LLMs) a novas tarefas requer um processo dispendioso de fine-tuning, onde os parâmetros do modelo são ajustados com novos exemplos. O Transformer² inova ao aplicar um método em duas etapas: primeiro, analisa a solicitação para entender a tarefa, e depois aplica ajustes específicos aos pesos do modelo, permitindo uma resposta otimizada.
O modelo faz uso da decomposição em valores singulares (SVD) para identificar componentes críticos que podem ser ajustados. A partir disso, foi desenvolvida uma metodologia chamada singular value finetuning (SVF), que permite que o modelo amplifique ou diminua suas habilidades em tarefas específicas durante a inferência.
O Transformer² supera o método de fine-tuning tradicional em eficiência e adaptabilidade.
Os ajustes dinâmicos dos pesos durante a inferência são pioneiros e oferecem maior flexibilidade.
A pesquisa mostra a possibilidade de transferir z-vectors entre diferentes modelos de linguagem.
Este avanço promete facilitar a aplicação de LLMs em diversos setores.
A Sakana AI disponibilizou o código do Transformer² no GitHub, promovendo transparência e colaboração.
As inovações do Transformer² se destacam, pois as empresas podem personalizar LLMs para novas tarefas sem re-treinamento, o que pode significar uma grande economia de tempo e recursos. Isso também sinaliza uma tendência crescente de desenvolver técnicas de personalização em tempo de inferência no campo da inteligência artificial.
A nova abordagem da Sakana AI com o modelo Transformer² não apenas redefine como máquinas podem aprender, mas também tem o potencial de impactar significativamente diversas indústrias ao permitir integrações mais eficientes e respostas personalizadas. Para mais conteúdos atualizados e insights sobre as últimas inovações em IA, inscreva-se na nossa newsletter e mantenha-se informado!
FONTES:
REDATOR

Gino AI
24 de janeiro de 2025 às 13:32:30