
Gino News
terça-feira, 8 de outubro de 2024
DeepMind Apresenta SCoRe: Uma Nova Abordagem para a Autocorreção de Modelos de Linguagem
Pesquisadores da Google DeepMind divulgaram um novo método chamado Self-Correction via Reinforcement Learning (SCeRe), que aprimora a capacidade de autocorreção de modelos de linguagem, utilizando apenas dados gerados internamente pelos próprios modelos, no dia 1 de outubro de 2024.

Imagem gerada utilizando Dall-E 3
Com o aumento da eficácia dos grandes modelos de linguagem (LLMs), torna-se evidente que esses modelos frequentemente falham em fornecer respostas corretas em suas primeiras tentativas. A autocorreção é um aspecto fundamental que pode melhorar significativamente o desempenho desses sistemas, tornando-os mais robustos e confiáveis.
O novo método SCoRe, apresentado pela equipe da DeepMind, utiliza dados gerados internamente para treinar um único modelo que não apenas produz respostas, mas também corrige suas próprias falhas sem depender de feedback externo. O pesquisador Aviral Kumar destacou que, assim como os humanos, os LLMs devem ser capazes de rever suas respostas e aprimorá-las.
Os testes demonstraram que SCoRe melhora substancialmente a capacidade de autocorreção dos modelos Gemini 1.0 Pro e 1.5 Flash, com ganhos significativos em benchmarks de matemática e programação, como MATH e HumanEval. Essas melhorias vão além do que técnicas anteriores de autocorreção conseguiram alcançar.
SCoRe utiliza um processo de treinamento de duas etapas para evitar a 'colapso de comportamento' dos modelos.
A técnica é eficaz em tarefas de múltiplas etapas, onde a revisão é crucial.
Resultados mostraram um ganho de 15.6% na autocorreção em um benchmark importante.
SCoRe é eficiente também em estratégias de escalonamento de inferência.
O método tem potencial para aplicações em diversas áreas além de programação e matemática.
A pesquisa sugere que capacitar LLMs a se autocorrigirem pode melhorar sua segurança e eficácia, permitindo que identifiquem e ajustem respostas potencialmente inadequadas antes de apresentá-las aos usuários.
- Innovação na autocorreção de LLMs. - Impacto positivo em desempenho em múltiplas etapas. - Aprimoramento na segurança dos modelos. - Aplicações potencialmente amplas para SCoRe.
Os achados da pesquisa não apenas ressaltam a importância da autocorreção em LLMs, mas também abrem novas possibilidades para melhorias contínuas na capacidade de resposta desses modelos, trazendo contribuições significativas para o campo da inteligência artificial.
A nova abordagem SCoRe da DeepMind é uma contribuição importante para a evolução dos modelos de linguagem, destacando a necessidade de autocorreção como um aspecto vital para o futuro da inteligência artificial. Os leitores são convidados a se inscreverem na nossa newsletter para mais atualizações sobre inovações em IA e para explorar como essas tecnologias impactam seu cotidiano.
FONTES:
REDATOR

Gino AI
8 de outubro de 2024 às 14:05:54
PUBLICAÇÕES RELACIONADAS




