
Gino News
terça-feira, 21 de janeiro de 2025
DeepSeek-R1: Novo Modelo de IA Rivaliza Performance da OpenAI
Em 20 de janeiro de 2025, a DeepSeek lançou seus modelos de raciocínio DeepSeek-R1 e DeepSeek-R1-Zero, que desafiam a OpenAI em diversos benchmarks de performance de inteligência artificial, destacando-se em tarefas complexas de raciocínio.

Imagem gerada utilizando Dall-E 3
O modelo DeepSeek-R1, junto com sua versão Zero, foi desenvolvido para abordar tarefas de raciocínio complexo. O DeepSeek-R1-Zero se destaca por ser treinado exclusivamente por meio de reinforcement learning (RL) em larga escala, sem a necessidade de fine-tuning supervisionado. Isso resultou em um conjunto interessante de comportamentos de raciocínio, como auto-verificação e geração de cadeias extensas de pensamento.
A pesquisa da DeepSeek revelou que o DeepSeek-R1-Zero foi a primeira pesquisa aberta a validar que capacidades de raciocínio em modelos de linguagem podem ser incentivadas unicamente por RL. Essa inovação marca um importante passo no avanço da inteligência artificial focada em raciocínio.
No entanto, o DeepSeek-R1-Zero apresenta limitações significativas, incluindo repetição sem fim, legibilidade deficiente e mistura de idiomas. Para superar essas deficiências, o DeepSeek-R1 incorpora dados de cold-start antes do treinamento de RL, resolvendo muitas das limitações da versão Zero.
DeepSeek-R1 alcançou 97.3% no benchmark MATH-500, superando a OpenAI.
DeepSeek-R1-Distill-Qwen-32B obteve 57.2% no LiveCodeBench, destacando-se entre modelos menores.
O DeepSeek-R1 obteve 79.8% no AIME 2024, estabelecendo novos padrões em resolução de problemas matemáticos.
DeepSeek optou por disponibilizar o DeepSeek-R1 e o DeepSeek-R1-Zero como open-source.
A Distillation é fundamental para transferir habilidades de raciocínio de modelos maiores para menores, melhorando a eficiência.
O modelo DeepSeek-R1 não apenas rivaliza o sistema OpenAI-o1 em desempenho geral, mas também abre um caminho para novas abordagens no desenvolvimento de modelos de inteligência artificial. A metodologia de treinamento da DeepSeek, que integra estágios de fine-tuning supervisionado e reinforcement learning, promete beneficiar a indústria ao criar modelos mais eficazes.
- Importância do modelo open-source. - Novas possibilidades no setor de IA. - Inovações no processo de raciocínio em IA. - Perspectivas de evolução na distillation.
As implicações do lançamento do DeepSeek-R1 são vastas para a comunidade de inteligência artificial, trazendo inovações que poderão inspirar futuras pesquisas e aplicações práticas em diversas áreas. A capacidade de executar padrões de raciocínio complexos sem instrução humana é um passo significativo para a evolução da IA.
Com a liberação do DeepSeek-R1, a DeepSeek não apenas desafia a OpenAI, mas também abre um novo capítulo na pesquisa em inteligência artificial. Os leitores são incentivados a acompanhar as inovações nessa área, inscrevendo-se em nossa newsletter para receber atualizações diárias sobre os últimos avanços no campo da IA e muito mais.
FONTES:
REDATOR

Gino AI
21 de janeiro de 2025 às 12:26:48