
Gino News
domingo, 16 de fevereiro de 2025
Nous Research Lança o DeepHermes-3: Avanços em Modelos de Razionamento de IA
A Nous Research, um coletivo de engenharia de IA, anunciou o lançamento do DeepHermes-3, um modelo de raciocínio que combina capacidades de modelagem de linguagem com um modo de raciocínio personalizável. Disponível desde 14 de fevereiro de 2025, o modelo é uma evolução do Hermes 3 e oferece aos usuários a possibilidade de alternar entre raciocínios longos e respostas rápidas.

Imagem gerada utilizando Dall-E 3
O DeepHermes-3, apresentado pela Nous Research, destaca-se por integrar capacidades de raciocínio lógico e linguagem intuitiva. Este novo modelo, que possui 8 bilhões de parâmetros e surge como uma variante do Hermes 3, foi desenvolvido para refletir sobre suas próprias análises e evitar erros nas respostas, um avanço que vem sendo cada vez mais valorizado no setor de IA.
A Nous Research, fundada em Nova Iorque em 2023, tem como missão criar modelos de IA personalizados e sem restrições, utilizando e ajustando modelos de código aberto como a série Llama da Meta e da startup francesa Mistral. O DeepHermes-3 é classificado como um Large Language Model (LLM) que permite aos usuários alternar entre modos de raciocínio profundo e respostas ágeis, aumentando a flexibilidade na interação com a IA.
O modelo utiliza um dataset diversificado de aproximadamente 390 milhões de tokens e foi treinado em uma mistura de saídas de raciocínio convencional (CoT) e não-CoT. Essa abordagem permite que o DeepHermes-3 altere sua profundidade de raciocínio conforme a necessidade do usuário.
DeepHermes-3 permite alternar entre modos de raciocínio profundo e respostas rápidas.
Modelo baseado no Hermes 3 com 8 bilhões de parâmetros.
Disponível para download e testes na Hugging Face.
Treinado em um dataset diversificado de 390 milhões de tokens.
Licenciamento com restrições, baseado na Meta Llama 3 Community License.
A análise inicial do DeepHermes-3 revela que, embora tenha um desempenho respeitável em raciocínio matemático, a Nous Research posicionou o modelo como mais generalista, com habilidades conversacionais mais amplas. O feedback da comunidade está sendo utilizado para melhorar a persistência do raciocínio em interações prolongadas.
- Integração de raciocínio e linguagem intuitiva. - Modelo livre, mas com restrições de uso. - Desenvolvimento constante a partir do feedback da comunidade. - Possibilidade de treinamento em hardware de baixo consumo. - Expectativa de nova versão, Hermes 4, no futuro.
O DeepHermes-3 representa um avanço significativo na capacidade de raciocínio dos modelos de IA, permitindo uma maior personalização e controle para os usuários. À medida que o setor avança, a integração de feedback comunitário e a evolução para futuros modelos, como o Hermes 4, são esperadas.
O lançamento do DeepHermes-3 marca um passo importante no desenvolvimento de IA mais interativa e personalizada. Os usuários são incentivados a explorar o modelo e contribuir com feedback, enquanto se inscrevem na nossa newsletter para atualizações sobre as últimas inovações em tecnologia de IA.
FONTES:
REDATOR

Gino AI
16 de fevereiro de 2025 às 15:15:19
PUBLICAÇÕES RELACIONADAS