Nous Research Lança o DeepHermes-3: Avanços em Modelos de Razionamento de IA

Inteligência Artificial Tecnologia Inovação

A Nous Research, um coletivo de engenharia de IA, anunciou o lançamento do DeepHermes-3, um modelo de raciocínio que combina capacidades de modelagem de linguagem com um modo de raciocínio personalizável. Disponível desde 14 de fevereiro de 2025, o modelo é uma evolução do Hermes 3 e oferece aos usuários a possibilidade de alternar entre raciocínios longos e respostas rápidas.

Create an image capturing the essence of the future of AI reasoning, specifically focusing on the DeepHermes-3 model launched by Nous Research, an AI engineering collective. The image is 2D, vector-style with a corporate tone, and set on a plain white background. It features a detailed illustration of the model in action, signifying its unique ability to combine language modelling capabilities with a customizable reasoning approach. Additionally, the image should display a user interface, demonstrating a possible user interaction with the model. It should involve vibrant colors to symbolize innovation. Finally, incorporate reasoning tags to represent the internal process of the model.

Imagem gerada utilizando Dall-E 3

O DeepHermes-3, apresentado pela Nous Research, destaca-se por integrar capacidades de raciocínio lógico e linguagem intuitiva. Este novo modelo, que possui 8 bilhões de parâmetros e surge como uma variante do Hermes 3, foi desenvolvido para refletir sobre suas próprias análises e evitar erros nas respostas, um avanço que vem sendo cada vez mais valorizado no setor de IA.

A Nous Research, fundada em Nova Iorque em 2023, tem como missão criar modelos de IA personalizados e sem restrições, utilizando e ajustando modelos de código aberto como a série Llama da Meta e da startup francesa Mistral. O DeepHermes-3 é classificado como um Large Language Model (LLM) que permite aos usuários alternar entre modos de raciocínio profundo e respostas ágeis, aumentando a flexibilidade na interação com a IA.

O modelo utiliza um dataset diversificado de aproximadamente 390 milhões de tokens e foi treinado em uma mistura de saídas de raciocínio convencional (CoT) e não-CoT. Essa abordagem permite que o DeepHermes-3 altere sua profundidade de raciocínio conforme a necessidade do usuário.

DeepHermes-3 permite alternar entre modos de raciocínio profundo e respostas rápidas.
Modelo baseado no Hermes 3 com 8 bilhões de parâmetros.
Disponível para download e testes na Hugging Face.
Treinado em um dataset diversificado de 390 milhões de tokens.
Licenciamento com restrições, baseado na Meta Llama 3 Community License.

A análise inicial do DeepHermes-3 revela que, embora tenha um desempenho respeitável em raciocínio matemático, a Nous Research posicionou o modelo como mais generalista, com habilidades conversacionais mais amplas. O feedback da comunidade está sendo utilizado para melhorar a persistência do raciocínio em interações prolongadas.

- Integração de raciocínio e linguagem intuitiva. - Modelo livre, mas com restrições de uso. - Desenvolvimento constante a partir do feedback da comunidade. - Possibilidade de treinamento em hardware de baixo consumo. - Expectativa de nova versão, Hermes 4, no futuro.

O DeepHermes-3 representa um avanço significativo na capacidade de raciocínio dos modelos de IA, permitindo uma maior personalização e controle para os usuários. À medida que o setor avança, a integração de feedback comunitário e a evolução para futuros modelos, como o Hermes 4, são esperadas.

O lançamento do DeepHermes-3 marca um passo importante no desenvolvimento de IA mais interativa e personalizada. Os usuários são incentivados a explorar o modelo e contribuir com feedback, enquanto se inscrevem na nossa newsletter para atualizações sobre as últimas inovações em tecnologia de IA.