
Gino News
sexta-feira, 31 de janeiro de 2025
DeepSeek Revoluciona a Inteligência Artificial Open Source ao Cortar Custos e Concorrer com Gigantes
A empresa chinesa DeepSeek lançou recentemente dois modelos de linguagem, DeepSeek-V3 e DeepSeek-R1, que oferecem capacidades semelhantes às de modelos de gigante como OpenAI e Anthropic, mas com custos de treinamento drasticamente menores, revolucionando o cenário da inteligência artificial open source.

Imagem gerada utilizando Dall-E 3
A DeepSeek, uma proeminente empresa de inteligência artificial da China, apresentou suas mais novas inovações com o lançamento dos modelos DeepSeek-V3 e DeepSeek-R1. Disponíveis para uso e modificação gratuita desde dezembro de 2024, esses modelos têm se destacado pela eficiência no treinamento, custando menos de $6 milhões, especialmente em um contexto de restrições de hardware devido a medidas de exportação dos EUA.
O desempenho do DeepSeek-V3, que conta com 671 bilhões de parâmetros, foi comparado com o de modelos de alto nível como o GPT-4 da OpenAI e o Claude 3.5 da Anthropic, atingindo resultados competitivos, mesmo utilizando uma versão menos potente do hardware da Nvidia. Essa inovação foi possível graças ao uso de algoritmos paralelos e uma arquitetura chamada "mixture-of-experts" (MoE), que permitiu a utilização de redes neurais menores e mais especializadas.
Além dos modelos de linguagem, DeepSeek-R1 foi introduzido como um modelo de raciocínio, capaz de realizar tarefas complexas de lógica. Embora ainda não supere os melhores modelos fechados disponíveis no mercado, a eficácia e o custo-benefício do DeepSeek-R1 atraíram a atenção de empresas desenvolvedoras de aplicações AI, que buscam explorar sua utilização em projetos futuros.
DeepSeek-V3 e R1 são modelos de linguagem e raciocínio open source.
Custos de treinamento do DeepSeek-V3 foram menos de $6 milhões.
DeepSeek-R1 oferece capacidades de raciocínio em tarefas complexas.
Mais de 700 modelos baseados no DeepSeek-V3 já disponíveis na HuggingFace.
DeepSeek promove o uso de algoritmos e arquitetura inovadores.
Enquanto a DeepSeek continua a ganhar espaço, críticas surgem sobre a falta de transparência em relação às bases de dados e ao código de treinamento. A HuggingFace já iniciou esforços para desenvolver uma versão completamente open-source do DeepSeek-R1, o que pode influenciar as diretrizes de liberação de código na comunidade de IA.
- Possibilidade de democratização da IA. - Aumento do número de inovações open source. - Competição acirrada no mercado de IA. - Necessidade de mais transparência nos dados e modelos.
As inovações trazidas pelo DeepSeek não apenas impulsionam a competição na indústria de IA, mas também abrem portas para um panorama onde mais empresas podem acessar tecnologias de ponta a custos acessíveis. A expectativa é que essa tendência desencadeie um aumento na colaboração e na criação de modelos open source, beneficiando tanto o mercado quanto a pesquisa acadêmica.
Em conclusão, a chegada do DeepSeek aos modelos de inteligência artificial pode significar uma mudança significativa no acesso e desenvolvimento de tecnologias emergentes. O leitor é convidado a ficar atento às novidades nesse campo dinâmico, inscrevendo-se na nossa newsletter para mais atualizações sobre inteligência artificial e outras inovações que impactam nosso cotidiano.
FONTES:
REDATOR

Gino AI
31 de janeiro de 2025 às 12:42:41
PUBLICAÇÕES RELACIONADAS