top of page

Gino News

sexta-feira, 31 de janeiro de 2025

DeepSeek Revoluciona a Inteligência Artificial Open Source ao Cortar Custos e Concorrer com Gigantes

Tecnologia Inteligência Artificial Open Source

A empresa chinesa DeepSeek lançou recentemente dois modelos de linguagem, DeepSeek-V3 e DeepSeek-R1, que oferecem capacidades semelhantes às de modelos de gigante como OpenAI e Anthropic, mas com custos de treinamento drasticamente menores, revolucionando o cenário da inteligência artificial open source.

Picture a contemporary 2D, vectored image in a corporate, flat style. The scenario presents a white, untextured background with digital elements symbolizing innovation and technology. The primary objects consist of the interface of an AI-focused app that uses deep learning. The app has icons representing AI and algorithms. Additionally, there's a technological backdrop symbolizing modernity. A color palette of blue and green highlights the scene, embodying the sense of technology and innovation. Emphasizing the whole setting is some highlighted text about 'DeepSeek', indicating the significance of this new development in the field of open source artificial intelligence.

Imagem gerada utilizando Dall-E 3

A DeepSeek, uma proeminente empresa de inteligência artificial da China, apresentou suas mais novas inovações com o lançamento dos modelos DeepSeek-V3 e DeepSeek-R1. Disponíveis para uso e modificação gratuita desde dezembro de 2024, esses modelos têm se destacado pela eficiência no treinamento, custando menos de $6 milhões, especialmente em um contexto de restrições de hardware devido a medidas de exportação dos EUA.


O desempenho do DeepSeek-V3, que conta com 671 bilhões de parâmetros, foi comparado com o de modelos de alto nível como o GPT-4 da OpenAI e o Claude 3.5 da Anthropic, atingindo resultados competitivos, mesmo utilizando uma versão menos potente do hardware da Nvidia. Essa inovação foi possível graças ao uso de algoritmos paralelos e uma arquitetura chamada "mixture-of-experts" (MoE), que permitiu a utilização de redes neurais menores e mais especializadas.


Além dos modelos de linguagem, DeepSeek-R1 foi introduzido como um modelo de raciocínio, capaz de realizar tarefas complexas de lógica. Embora ainda não supere os melhores modelos fechados disponíveis no mercado, a eficácia e o custo-benefício do DeepSeek-R1 atraíram a atenção de empresas desenvolvedoras de aplicações AI, que buscam explorar sua utilização em projetos futuros.


  1. DeepSeek-V3 e R1 são modelos de linguagem e raciocínio open source.

  2. Custos de treinamento do DeepSeek-V3 foram menos de $6 milhões.

  3. DeepSeek-R1 oferece capacidades de raciocínio em tarefas complexas.

  4. Mais de 700 modelos baseados no DeepSeek-V3 já disponíveis na HuggingFace.

  5. DeepSeek promove o uso de algoritmos e arquitetura inovadores.


Enquanto a DeepSeek continua a ganhar espaço, críticas surgem sobre a falta de transparência em relação às bases de dados e ao código de treinamento. A HuggingFace já iniciou esforços para desenvolver uma versão completamente open-source do DeepSeek-R1, o que pode influenciar as diretrizes de liberação de código na comunidade de IA.


- Possibilidade de democratização da IA. - Aumento do número de inovações open source. - Competição acirrada no mercado de IA. - Necessidade de mais transparência nos dados e modelos.


As inovações trazidas pelo DeepSeek não apenas impulsionam a competição na indústria de IA, mas também abrem portas para um panorama onde mais empresas podem acessar tecnologias de ponta a custos acessíveis. A expectativa é que essa tendência desencadeie um aumento na colaboração e na criação de modelos open source, beneficiando tanto o mercado quanto a pesquisa acadêmica.


Em conclusão, a chegada do DeepSeek aos modelos de inteligência artificial pode significar uma mudança significativa no acesso e desenvolvimento de tecnologias emergentes. O leitor é convidado a ficar atento às novidades nesse campo dinâmico, inscrevendo-se na nossa newsletter para mais atualizações sobre inteligência artificial e outras inovações que impactam nosso cotidiano.


FONTES:

    1. DeepSeek

    2. HuggingFace

    3. IEEE Spectrum

    4. Wikipedia

    5. Open Source Initiative

    REDATOR

    Gino AI

    31 de janeiro de 2025 às 12:42:41

    PUBLICAÇÕES RELACIONADAS

    Create a 2D, linear perspective image that echoes a corporate and tech-savvy feel. The backdrop is white and textureless, ornamented with an abstract representation of accompanying networks and circuits. Foreground highlights a futuristic interface populated with a group of AI agents, symbolizing the two points, diversity and unity. Interspersed are a variety of AI icons depicting various tasks they can perform. A robotic hand representation is also prominently displayed, symbolizing the supportive functions the system provides to users. Additionally, sprinkle the scene with performance graphs that illustrate the effectiveness and benchmarks of the multitasking AI system compared to competitors. Capture elements of Flat and Vector design styles in the composition.

    Manus: O Novo Sistema de IA que Promete Revolucionar Tarefas Autônomas

    Create an image in a 2D, linear perspective that visualizes a user interacting with a large-scale language model within a digital environment. The image should be in a vector-based flat corporate design with a white, textureless background. Display charts that show comparisons between performance metrics of Length Controlled Policy Optimization (LCPO) models and traditional methods. Also, include reasoning flows to illustrate the model's decision-making process. To symbolize the real-time application of the model in business operations, include elements of a digital environment. Use cool colors to convey a sense of advanced technology and innovation.

    Nova Técnica Revoluciona Otimização de Raciocínio em Modelos de Linguagem

    Illustrate a 2D, linear perspective image in a corporate, flat and vector style. The image has a textureless, white background. In the foreground, focus on a central figure who symbolizes a leadership role in AI, but not specifically Stephen Peacock. He is explaining the application of AI in game development. Include a visual context of the game development environment and a logo symbolizing an international game development provider, but not specifically the Keywords Studios logo.

    Keywords Studios Lança Soluções de IA para Desenvolvimento de Jogos

    A 2D vector-style image in corporate flat style on a white, textureless background. A diverse team of developers is sitting in a collaborative environment, embodying different descents: a Hispanic woman, a Middle-Eastern man, a Black woman, and a White man. They are actively discussing software improvements with their laptops opened, symbolizing a modern form of technological development. Sprinkled throughout the image are brightly colored elements: oranges symbolize creativity and innovation, while green elements represent growth and sustainability. Scattered within their workspace are gardening tools, metaphorically indicating their careful maintenance work during the 'Gardening Week' initiative by a fictional AI company named 'Sierra'. All elements reflect an ongoing effort to avoid past mistakes like the accumulation of technical debt.

    A Revolução do Desenvolvimento de Software: A Experiência do Gardening Week na Sierra

    Fique por dentro das últimas novidades em IA

    Obtenha diariamente um resumo com as últimas notícias, avanços e pesquisas relacionadas a inteligência artificial e tecnologia.

    Obrigado pelo envio!

    logo genai

    GenAi Br © 2024

    • LinkedIn
    bottom of page