top of page

Gino News

quarta-feira, 11 de dezembro de 2024

CePO Revoluciona a Capacidade de Raciocínio do Modelo Llama com Computação em Tempo de Teste

Tecnologia Inteligência Artificial Inovação

A Cerebras lançou o CePO (Cerebras Planning and Optimization), um novo framework que aprimora as capacidades de raciocínio dos modelos Llama, visando melhorar a precisão em tarefas complexas através de técnicas de computação em tempo de teste, superando as expectativas de desempenho no setor.

Create a 2D and linear perspective image in a vector, flat and corporate style on a plain white background. The image should depict the Cerebras' CePO (Cerebras Planning and Optimization) interface in use, with a clear visual of Llama models and examples of step-by-step reasoning, incorporating hi-tech visual elements like interactive charts and schematics. Additional elements include a performance graph - illustrating the superiority of Llama with CePO, reasoning schematics - exemplifying step-by-step reasoning, computation icons - symbolizing test-time computation, and a technological background - suggesting an advanced development environment.

Imagem gerada utilizando Dall-E 3

Recentemente, a Cerebras introduziu o CePO, uma estrutura inovadora que visa agregar habilidades sofisticadas de raciocínio à popular família de modelos Llama. Essa inovação é especialmente notável por sua capacidade de aumentar a precisão em tarefas complexas de raciocínio, utilizando técnicas de computação em tempo de teste. O destaque é a superação de outros modelos, como o OpenAI o1 e o Alibaba QwQ, que já demonstraram que a computação adicional durante a inferência pode melhorar drasticamente a resolução de problemas.


Com a aplicação do CePO ao Llama 3.3-70B, a Cerebras conseguiu que este modelo superasse o Llama-405B em diversos benchmarks desafiadores nas áreas de codificação, matemática e raciocínio. Equipado com hardware da Cerebras, o Llama 3.3-70B alcança uma performance interativa impressionante de aproximadamente 100 tokens por segundo, o que é um marco entre os modelos de raciocínio em tempo de teste.


A integração do CePO com o Llama 3.3-70B não apenas estreitou a lacuna de precisão em relação ao Llama-3.1 405B, como também forneceu uma vantagem clara em tarefas complexas de raciocínio, mostrando que com a melhoria na qualidade dos LLMs, o CePO oferece um valor agregado significativo. Os resultados dos testes revelaram que o Llama 3.3-70B chegou a desempenhar comparativamente ao GPT-4 Turbo e superou o Sonnet 3.5 em várias métricas.


As três principais inovações do CePO incluem: raciocínio passo a passo, comparação em vez de verificação e um formato de saída intuitivo. Estas abordagens permitem que o Llama produza planos detalhados para resolver problemas complexos, execute-os múltiplas vezes e analise as respostas para identificar inconsistências, aumentando assim a eficácia do modelo.


  1. Raciocínio passo a passo: O modelo fragmenta perguntas complexas em etapas simples.

  2. Uso de comparação em vez de verificação: O modelo foca em inconsistências em vez de autoavaliações.

  3. Formato de saída intuitivo: A expectativa é clara com formatos estruturados.

  4. Pipeline do CePO: Inclui planejamento, execução e análise de respostas.

  5. Performance notável em hardware Cerebras: 100 tokens/segundo.


Com o CePO, a Cerebras não apenas demonstrou como a computação em tempo de teste pode aumentar consideravelmente as capacidades de raciocínio do Llama, mas também planeja abrir o código do CePO para desenvolvimento pela comunidade. O foco nas próximas etapas inclui frameworks de prompting avançados, dados sintéticos otimizados e mecanismos de verificação aprimorados para cadeias de raciocínio complexas.


O CePO representa um avanço significativo nas capacidades dos modelos de linguagem, prometendo melhorar a eficácia na resolução de problemas complexos. A abertura do código do CePO certamente incentivará o desenvolvimento de novas técnicas de otimização, tornando-se uma contribuição valiosa para a comunidade. Os interessados em mais informações e atualizações podem seguir a Cerebras no Twitter ou juntar-se ao seu Discord para compartilhar experiências e novidades.


FONTES:

    1. OpenAI

    2. Hugging Face - Llama 3.3 Model

    3. MMLU-Pro Benchmark

    4. CRUXEval Benchmark

    5. LiveCodeBench

    REDATOR

    Gino AI

    11 de dezembro de 2024 às 21:51:54

    PUBLICAÇÕES RELACIONADAS

    Create a 2D, linear and corporate-style vector image symbolizing a significant milestone in artificial intelligence technology. This image shows the Gemini 2.0 Flash, a model that integrates native image generation and text-based editing. The interface of Gemini 2.0 Flash is shown in use, placed against a plain, white, and texture-less background. In the image, you can see it generating images from text commands within a digital workspace. Additional elements in the image include symbols of artificial intelligence, like brain and circuit icons. Use vibrant colors to convey innovation and technology, and apply a futuristic style that aligns with the vision of advanced technology.

    Google Lança Gemini 2.0 Flash: Revolução na Geração de Imagens com IA

    Create an image in a 2D, linear perspective that visualizes a user interacting with a large-scale language model within a digital environment. The image should be in a vector-based flat corporate design with a white, textureless background. Display charts that show comparisons between performance metrics of Length Controlled Policy Optimization (LCPO) models and traditional methods. Also, include reasoning flows to illustrate the model's decision-making process. To symbolize the real-time application of the model in business operations, include elements of a digital environment. Use cool colors to convey a sense of advanced technology and innovation.

    Nova Técnica Revoluciona Otimização de Raciocínio em Modelos de Linguagem

    Creatio, a Boston-based CRM and workflow automation company, has announced its new AI-native CRM system. Presenting a 2D, linear vector illustration in a corporate, flat style with a non-textured white background, it highlights a futuristic CRM interface. An interactive chatbot, symbolizing the new interactive platform, is placed centrally. There are charts symbolizing increased efficiency and automation in the background. Hints of mordern and innovative blue and green colors are used in the design. Users of diverse descent and different genders are shown interacting with the system, emphasizing personalization and user experience.

    Creatio Revoluciona o CRM com Plataforma Nativa de IA

    Illustrate a 2D, linear perspective image in a corporate, flat and vector style. The image has a textureless, white background. In the foreground, focus on a central figure who symbolizes a leadership role in AI, but not specifically Stephen Peacock. He is explaining the application of AI in game development. Include a visual context of the game development environment and a logo symbolizing an international game development provider, but not specifically the Keywords Studios logo.

    Keywords Studios Lança Soluções de IA para Desenvolvimento de Jogos

    Fique por dentro das últimas novidades em IA

    Obtenha diariamente um resumo com as últimas notícias, avanços e pesquisas relacionadas a inteligência artificial e tecnologia.

    Obrigado pelo envio!

    logo genai

    GenAi Br © 2024

    • LinkedIn
    bottom of page