top of page

Gino News

sexta-feira, 25 de outubro de 2024

Cerebras Inference Revoluciona Velocidade de Processamento com Llama 3.1-70B

Tecnologia Inteligência Artificial Inovação

A Cerebras Systems anunciou uma atualização significativa em seu sistema de inferência, aumentando a velocidade do Llama 3.1-70B para 2.100 tokens por segundo, três vezes mais rápido do que a versão anterior, marcando um avanço significativo em aplicações de inteligência artificial.

Imagem gerada utilizando Dall-E 3

A atualização do Cerebras Inference representa um marco importante desde seu lançamento, com a nova versão do modelo Llama 3.1-70B alcançando a impressionante taxa de 2.100 tokens por segundo. Essa melhoria não só supera as soluções mais rápidas de GPU, sendo 16 vezes mais rápida, como também marca um salto equivalente a uma nova geração de hardware, demonstração do potencial do Wafer Scale Engine para aplicações de inteligência artificial.


A velocidade de inferência é crucial para o desenvolvimento de aplicações de IA em tempo real. Com essa atualização, empresas como a GSK estão utilizando a nova tecnologia para aprimorar seus processos de descoberta de medicamentos, enquanto a LiveKit melhora seus serviços de voz, permitindo respostas mais rápidas e precisas em interações com usuários. A Cerebras Inference se destaca, sendo 68 vezes mais rápida do que as soluções de nuvem mais otimizadas.


Os benchmarks realizados pela Artificial Analysis confirmam a superioridade do Cerebras Inference, evidenciando que ele permite tempos de resposta significativamente menores em aplicações que exigem processamento complexo. O tempo até o primeiro token é especialmente crítico, e a atualização coloca a Cerebras em uma posição vantajosa nesse aspecto.


  1. Desempenho de 2.100 tokens por segundo com Llama 3.1-70B.

  2. 16x mais rápido que a solução GPU mais otimizada.

  3. Melhoria crucial para aplicações em tempo real.

  4. Aumento na eficiência dos fluxos de trabalho em empresas.

  5. Confirmação de benchmarks de terceiros sobre desempenho.


A atualização do Cerebras Inference é uma demonstração clara do que pode ser alcançado através da otimização contínua de software e hardware. O desempenho simultâneo de inteligência e rapidez expande as possibilidades para desenvolvedores que buscam criar aplicações de IA mais complexas e responsivas.


A atualização do Cerebras Inference com seu desempenho revolucionário de 2.100 tokens por segundo destaca o potencial da tecnologia de wafer-scale para transformar a inteligência artificial. As implicações para empresas em diversos setores são vastas, permitindo a construção de aplicações inovadoras que podem melhorar a eficiência e produtividade. Para mais novidades sobre tecnologia e inteligência artificial, inscreva-se em nossa newsletter e continue acompanhando nossos conteúdos atualizados diariamente.


FONTES:

    1. Cerebras Press Release

    2. Cerebras AI

    REDATOR

    Gino AI

    25 de outubro de 2024 às 12:00:15

    PUBLICAÇÕES RELACIONADAS

    Create an image in a 2D, linear perspective that visualizes a user interacting with a large-scale language model within a digital environment. The image should be in a vector-based flat corporate design with a white, textureless background. Display charts that show comparisons between performance metrics of Length Controlled Policy Optimization (LCPO) models and traditional methods. Also, include reasoning flows to illustrate the model's decision-making process. To symbolize the real-time application of the model in business operations, include elements of a digital environment. Use cool colors to convey a sense of advanced technology and innovation.

    Nova Técnica Revoluciona Otimização de Raciocínio em Modelos de Linguagem

    Create a 2D, linear visual representation using a flat, corporate illustration style. The image showcases an artificial intelligence model symbolized as a human brain made of circuits and connections, demonstrating the concept of reasoning and efficiency. These circuits should be set against a background that is a mix of blue and green symbolizing technology and innovation, on a textureless white base. The image must also incorporate a brightly shining light, suggestive of fresh ideas and innovations in the field. The overall color scheme should consist of cool tones to convey a professional and technological feel.

    Redução de Memória em Modelos de Raciocínio: Inovações e Desafios

    Create a 2D, flat corporate-style vector image on a white, texture-less background. The image should feature elements symbolising cybersecurity, including padlocks to symbolise security, and alert icons to represent risks. There should also be a technological background that reflects the AI environment, highlighting the importance of security in artificial intelligence.

    Segurança em LLM: Riscos e Melhores Práticas para Proteger a Inteligência Artificial

    Create a 2D, linear image with a flat, corporate, vector-inspired style set against a white, untextured background. The image displays a dynamic chart that depicts the explosive growth of AI tools and the associated market implications. Rising startups are shown next to declining traditional platforms. Key elements include a growth graph that visualizes the thriving numbers of AI tools, software tool icons to symbolize innovation and technology, and upward-pointing arrows that symbolize growth and progress. The image is awash with bright, vibrant colors to convey the energy and transformation in the sector. Finally, include silhouettes of freelance workers of varying descents--Hispanic, Caucasian, Middle Eastern, South Asian, and Black--to illustrate the impact on the job market.

    Startup de IA registra crescimento de 8.658%, enquanto OpenAI avançou apenas 9%

    Fique por dentro das últimas novidades em IA

    Obtenha diariamente um resumo com as últimas notícias, avanços e pesquisas relacionadas a inteligência artificial e tecnologia.

    Obrigado pelo envio!

    logo genai

    GenAi Br © 2024

    • LinkedIn
    bottom of page