top of page

Gino News

quinta-feira, 7 de novembro de 2024

Nova Estratégia de Geração de Texto Dinâmica da Intel e Hugging Face Aumenta a Velocidade em até 2.7x

Tecnologia Inteligência Artificial Processamento de Linguagem Natural

A Intel Labs e a Hugging Face anunciaram o Dynamic Speculation Decoding, uma nova técnica que pode acelerar a geração de texto em até 2.7 vezes dependendo da tarefa, a partir da versão 4.45.0 da biblioteca Transformers.

Create a 2D, flat and corporate styled illustration on a white, textureless background. The illustration should demonstrate the Dynamic Speculation Decoding technique and its interaction between the Draft and Target models in text generation. Include elements of floating text to symbolize text generation, dynamic arrows to indicate the interactivity between models, and vibrant color schemes to draw attention to the main points. Also incorporate a representation of language models to illustrate the complexity of the task.

Imagem gerada utilizando Dall-E 3

O Dynamic Speculation Decoding é uma melhoria implementada na biblioteca Transformers, que utiliza uma técnica chamada Speculative Decoding para acelerar o processo de inferência em modelos de linguagem. Este método se divide em duas etapas: uma primeira geração rápida de tokens por um modelo menor (Draft) e, em seguida, a validação desses tokens por um modelo maior (Target), que opera em paralelo.


O avanço principal do Dynamic Speculation Decoding está na otimização da quantidade de tokens gerados pelo modelo Draft em cada iteração. A nova estratégia utiliza um preditor que ajusta dinamicamente o número de tokens com base na taxa de aceitação, melhorando assim a eficiência e reduzindo a latência.


Testes de benchmark demonstraram que o Dynamic Speculation superou a estratégia heurística em todas as tarefas e combinações de modelos. Um exemplo notável envolveu uma aceleração de até 1.52 vezes ao aplicar a nova técnica com o modelo Llama3.2-1B em comparação ao Llama3.1-8B.


  1. Estratégia dinâmica melhora a eficiência na geração de texto.

  2. Aumento de velocidade de até 2.7x em tarefas específicas.

  3. Applicações em vários modelos disponíveis na Hugging Face.

  4. Integração na versão 4.45.0 da biblioteca Transformers.

  5. Previsões de impactos futuros em aceleração de modelos.


Além da melhoria nas taxas de aceleração, a pesquisa e testes demostraram que o preditor de Speculative Lookahead se adaptou melhor a diferentes cenários de tarefas, mostrando uma variabilidade nos resultados que indicam a necessidade de ajustes dinâmicos ao invés de valores fixos.


- Aceleração significante nos modelos de linguagem. - Flexibilidade na combinação de modelos para aceleração. - Integração facilitada para desenvolvedores e usuários. - Impulsionamento das capacidades de geração de texto.


Com a implementação do Dynamic Speculation, o futuro da geração de texto se mostra promissor, com potencial para integrar uma gama ainda maior de modelos no Hugging Face Hub, permitindo um avanço significativo na eficiência de processos textuais complexos.


A implementação do Dynamic Speculation Decoding na biblioteca Transformers representa um grande avanço na geração de texto assistida. As melhorias de velocidade e eficiência prometem transformar o desenvolvimento de modelos lingüísticos. Os interessados em explorar as novidades e avanços na área devem acompanhar as atualizações da Hugging Face, incluindo nossa newsletter diária que traz conteúdos atualizados sobre novas tecnologias e tendências.


FONTES:

    1. Dynamic Speculation Lookahead Accelerates Speculative Decoding of Large Language Models

    2. Assisted Generation: a new direction toward low-latency text generation

    3. Fast Inference from Transformers via Speculative Decoding

    REDATOR

    Gino AI

    7 de novembro de 2024 às 09:42:24

    PUBLICAÇÕES RELACIONADAS

    Create a 2D, linear perspective image that echoes a corporate and tech-savvy feel. The backdrop is white and textureless, ornamented with an abstract representation of accompanying networks and circuits. Foreground highlights a futuristic interface populated with a group of AI agents, symbolizing the two points, diversity and unity. Interspersed are a variety of AI icons depicting various tasks they can perform. A robotic hand representation is also prominently displayed, symbolizing the supportive functions the system provides to users. Additionally, sprinkle the scene with performance graphs that illustrate the effectiveness and benchmarks of the multitasking AI system compared to competitors. Capture elements of Flat and Vector design styles in the composition.

    Manus: O Novo Sistema de IA que Promete Revolucionar Tarefas Autônomas

    Create a 2D, vector-style artwork set in a clinical setting. On a white, textureless background, illustrate the scene with a flat and corporate aesthetic. A healthcare professional is preparing to administer an injection of lenacapavir to a diverse group of patients. The syringe is a visual symbol of the innovative treatment. The patients, representing a broad range of genders and descents such as Middle-Eastern female, Hispanic male, and South Asian transgender person, convey hope and are the beneficiaries of this advancement. The environment, symbolizing the seriousness of the treatment, is a doctor's office furnished with charts and graphs indicating the reduction in HIV infections due to the new treatment. Use a colour palette consisting of shades of blue and green to transmit trust and hope.

    Lenacapavir: Injeção Anual Promissora para Prevenção do HIV

    Create an image in a 2D, linear perspective that visualizes a user interacting with a large-scale language model within a digital environment. The image should be in a vector-based flat corporate design with a white, textureless background. Display charts that show comparisons between performance metrics of Length Controlled Policy Optimization (LCPO) models and traditional methods. Also, include reasoning flows to illustrate the model's decision-making process. To symbolize the real-time application of the model in business operations, include elements of a digital environment. Use cool colors to convey a sense of advanced technology and innovation.

    Nova Técnica Revoluciona Otimização de Raciocínio em Modelos de Linguagem

    Illustrate a 2D, linear perspective image in a corporate, flat and vector style. The image has a textureless, white background. In the foreground, focus on a central figure who symbolizes a leadership role in AI, but not specifically Stephen Peacock. He is explaining the application of AI in game development. Include a visual context of the game development environment and a logo symbolizing an international game development provider, but not specifically the Keywords Studios logo.

    Keywords Studios Lança Soluções de IA para Desenvolvimento de Jogos

    Fique por dentro das últimas novidades em IA

    Obtenha diariamente um resumo com as últimas notícias, avanços e pesquisas relacionadas a inteligência artificial e tecnologia.

    Obrigado pelo envio!

    logo genai

    GenAi Br © 2024

    • LinkedIn
    bottom of page