top of page

Gino News

quarta-feira, 14 de agosto de 2024

Anthropic Lança Prompt Caching para Claude, Reduzindo Custos e Latência

Tecnologia Inteligência Artificial Desenvolvimento de Software

A Anthropic anunciou a disponibilidade do prompt caching em sua API, permitindo que desenvolvedores armazenem contextos frequentemente usados entre chamadas de API. A novidade promete reduzir custos em até 90% e latência em até 85% para prompts longos, estando disponível em beta público para Claude 3.5 Sonnet, Claude 3 Opus e Claude 3 Haiku.

An illustration in a corporate, flat, vectorial style showing a 2D linear perspective of a white, untextured background. In the foreground, there's a developer of unspecified gender and descent, engaged with their computer. They are surrounded by symbols denoting cost efficiency and time-saving aspects - perhaps an hourglass and a piggy bank. The Anthropic company's logo, a graphic indicating positive performance improvements, and an AI programming interface (without specific brand references) implying the practical application of the prompt caching technology, unfurl behind the developer.

Imagem gerada utilizando Dall-E 3

O prompt caching é uma funcionalidade que permite aos desenvolvedores armazenar contextos frequentemente utilizados, proporcionando a Claude mais conhecimento de fundo e exemplos de saída, enquanto reduz significativamente os custos e a latência. Esta tecnologia é especialmente útil para agentes conversacionais, assistentes de codificação, processamento de documentos grandes e conjuntos detalhados de instruções.


  1. Agentes conversacionais: Reduzem custos e latência em conversas longas.

  2. Assistentes de codificação: Melhoram a autocompletação e Q&A de código.

  3. Processamento de documentos grandes: Incorporam material de forma completa sem aumentar a latência.

  4. Conjuntos detalhados de instruções: Permitem incluir dezenas de exemplos de alta qualidade.

  5. Busca agentiva e uso de ferramentas: Melhoram o desempenho em cenários com múltiplas chamadas de ferramentas.


Os prompts armazenados são precificados com base no número de tokens de entrada cacheados e na frequência de uso desse conteúdo. Escrever no cache custa 25% a mais que o preço base do token de entrada, enquanto usar o conteúdo cacheado é significativamente mais barato, custando apenas 10% do preço base do token de entrada.


A Notion, uma das primeiras empresas a adotar o prompt caching, está utilizando a tecnologia para otimizar as funcionalidades do Notion AI, melhorando a experiência do usuário com custos reduzidos e maior velocidade.


Com a introdução do prompt caching, a Anthropic oferece uma solução eficaz para desenvolvedores que buscam reduzir custos e melhorar a performance de seus aplicativos. A adoção inicial por empresas como a Notion destaca o potencial da tecnologia para transformar a interação com assistentes de IA e outras aplicações complexas.


FONTES:
  1. Anthropic

  2. Notion

  3. Documentação da Anthropic

  4. Página de preços da Anthropic

REDATOR

Gino AI

27 de setembro de 2024 às 20:07:26

PUBLICAÇÕES RELACIONADAS

Create a 2D, vector-style artwork set in a clinical setting. On a white, textureless background, illustrate the scene with a flat and corporate aesthetic. A healthcare professional is preparing to administer an injection of lenacapavir to a diverse group of patients. The syringe is a visual symbol of the innovative treatment. The patients, representing a broad range of genders and descents such as Middle-Eastern female, Hispanic male, and South Asian transgender person, convey hope and are the beneficiaries of this advancement. The environment, symbolizing the seriousness of the treatment, is a doctor's office furnished with charts and graphs indicating the reduction in HIV infections due to the new treatment. Use a colour palette consisting of shades of blue and green to transmit trust and hope.

Lenacapavir: Injeção Anual Promissora para Prevenção do HIV

Create an image in a 2D, linear perspective that visualizes a user interacting with a large-scale language model within a digital environment. The image should be in a vector-based flat corporate design with a white, textureless background. Display charts that show comparisons between performance metrics of Length Controlled Policy Optimization (LCPO) models and traditional methods. Also, include reasoning flows to illustrate the model's decision-making process. To symbolize the real-time application of the model in business operations, include elements of a digital environment. Use cool colors to convey a sense of advanced technology and innovation.

Nova Técnica Revoluciona Otimização de Raciocínio em Modelos de Linguagem

Imagine a 2D, vector-style, corporate-themed image representing the interoperability initiative among artificial intelligence agents. The scene features a white, textureless background to focus on the primary elements. Portray icons associated with unidentifiable companies to symbolize the participants in the initiative. Each of the icons should be distinct and connected with visual cables, representing the communication and cooperation amongst these AI agents. Lastly, implement a subtly digital environment suggesting the technological space where these entities function.

AGNTCY: A Nova Iniciativa para Interoperabilidade entre Agentes de IA

Creatio, a Boston-based CRM and workflow automation company, has announced its new AI-native CRM system. Presenting a 2D, linear vector illustration in a corporate, flat style with a non-textured white background, it highlights a futuristic CRM interface. An interactive chatbot, symbolizing the new interactive platform, is placed centrally. There are charts symbolizing increased efficiency and automation in the background. Hints of mordern and innovative blue and green colors are used in the design. Users of diverse descent and different genders are shown interacting with the system, emphasizing personalization and user experience.

Creatio Revoluciona o CRM com Plataforma Nativa de IA

Fique por dentro das últimas novidades em IA

Obtenha diariamente um resumo com as últimas notícias, avanços e pesquisas relacionadas a inteligência artificial e tecnologia.

Obrigado pelo envio!

logo genai

GenAi Br © 2024

  • LinkedIn
bottom of page