top of page

Gino News

quarta-feira, 4 de outubro de 2023

Perplexity Lança pplx-api: Acesso Rápido a Modelos LLM de Código Aberto

Tecnologia Inteligência Artificial Desenvolvimento de Software

A Perplexity anunciou o lançamento do pplx-api, uma API projetada para facilitar o acesso rápido a modelos de linguagem de grande escala (LLMs) de código aberto, como Mistral 7B, Llama2 13B, Code Llama 34B e outros. A API oferece uma integração simples, inferência rápida e infraestrutura confiável para desenvolvedores, estando disponível em beta público para assinantes do Perplexity Pro.

Create a 2D, flat-style, corporate vector illustration on a white, textureless background. The image should depict an API interface symbolizing the user-friendliness of the pplx-api. Several large language model (LLM) icons represent specific open-source models such as Mistral 7B, Llama2 13B, and Code Llama 34B. These models are connected to the API, illustrating easy integration. Include performance charts to indicate the inference speed and use speed symbols to represent the low latency of the API. Also, depict servers and infrastructure to reflect the robustness and scalability of the API.

Imagem gerada utilizando Dall-E 3

O pplx-api foi desenvolvido para ser uma das formas mais rápidas de acessar modelos LLM de código aberto, permitindo que desenvolvedores integrem esses modelos em seus projetos com facilidade. A API utiliza uma interface REST familiar, possibilitando que os usuários comecem a utilizá-la em minutos. A infraestrutura de inferência do pplx-api é altamente eficiente, alcançando latências significativamente menores em comparação com outras soluções como Replicate e Anyscale.


  1. Facilidade de uso com uma API REST familiar.

  2. Inferência extremamente rápida, com até 2,9x menos latência que Replicate.

  3. Infraestrutura testada e confiável, já em uso em produtos da Perplexity.

  4. Disponibilidade de modelos de código aberto logo após seus lançamentos.


A API pplx-api já está sendo utilizada em produtos da Perplexity, resultando em uma redução de custos significativa e mantendo a qualidade do serviço. Em testes internos, a API conseguiu processar um grande volume de requisições diárias sem degradação perceptível na qualidade. Além disso, a Perplexity está comprometida em adicionar novos modelos de código aberto à medida que são lançados, garantindo que os desenvolvedores tenham acesso às tecnologias mais recentes.


- Redução de custos de $0,62M/ano ao substituir APIs externas. - Capacidade de sustentar mais de um milhão de requisições diárias. - Integração rápida de novos modelos como Mistral 7B e Llama 2.


O pplx-api também é utilizado no Perplexity Labs, um playground de modelos que serve diversos modelos de código aberto. A API está disponível gratuitamente em beta público para assinantes do Perplexity Pro, e a empresa planeja introduzir uma estrutura de preços dedicada após a fase beta. Futuras atualizações incluirão suporte para LLMs personalizados, embeddings e uma API RAG-LLM com fundamentação para fatos e citações.


O lançamento do pplx-api marca um avanço significativo na acessibilidade e desempenho de modelos de linguagem de grande escala de código aberto. Com uma infraestrutura robusta e suporte contínuo para novos modelos, a Perplexity está posicionada para facilitar a inovação em diversos projetos de desenvolvedores. A empresa continua comprometida em aprimorar a API e expandir suas funcionalidades, prometendo um futuro promissor para a integração de LLMs em aplicações comerciais e de pesquisa.


FONTES:
  1. Perplexity

  2. Perplexity Answer Engine

  3. Perplexity Labs

  4. NVIDIA TensorRT-LLM

  5. AWS p4d Instances

  6. Mistral 7B

  7. Llama 13B

  8. Code Llama 34B

  9. Llama 70B

  10. [API Documentation](https://pplx.readme.io/docs)

  11. [Quickstart Guide](https://pplx.readme.io/reference/post_chat_completions)

  12. [API Privacy Policy](https://www.perplexity.ai../legal/perplexity-ai-api-privacy)

REDATOR

Gino AI

27 de setembro de 2024 às 20:18:26

PUBLICAÇÕES RELACIONADAS

Create an image in a 2D, linear perspective that visualizes a user interacting with a large-scale language model within a digital environment. The image should be in a vector-based flat corporate design with a white, textureless background. Display charts that show comparisons between performance metrics of Length Controlled Policy Optimization (LCPO) models and traditional methods. Also, include reasoning flows to illustrate the model's decision-making process. To symbolize the real-time application of the model in business operations, include elements of a digital environment. Use cool colors to convey a sense of advanced technology and innovation.

Nova Técnica Revoluciona Otimização de Raciocínio em Modelos de Linguagem

Create a vector-style, corporate-like 2D linear image set on a plain white, untextured background. The main focus is a chatbot, symbolizing the new version of Gemini 2.0 Flash Thinking, which is interacting with various Google applications iconized in brilliant, vibrant colors to convey the notion of integration, personalization, and innovation. This interaction suggests the advanced memory and integration capabilities that allow this chatbot to provide more customized, contextual responses to the users.

Google Apresenta Gemini 2.0: Mais Inteligência e Conexão nas Respostas do Chatbot

Create a 2D, flat corporate-style vector image on a white, texture-less background. The image should feature elements symbolising cybersecurity, including padlocks to symbolise security, and alert icons to represent risks. There should also be a technological background that reflects the AI environment, highlighting the importance of security in artificial intelligence.

Segurança em LLM: Riscos e Melhores Práticas para Proteger a Inteligência Artificial

Imagine a flat, 2D, corporate-style image against a white and textureless background. The scene sets in a metaverse where users are interacting through their 3D avatars, signifying a novel way of socializing. They are standing on the bright, colorful, personalized 3D planets that highlight the innovative feature of self-made planets. Behind them are dynamic maps showing real-time interaction. The entire image is vectored and employs bright colors to symbolize innovation and creativity.

Peer Global Inc levanta $10,5 milhões e lança planetas pessoais no metaverso

Fique por dentro das últimas novidades em IA

Obtenha diariamente um resumo com as últimas notícias, avanços e pesquisas relacionadas a inteligência artificial e tecnologia.

Obrigado pelo envio!

logo genai

GenAi Br © 2024

  • LinkedIn
bottom of page