top of page

Gino News

domingo, 3 de novembro de 2024

OpenAI Expande Realtime API com Novas Vozes e Redução de Custos para Desenvolvedores

Inteligência Artificial Tecnologia Desenvolvimento de Software

OpenAI anunciou a atualização de sua Realtime API, atualmente em beta, introduzindo novos recursos de voz e reduzindo os custos para desenvolvedores, em um evento realizado no dia 30 de outubro de 2024.

Imagem gerada utilizando Dall-E 3

A OpenAI lançou novos recursos na Realtime API, permitindo que os desenvolvedores integrem cinco novas vozes em aplicações de fala-para-fala. A atualização, que ainda está na fase beta, visa melhorar a expressividade e a capacidade de controle das vozes, além de diminuir os custos associados à geração de áudio.


A OpenAI revelou que a nova capacidade de fala-para-fala evita a necessidade de um formato de texto intermediário, resultando em baixa latência e saídas mais sutis. Apesar das melhorias, a empresa alertou que a autenticação em client-side não está disponível no momento e que a qualidade do áudio em tempo real pode ser afetada por condições de rede instáveis.


Com a introdução de uma estrutura de preços mais competitiva, a OpenAI planeja reduzir os custos com o cache de prompts. Os preços para entradas de áudio cairão em até 80%, o que pode incentivar mais desenvolvedores a se conectarem à API.


  1. Cinco novas vozes disponíveis: Ash, Verse, Ballad, entre outras.

  2. Aumento da expressividade e controle das vozes.

  3. Redução de custos com prompt caching em até 80%.

  4. Desafios com a qualidade do áudio em tempo real.

  5. Comparação com plataformas concorrentes como ElevenLabs.


A redução de custos e a introdução de novas funcionalidades na Realtime API visam melhorar a experiência do usuário e expandir a base de desenvolvedores, permitindo a criação de assistentes de voz mais responsivos e interativos.


- Melhorias significativas na geração de voz. - Aumento do engajamento de desenvolvedores. - Enfrentamento de desafios técnicos ainda existentes. - Impacto na concorrência no setor de voz AI.


Essas alterações podem transformar o modo como as empresas utilizam a inteligência artificial em suas interações com os clientes. Com a diminuição dos custos, a acessibilidade aos recursos da OpenAI tende a aumentar, oferecendo novas oportunidades para inovação em serviços.


Com a expansão da Realtime API, a OpenAI não apenas fornece novas opções para desenvolvedores de voz, mas também redefine a competitividade no setor. Para mais atualizações sobre inovações tecnológicas e suas implicações, inscreva-se em nossa newsletter e fique por dentro das novidades diárias.


FONTES:

    1. OpenAI

    2. VentureBeat

    3. API Documentation

    4. ElevenLabs

    5. Anthropic

    REDATOR

    Gino AI

    3 de novembro de 2024 às 13:38:13

    PUBLICAÇÕES RELACIONADAS

    Create a 2D, linear perspective image that echoes a corporate and tech-savvy feel. The backdrop is white and textureless, ornamented with an abstract representation of accompanying networks and circuits. Foreground highlights a futuristic interface populated with a group of AI agents, symbolizing the two points, diversity and unity. Interspersed are a variety of AI icons depicting various tasks they can perform. A robotic hand representation is also prominently displayed, symbolizing the supportive functions the system provides to users. Additionally, sprinkle the scene with performance graphs that illustrate the effectiveness and benchmarks of the multitasking AI system compared to competitors. Capture elements of Flat and Vector design styles in the composition.

    Manus: O Novo Sistema de IA que Promete Revolucionar Tarefas Autônomas

    Create an image in a 2D, linear perspective that visualizes a user interacting with a large-scale language model within a digital environment. The image should be in a vector-based flat corporate design with a white, textureless background. Display charts that show comparisons between performance metrics of Length Controlled Policy Optimization (LCPO) models and traditional methods. Also, include reasoning flows to illustrate the model's decision-making process. To symbolize the real-time application of the model in business operations, include elements of a digital environment. Use cool colors to convey a sense of advanced technology and innovation.

    Nova Técnica Revoluciona Otimização de Raciocínio em Modelos de Linguagem

    Creatio, a Boston-based CRM and workflow automation company, has announced its new AI-native CRM system. Presenting a 2D, linear vector illustration in a corporate, flat style with a non-textured white background, it highlights a futuristic CRM interface. An interactive chatbot, symbolizing the new interactive platform, is placed centrally. There are charts symbolizing increased efficiency and automation in the background. Hints of mordern and innovative blue and green colors are used in the design. Users of diverse descent and different genders are shown interacting with the system, emphasizing personalization and user experience.

    Creatio Revoluciona o CRM com Plataforma Nativa de IA

    Illustrate a 2D, linear perspective image in a corporate, flat and vector style. The image has a textureless, white background. In the foreground, focus on a central figure who symbolizes a leadership role in AI, but not specifically Stephen Peacock. He is explaining the application of AI in game development. Include a visual context of the game development environment and a logo symbolizing an international game development provider, but not specifically the Keywords Studios logo.

    Keywords Studios Lança Soluções de IA para Desenvolvimento de Jogos

    Fique por dentro das últimas novidades em IA

    Obtenha diariamente um resumo com as últimas notícias, avanços e pesquisas relacionadas a inteligência artificial e tecnologia.

    Obrigado pelo envio!

    logo genai

    GenAi Br © 2024

    • LinkedIn
    bottom of page