top of page

Gino News

terça-feira, 28 de janeiro de 2025

Revolução em Voice AI: Together Audio API e Cartesia Sonic Transformam o Desenvolvimento de Aplicativos

Tecnologia Inteligência Artificial Inovação

A Together AI anunciou o lançamento da Together Audio API, alimentada pelo modelo de voz Cartesia Sonic, que promete oferecer capacidades de voz ultra-realistas e de baixa latência para desenvolvedores. O anúncio, feito em 23 de janeiro de 2025, destaca a parceria com a Cartesia para integrar essa tecnologia em uma plataforma unificada, permitindo a criação de aplicações multimodais.

Create a vector-style, corporate flat illustration in a 2D linear perspective. The scene is set in a white, textureless background. It showcases a group of developers working in a tech-savvy environment, all engrossed in their work. The group is characterized by diversity, showcasing representation from different descents including Caucasian, Black, Hispanic, Middle-Eastern and South Asian developers. In the scene, both male and female developers are working with equal focus and dedication. There should be the significant presence of voice interfaces in the illustration, as symbols of applications focusing on voice technology. Additionally, growth charts are also subtly integrated into the background, symbolizing the potential market growth.

Imagem gerada utilizando Dall-E 3

A Together AI, em colaboração com a Cartesia, lançou a Together Audio API, que traz para os desenvolvedores um modelo de voz de última geração, o Cartesia Sonic. Este modelo se destaca por sua baixa latência e realismo sonoro, além de suportar múltiplas línguas, o que amplia o leque de aplicações possíveis. A integração do Sonic na plataforma da Together permite a construção de soluções que vão além de apenas voz, englobando chat, imagem, áudio, código e embeddings, tudo em uma única interface.


Com o novo recurso, os desenvolvedores podem criar aplicações de voz que operam em sinergia com outros modelos de IA, como STT (Speech-to-Text), LLM (Large Language Model) e TTS (Text-to-Speech). Essa capacidade de orquestração resulta em experiências mais naturais para usuários, como exemplificado na reprogramação de voos de maneira automatizada e eficiente. Além disso, a Cartesia Sonic registra um desempenho superior em testes de preferência auditiva, oferecendo vozes com qualidade impressionante.


  1. Novo modelo de voz Sonic com ultra baixa latência de 90ms.

  2. Suporte para múltiplas línguas e vozes.

  3. Compliance com HIPAA e SOC2 para aplicações empresariais.

  4. Exemplos de aplicações incluem suporte ao cliente, criação de conteúdo e assistentes digitais.

  5. Acesso direto ao modelo Sonic através da Together API.


As capacidades do Cartesia Sonic não se limitam apenas à performance técnica. Os desenvolvedores agora podem implementar assistentes AI personalizados, com vozes e personalidades consistentes, utilizando recursos de voz que integram-se perfeitamente com outros modelos. Com a previsão de que 85% das empresas adotem sistemas de voz AI nos próximos cinco anos, o potencial de mercado é vasto e promissor.


- Impulsiona a inovação no desenvolvimento de aplicativos de voz. - Aprimora a experiência do cliente em diversas indústrias. - Facilita o acesso a tecnologia de ponta para desenvolvedores. - Oferece oportunidades de integração com diferentes modelos de AI.


O lançamento da Together Audio API com o Cartesia Sonic representa um passo significativo na evolução da tecnologia de voz. Ao permitir que desenvolvedores construam aplicações complexas e multimodais de maneira mais acessível e eficiente, o impacto será sentido em setores variados, desde saúde até serviços ao consumidor.


Com a introdução da Together Audio API, os desenvolvedores têm à disposição uma ferramenta poderosa que pode transformar a maneira como interagimos com a tecnologia. Para mais informações, inscreva-se na nossa newsletter e mantenha-se atualizado sobre inovações que moldam o futuro da inteligência artificial.


FONTES:

    1. Cartesia

    2. Together AI

    3. Daily's Pipecat

    4. Together Cookbook

    5. Master of Code

    REDATOR

    Gino AI

    28 de janeiro de 2025 às 12:34:51

    PUBLICAÇÕES RELACIONADAS

    Create a 2D, linear perspective image that echoes a corporate and tech-savvy feel. The backdrop is white and textureless, ornamented with an abstract representation of accompanying networks and circuits. Foreground highlights a futuristic interface populated with a group of AI agents, symbolizing the two points, diversity and unity. Interspersed are a variety of AI icons depicting various tasks they can perform. A robotic hand representation is also prominently displayed, symbolizing the supportive functions the system provides to users. Additionally, sprinkle the scene with performance graphs that illustrate the effectiveness and benchmarks of the multitasking AI system compared to competitors. Capture elements of Flat and Vector design styles in the composition.

    Manus: O Novo Sistema de IA que Promete Revolucionar Tarefas Autônomas

    Create a 2D, linear and corporate-style vector image symbolizing a significant milestone in artificial intelligence technology. This image shows the Gemini 2.0 Flash, a model that integrates native image generation and text-based editing. The interface of Gemini 2.0 Flash is shown in use, placed against a plain, white, and texture-less background. In the image, you can see it generating images from text commands within a digital workspace. Additional elements in the image include symbols of artificial intelligence, like brain and circuit icons. Use vibrant colors to convey innovation and technology, and apply a futuristic style that aligns with the vision of advanced technology.

    Google Lança Gemini 2.0 Flash: Revolução na Geração de Imagens com IA

    Creatio, a Boston-based CRM and workflow automation company, has announced its new AI-native CRM system. Presenting a 2D, linear vector illustration in a corporate, flat style with a non-textured white background, it highlights a futuristic CRM interface. An interactive chatbot, symbolizing the new interactive platform, is placed centrally. There are charts symbolizing increased efficiency and automation in the background. Hints of mordern and innovative blue and green colors are used in the design. Users of diverse descent and different genders are shown interacting with the system, emphasizing personalization and user experience.

    Creatio Revoluciona o CRM com Plataforma Nativa de IA

    Create a flat, corporate-style, vector image. The setting is Mar 9, 2025, and it captures the concept of AI agents integrating with the business environment, symbolizing the transition from an app-based world to a more dynamic and fluid environment. The background of the image is textureless and white. The perspective is 2D and linear. Additional elements include sober colors like blue and gray to convey a sense of technology and modernity, silhouettes of robots and humans interacting to represent collaboration between AI and users, and floating graphics and data symbolizing the fluidity of real-time information.

    A Revolução do Software: Como a IA Está Transformando o Mercado

    Fique por dentro das últimas novidades em IA

    Obtenha diariamente um resumo com as últimas notícias, avanços e pesquisas relacionadas a inteligência artificial e tecnologia.

    Obrigado pelo envio!

    logo genai

    GenAi Br © 2024

    • LinkedIn
    bottom of page