top of page

Gino News

quarta-feira, 26 de fevereiro de 2025

Hume Lança Octave: O Novo Modelo de Texto-Para-Fala com Emoções Ajustáveis

Tecnologia Inteligência Artificial Inovação

A startup nova-iorquina Hume AI lançou seu novo modelo de texto-para-fala, chamado Octave, que gera vozes de IA personalizadas e emotivas, prometendo revolucionar a criação de conteúdos multimídia.

Create a detailed, 2D, flat, linear illustration inspired by corporate vector art. The setting, a creative workspace with a minimalist white, untextured background. Foreground depicts a content creator, an Asian woman, using the Octave interface, an AI tool that generates personalized, emotive AI voices. This interface should be distinct, with visual motifs showing its text-to-speech function. To symbolize this interface, include a computer with the Octave model on the screen. Additional elements in the workspace, including a high-quality microphone, representing top-tier audio recording, a notebook for content creation/editing, and headphones. Strategically place speech icons to reinforce the text-to-speech theme.

Imagem gerada utilizando Dall-E 3

Hume AI, uma startup emergente em Nova York, apresentou recentemente o Octave, um motor de texto e voz que utiliza um grande modelo de linguagem (LLM) para gerar discursos emocionalmente expressivos. O modelo, que é o primeiro de seu tipo com a capacidade de compreender contextos de palavras e ajustar o tom e a cadência em níveis de frase, promete oferecer vozes mais humanas para audiobooks, diálogos de jogos e produções audiovisuais.


O CEO da Hume AI, Alan Cowen, destacou que o Octave é um avanço significativo na tecnologia de voz, permitindo que usuários ajustem as emoções e inflexões das vozes geradas através de comandos de texto. Por exemplo, o modelo pode replicar a voz de um personagem sarcástico ou transmitir urgência em um diálogo, tudo isso sem necessidade de instruções explícitas.


Além de gerar vozes de alta qualidade, Octave também foi projetado para ser utilizado em uma variedade de aplicações criativas, como podcasts e biografias em áudio. A ferramenta pode ser acessada via API, e cada assinatura oferece diferentes níveis de uso e capacidades.


  1. Capacidades de voz emocional ajustáveis.

  2. Apoio a múltiplos idiomas, começando pelo inglês e espanhol.

  3. Funcionalidade ideal para criadores de conteúdo.

  4. Modelo com preços competitivos em relação a outros do mercado.

  5. Resultados de estudos comparativos favoráveis.


A pesquisa realizada pela Hume AI mostrou que o Octave foi preferido em qualidade de áudio e naturalidade em comparação com um concorrente direto. O modelo é capaz de entender contextos mais amplos, resultando em uma reprodução de voz mais fiel e expressiva.


- Interesse crescente em IA para criação de conteúdo. - Desenvolvimento de novas tecnologias para interações mais naturais. - Potencial impacto na indústria de audiobooks e entretenimento. - Ampliação do uso de vozes de IA em diferentes mídias.


Com suas inovações, Hume AI espera não só oferecer uma ferramenta valiosa para os criadores de conteúdo, mas também expandir as possibilidades da tecnologia de voz, tornando-a mais acessível e personalizada para uma ampla gama de aplicações.


O lançamento do Octave representa um passo significativo na evolução das tecnologias de voz, trazendo um novo nível de personalização e expressão emocional. Para os criadores de conteúdo, isso pode transformar a forma como produzem e consomem materiais multimídia. Os leitores são incentivados a se inscrever em nossa newsletter para atualizações diárias sobre inovações em inteligência artificial e muito mais.


FONTES:

    1. VentureBeat

    2. Finsmes

    3. VentureBeat

    4. VentureBeat

    5. VentureBeat

    REDATOR

    Gino AI

    26 de fevereiro de 2025 às 21:24:39

    PUBLICAÇÕES RELACIONADAS

    Create a 2D, linear perspective image that echoes a corporate and tech-savvy feel. The backdrop is white and textureless, ornamented with an abstract representation of accompanying networks and circuits. Foreground highlights a futuristic interface populated with a group of AI agents, symbolizing the two points, diversity and unity. Interspersed are a variety of AI icons depicting various tasks they can perform. A robotic hand representation is also prominently displayed, symbolizing the supportive functions the system provides to users. Additionally, sprinkle the scene with performance graphs that illustrate the effectiveness and benchmarks of the multitasking AI system compared to competitors. Capture elements of Flat and Vector design styles in the composition.

    Manus: O Novo Sistema de IA que Promete Revolucionar Tarefas Autônomas

    Create a 2D, linear and corporate-style vector image symbolizing a significant milestone in artificial intelligence technology. This image shows the Gemini 2.0 Flash, a model that integrates native image generation and text-based editing. The interface of Gemini 2.0 Flash is shown in use, placed against a plain, white, and texture-less background. In the image, you can see it generating images from text commands within a digital workspace. Additional elements in the image include symbols of artificial intelligence, like brain and circuit icons. Use vibrant colors to convey innovation and technology, and apply a futuristic style that aligns with the vision of advanced technology.

    Google Lança Gemini 2.0 Flash: Revolução na Geração de Imagens com IA

    Create an image in a 2D, linear perspective that visualizes a user interacting with a large-scale language model within a digital environment. The image should be in a vector-based flat corporate design with a white, textureless background. Display charts that show comparisons between performance metrics of Length Controlled Policy Optimization (LCPO) models and traditional methods. Also, include reasoning flows to illustrate the model's decision-making process. To symbolize the real-time application of the model in business operations, include elements of a digital environment. Use cool colors to convey a sense of advanced technology and innovation.

    Nova Técnica Revoluciona Otimização de Raciocínio em Modelos de Linguagem

    Creatio, a Boston-based CRM and workflow automation company, has announced its new AI-native CRM system. Presenting a 2D, linear vector illustration in a corporate, flat style with a non-textured white background, it highlights a futuristic CRM interface. An interactive chatbot, symbolizing the new interactive platform, is placed centrally. There are charts symbolizing increased efficiency and automation in the background. Hints of mordern and innovative blue and green colors are used in the design. Users of diverse descent and different genders are shown interacting with the system, emphasizing personalization and user experience.

    Creatio Revoluciona o CRM com Plataforma Nativa de IA

    Fique por dentro das últimas novidades em IA

    Obtenha diariamente um resumo com as últimas notícias, avanços e pesquisas relacionadas a inteligência artificial e tecnologia.

    Obrigado pelo envio!

    logo genai

    GenAi Br © 2024

    • LinkedIn
    bottom of page