top of page

Gino News

segunda-feira, 5 de junho de 2023

Stable Audio Open: Modelo Open Source para Criação de Áudio

Tecnologia Inovação Música

A Stability AI lançou o Stable Audio Open, um modelo de código aberto para a geração de amostras de áudio e efeitos sonoros de até 47 segundos a partir de prompts de texto. Este avanço visa capacitar designers de som, músicos e comunidades criativas ao permitir a criação de batidas de bateria, riffs de instrumentos e sons ambientes.

Create a flat, corporate style 2D vector image in a linear perspective. The image should have a white, textureless background. The main focus is a computer, emanating musical notes and sound waves from its screen, signifying the creation of audio. The words 'Stable Audio Open' should prominently feature in the image, signifying the name of the model. The predominant color palette for the image should be shades of blue and white to symbolize innovation and technology.

Imagem gerada utilizando Dall-E 3

O Stable Audio Open é um modelo de texto-para-áudio que permite a geração de até 47 segundos de dados de áudio de alta qualidade a partir de um simples prompt de texto. Ele é especialmente treinado para criar batidas de bateria, riffs de instrumentos, sons ambientes, gravações foley e outros elementos de produção de áudio. A principal vantagem deste lançamento open source é que os usuários podem ajustar o modelo com seus próprios dados de áudio personalizados.


  1. Geração de batidas de bateria

  2. Criação de riffs de instrumentos

  3. Produção de sons ambientes

  4. Gravações foley

  5. Elementos de produção de áudio


Diferente do produto comercial Stable Audio, que produz faixas completas de até três minutos com estrutura musical coerente, o Stable Audio Open é especializado em amostras de áudio e efeitos sonoros. Este modelo proporciona uma visão sobre a IA generativa para design de som, priorizando o desenvolvimento responsável ao lado das comunidades criativas.


- Modelo treinado com dados do Freesound e do Free Music Archive - Disponível para download no Hugging Face - Encoraja feedback de designers de som, músicos e desenvolvedores


O Stable Audio Open representa um passo importante para a geração de áudio aberta e responsável. A Stability AI convida a comunidade a explorar as capacidades do modelo e a contribuir com feedback para futuras melhorias.


O lançamento do Stable Audio Open abre novas possibilidades para a criação de áudio generativo, permitindo que músicos e designers de som personalizem e aprimorem suas produções. Com a continuidade da pesquisa e o desenvolvimento colaborativo, a Stability AI espera expandir ainda mais as capacidades da geração de áudio aberta.


FONTES:
  1. Stability AI

  2. Hugging Face

  3. Twitter

  4. Instagram

  5. LinkedIn

  6. Discord

REDATOR

Gino AI

27 de setembro de 2024 às 20:18:26

PUBLICAÇÕES RELACIONADAS

Create a 2D, linear perspective image that echoes a corporate and tech-savvy feel. The backdrop is white and textureless, ornamented with an abstract representation of accompanying networks and circuits. Foreground highlights a futuristic interface populated with a group of AI agents, symbolizing the two points, diversity and unity. Interspersed are a variety of AI icons depicting various tasks they can perform. A robotic hand representation is also prominently displayed, symbolizing the supportive functions the system provides to users. Additionally, sprinkle the scene with performance graphs that illustrate the effectiveness and benchmarks of the multitasking AI system compared to competitors. Capture elements of Flat and Vector design styles in the composition.

Manus: O Novo Sistema de IA que Promete Revolucionar Tarefas Autônomas

Create a 2D, linear and corporate-style vector image symbolizing a significant milestone in artificial intelligence technology. This image shows the Gemini 2.0 Flash, a model that integrates native image generation and text-based editing. The interface of Gemini 2.0 Flash is shown in use, placed against a plain, white, and texture-less background. In the image, you can see it generating images from text commands within a digital workspace. Additional elements in the image include symbols of artificial intelligence, like brain and circuit icons. Use vibrant colors to convey innovation and technology, and apply a futuristic style that aligns with the vision of advanced technology.

Google Lança Gemini 2.0 Flash: Revolução na Geração de Imagens com IA

Create an image in a 2D, linear perspective that visualizes a user interacting with a large-scale language model within a digital environment. The image should be in a vector-based flat corporate design with a white, textureless background. Display charts that show comparisons between performance metrics of Length Controlled Policy Optimization (LCPO) models and traditional methods. Also, include reasoning flows to illustrate the model's decision-making process. To symbolize the real-time application of the model in business operations, include elements of a digital environment. Use cool colors to convey a sense of advanced technology and innovation.

Nova Técnica Revoluciona Otimização de Raciocínio em Modelos de Linguagem

Creatio, a Boston-based CRM and workflow automation company, has announced its new AI-native CRM system. Presenting a 2D, linear vector illustration in a corporate, flat style with a non-textured white background, it highlights a futuristic CRM interface. An interactive chatbot, symbolizing the new interactive platform, is placed centrally. There are charts symbolizing increased efficiency and automation in the background. Hints of mordern and innovative blue and green colors are used in the design. Users of diverse descent and different genders are shown interacting with the system, emphasizing personalization and user experience.

Creatio Revoluciona o CRM com Plataforma Nativa de IA

Fique por dentro das últimas novidades em IA

Obtenha diariamente um resumo com as últimas notícias, avanços e pesquisas relacionadas a inteligência artificial e tecnologia.

Obrigado pelo envio!

logo genai

GenAi Br © 2024

  • LinkedIn
bottom of page