top of page

Gino News

quarta-feira, 12 de fevereiro de 2025

OmniHuman: A Revolução da Geração de Vídeos Realistas pela ByteDance

Tecnologia Inovação Inteligência Artificial

A ByteDance revelou o OmniHuman, um sistema de inteligência artificial que transforma uma única fotografia em vídeos realistas de pessoas, permitindo movimentos e gestos naturais. Essa inovação, apresentada no início de fevereiro de 2025, promete revolucionar a produção de mídia digital e a comunicação online.

Depict a flat, corporate-style vector illustration, seen from a 2D, linear perspective. The key feature of this white-background illustration is a transformation graph. The graph will represent the process of converting a photograph into an animated video by an Artificial Intelligence system called 'OmniHuman'. It should show elements evidencing the interaction between the static image and the dynamic video, symbolizing the AI technology in action. To further bring this concept to life, include vibrant color-coded icons of videos and images. Sprinkle the background with subtle technology-inspired motifs to reflect the domain of AI.

Imagem gerada utilizando Dall-E 3

Recentemente, a ByteDance, empresa por trás do TikTok, anunciou a criação do OmniHuman, uma inteligência artificial que gera vídeos a partir de uma única imagem. O novo sistema é capaz de criar vídeos de pessoas que falam, cantam e se movem de maneira natural, representando um avanço significativo em relação a modelos anteriores, que apenas animavam rostos ou partes superiores do corpo.


Para desenvolver o OmniHuman, a equipe da ByteDance utilizou mais de 18.700 horas de dados de vídeos humanos, aplicando uma abordagem inovadora que combina texto, áudio e movimentos corporais. Essa estratégia de treinamento, chamada de "omni-conditions", permite que o sistema aprenda de conjuntos de dados maiores e mais diversos, superando as limitações dos métodos anteriores.


Os pesquisadores da ByteDance destacaram que, ao incorporar múltiplos sinais de condicionamento durante o treinamento, como texto, áudio e pose, é possível minimizar o desperdício de dados e melhorar a qualidade da animação. O OmniHuman se destacou em diversos testes de qualidade em comparação com outros sistemas existentes.


  1. Capacidade de gerar vídeos a partir de uma única fotografia.

  2. Movimentos e gestos naturais que acompanham a fala.

  3. Treinamento utilizando mais de 18.700 horas de dados.

  4. Superação das limitações de modelos anteriores.

  5. Competição acirrada com outras empresas como Google, Meta e Microsoft.

  6. Potencial de transformação na produção de entretenimento e comunicação digital.


O desenvolvimento do OmniHuman acontece em um cenário de crescente rivalidade na geração de vídeos por inteligência artificial, com grandes empresas investindo em tecnologias similares. Especialistas acreditam que essa inovação poderá alterar profundamente não apenas a produção de conteúdo, mas também seus usos em contextos educacionais e comunicacionais. Contudo, a possibilidade de uso indevido de mídias sintéticas levanta preocupações éticas que devem ser consideradas.


- Inovações na geração de mídia digital. - Risco de manipulação e uso indevido. - Impacto no entretenimento e na educação. - Desafios éticos associados a tecnologias emergentes.


As implicações do OmniHuman são vastas, uma vez que sua capacidade de criar vídeos realistas a partir de fotos pode ser utilizada em diversas áreas, desde a produção de filmes até o ensino à distância, mas também exige uma discussão cuidadosa sobre ética e segurança no uso da tecnologia.


Com o OmniHuman, a ByteDance estabelece um novo padrão na geração de vídeos por IA, prometendo alterações significativas na forma como consumimos e criamos conteúdo. Os leitores são incentivados a se inscreverem na nossa newsletter para ficarem atualizados sobre as mais recentes inovações em inteligência artificial e suas repercussões na sociedade.


 
FONTES:

    1. ByteDance

    2. OmniHuman Lab

    3. arXiv

    4. VentureBeat

    5. VB Daily

    REDATOR

    Gino AI

    12 de fevereiro de 2025 às 11:32:54

    PUBLICAÇÕES RELACIONADAS

    Create a 2D, linear perspective image that echoes a corporate and tech-savvy feel. The backdrop is white and textureless, ornamented with an abstract representation of accompanying networks and circuits. Foreground highlights a futuristic interface populated with a group of AI agents, symbolizing the two points, diversity and unity. Interspersed are a variety of AI icons depicting various tasks they can perform. A robotic hand representation is also prominently displayed, symbolizing the supportive functions the system provides to users. Additionally, sprinkle the scene with performance graphs that illustrate the effectiveness and benchmarks of the multitasking AI system compared to competitors. Capture elements of Flat and Vector design styles in the composition.

    Manus: O Novo Sistema de IA que Promete Revolucionar Tarefas Autônomas

    Create a 2D, linear and corporate-style vector image symbolizing a significant milestone in artificial intelligence technology. This image shows the Gemini 2.0 Flash, a model that integrates native image generation and text-based editing. The interface of Gemini 2.0 Flash is shown in use, placed against a plain, white, and texture-less background. In the image, you can see it generating images from text commands within a digital workspace. Additional elements in the image include symbols of artificial intelligence, like brain and circuit icons. Use vibrant colors to convey innovation and technology, and apply a futuristic style that aligns with the vision of advanced technology.

    Google Lança Gemini 2.0 Flash: Revolução na Geração de Imagens com IA

    Illustrate a 2D, linear perspective image in a corporate, flat and vector style. The image has a textureless, white background. In the foreground, focus on a central figure who symbolizes a leadership role in AI, but not specifically Stephen Peacock. He is explaining the application of AI in game development. Include a visual context of the game development environment and a logo symbolizing an international game development provider, but not specifically the Keywords Studios logo.

    Keywords Studios Lança Soluções de IA para Desenvolvimento de Jogos

    Create a flat, corporate-style, vector image. The setting is Mar 9, 2025, and it captures the concept of AI agents integrating with the business environment, symbolizing the transition from an app-based world to a more dynamic and fluid environment. The background of the image is textureless and white. The perspective is 2D and linear. Additional elements include sober colors like blue and gray to convey a sense of technology and modernity, silhouettes of robots and humans interacting to represent collaboration between AI and users, and floating graphics and data symbolizing the fluidity of real-time information.

    A Revolução do Software: Como a IA Está Transformando o Mercado

    Fique por dentro das últimas novidades em IA

    Obtenha diariamente um resumo com as últimas notícias, avanços e pesquisas relacionadas a inteligência artificial e tecnologia.

    Obrigado pelo envio!

    logo genai

    GenAi Br © 2024

    • LinkedIn
    bottom of page