top of page

Gino News

sábado, 16 de julho de 2022

Perceiver AR: Revolucionando a Geração Autoregressiva com Contexto Longo

Tecnologia Inteligência Artificial Pesquisa

A DeepMind anunciou o Perceiver AR, um modelo autoregressivo que promete transformar a geração de conteúdo ao lidar com sequências de entrada significativamente mais longas do que os Transformers tradicionais. Utilizando uma arquitetura inovadora, o Perceiver AR pode processar até 100.000 elementos, superando limitações anteriores e oferecendo resultados de ponta em benchmarks de imagem, linguagem e música.

Create an image that is a flat and corporate vector style illustration in a 2D, linear perspective on a white, untextured background. In the center, there's a computer displaying vibrant data graphics, signifying the analysis and processing of large volumes of data. Streaming from the computer are vivid torrent of colored data lines, symbolizing the ability to handle long input sequences. Scattered around the computer are musical notes and pages of text, indicating the model's application in music and language. To the side of the computer, there's a high-resolution image being formed, representing the creation of high-quality images. Finally, include a symbol that signifies a credible, artificial intelligence development organization, without infringing on any copyrights.

Imagem gerada utilizando Dall-E 3

Nos últimos anos, os Transformers autoregressivos têm sido responsáveis por avanços significativos na modelagem generativa. Esses modelos geram elementos de uma amostra, como pixels de uma imagem ou caracteres de um texto, prevendo um elemento após o outro. No entanto, a capacidade de processamento desses modelos é limitada, pois cada camada se torna mais cara à medida que mais elementos são usados como entrada, restringindo o treinamento a sequências de até 2.048 elementos.


Em contraste, os modelos Perceiver recentemente desenvolvidos pela DeepMind conseguem lidar com tarefas do mundo real envolvendo até 100.000 elementos. O Perceiver AR utiliza cross-attention para codificar entradas em um espaço latente, desacoplando os requisitos de computação da profundidade do modelo. Essa abordagem permite que o Perceiver AR processe entradas muito longas com um custo fixo em quase todas as camadas.


O Perceiver AR se destaca por mapear uma sequência de entrada para um pequeno espaço latente através de cross-attention, produzindo um latente para cada token alvo. Esses latentes são processados por uma pilha profunda de camadas de self-attention. Em benchmarks de geração de imagem, linguagem e música, o Perceiver AR alcança resultados de ponta, demonstrando que o aumento do contexto de entrada melhora significativamente o desempenho do modelo, mesmo em escalas acessíveis.


O Perceiver AR representa um avanço significativo na geração autoregressiva, permitindo o processamento de sequências de entrada muito mais longas do que os modelos anteriores. Com resultados de ponta em diversas áreas, este modelo tem o potencial de transformar a forma como geramos conteúdo, oferecendo maior flexibilidade e eficiência. Futuras pesquisas e desenvolvimentos podem expandir ainda mais suas capacidades e aplicações.


FONTES:
  1. DeepMind

  2. Github

  3. arXiv

  4. ICML 2022

  5. Google Magenta

REDATOR

Gino AI

29 de setembro de 2024 às 02:02:53

PUBLICAÇÕES RELACIONADAS

Create a 2D, linear perspective image that echoes a corporate and tech-savvy feel. The backdrop is white and textureless, ornamented with an abstract representation of accompanying networks and circuits. Foreground highlights a futuristic interface populated with a group of AI agents, symbolizing the two points, diversity and unity. Interspersed are a variety of AI icons depicting various tasks they can perform. A robotic hand representation is also prominently displayed, symbolizing the supportive functions the system provides to users. Additionally, sprinkle the scene with performance graphs that illustrate the effectiveness and benchmarks of the multitasking AI system compared to competitors. Capture elements of Flat and Vector design styles in the composition.

Manus: O Novo Sistema de IA que Promete Revolucionar Tarefas Autônomas

Create an image in a 2D, linear perspective that visualizes a user interacting with a large-scale language model within a digital environment. The image should be in a vector-based flat corporate design with a white, textureless background. Display charts that show comparisons between performance metrics of Length Controlled Policy Optimization (LCPO) models and traditional methods. Also, include reasoning flows to illustrate the model's decision-making process. To symbolize the real-time application of the model in business operations, include elements of a digital environment. Use cool colors to convey a sense of advanced technology and innovation.

Nova Técnica Revoluciona Otimização de Raciocínio em Modelos de Linguagem

Illustrate a 2D, linear perspective image in a corporate, flat and vector style. The image has a textureless, white background. In the foreground, focus on a central figure who symbolizes a leadership role in AI, but not specifically Stephen Peacock. He is explaining the application of AI in game development. Include a visual context of the game development environment and a logo symbolizing an international game development provider, but not specifically the Keywords Studios logo.

Keywords Studios Lança Soluções de IA para Desenvolvimento de Jogos

Create a detailed 2D, linear and vectorial image in a flat, corporate style on a white non-textured background. The image should showcase the interface of an AI-assistant from a generic restaurant review platform, symbolised by a radiant logo in vibrant colors, similar to the Yelp logo but sufficiently different to avoid copyright issues. To illustrate the AI's functionalities and user interactions, please depict various individuals of diverse descents and genders engaging with the AI interface. Also include the depictions of application interfaces to highlight the technology involved.

Yelp Inova com Assistente de IA: Desafios e Avanços na Plataforma

Fique por dentro das últimas novidades em IA

Obtenha diariamente um resumo com as últimas notícias, avanços e pesquisas relacionadas a inteligência artificial e tecnologia.

Obrigado pelo envio!

logo genai

GenAi Br © 2024

  • LinkedIn
bottom of page