top of page

Gino News

sábado, 11 de janeiro de 2025

Salesforce Lança ProVision: Solução Inovadora para a Geração de Dados de Treinamento em IA Multimodal

Inteligência Artificial Tecnologia Inovação

A Salesforce anunciou o ProVision, um novo framework que promete transformar a geração de dados de treinamento visual para modelos de IA multimodal, enfrentando o desafio da escassez de dados de alta qualidade que muitas empresas enfrentam.

Generate a 2D, vector-style corporate image that represents the Salesforce ProVision interface. This interface aims to revolutionize the generation of visual training data for multimodal AI models. The image should feature scene charts, instruction data illustrations, and a visual representation of the multimodal AI concept. Set against a plain white background, the elements should be in bright, vibrant colors symbolizing dynamism and modernity. Include AI-related icons that symbolize technology and innovation. Add striking text to highlight the efficiency of the new tool.

Imagem gerada utilizando Dall-E 3

Com o aumento dos projetos de Inteligência Artificial (IA) nas empresas, a disponibilidade de dados de treino de qualidade se tornou um grande gargalo. Grandes players como OpenAI e Google estão estabelecendo parcerias exclusivas para expandir seus conjuntos de dados proprietários, dificultando o acesso para outras empresas. Em resposta a essa situação, a Salesforce lançou o ProVision, um framework inovador que gera dados de instrução visual programaticamente.


Os dados de instrução são essenciais para o pré-treinamento e a afinação de IA multimodal, permitindo que os modelos analisem conteúdos visuais após aprenderem a partir de diferentes pontos de dados, acompanhados de pares de perguntas e respostas. Produzir esses conjuntos de dados de instrução visual manualmente envolve um grande desperdício de tempo e recursos, enquanto o uso de modelos de linguagem proprietários pode acarretar custos computacionais altos e a possibilidade de imprecisões nos dados gerados.


O ProVision utiliza gráficos de cena, representações estruturadas da semântica das imagens, em combinação com programas escritos por humanos para sintetizar dados de instrução visual. A partir dessa abordagem, a equipe da Salesforce criou o conjunto de dados ProVision-10M, que inclui mais de 10 milhões de pontos de dados únicos para o treinamento de IA.


  1. A equipe desenvolveu geradores de dados que utilizam gráficos de cena para gerar perguntas e respostas.

  2. O ProVision-10M foi criado com 1,5 milhão de dados de instrução de imagem única e 4,2 milhões de dados de instrução multi-imagem.

  3. Durante a afinação com o ProVision-10M, as melhorias de desempenho dos modelos de IA foram significativas.

  4. A abordagem permite maior controle e interpretação na geração de dados.

  5. A empresa visa expandir o uso de grafos de cena para criar novos tipos de dados de instrução, incluindo vídeos.


A geração de dados sintéticos, como a promovida pelo ProVision, representa uma solução viável para o problema da escassez de dados de qualidade, permitindo que as empresas escalem suas capacidades de treinamento de IA de maneira eficiente. A Salesforce espera que essa inovação permita aos pesquisadores aprimorar as pipelines de geração de gráficos de cena.


- Melhoria na eficiência do treinamento de IA. - Redução de custos e tempo no processo de geração de dados. - Possibilidade de gerar dados para novos tipos de multimodalidade. - Aumento do controle e a capacidade de interpretação nos dados gerados.


Com a chegada do ProVision, a Salesforce não apenas aborda um gargalo significativo na área de IA, como também abre possibilidades para o desenvolvimento de novos métodos e aplicações na inteligência artificial que podem beneficiar empresas de diversos setores.


Em síntese, o ProVision da Salesforce é um avanço promissor que pode elevar o patamar do treinamento de modelos de IA multimodal, solucionando um dos principais desafios enfrentados pelas empresas. Para saber mais sobre essas novidades e como elas podem impactar o seu negócio, inscreva-se em nossa newsletter e acompanhe conteúdos atualizados diariamente.


 
FONTES:

    1. VentureBeat

    2. The Verge

    3. VentureBeat - OpenAI

    4. arXiv

    5. Salesforce Blog

    REDATOR

    Gino AI

    11 de janeiro de 2025 às 16:07:27

    PUBLICAÇÕES RELACIONADAS

    Create a 2D, vector-style artwork set in a clinical setting. On a white, textureless background, illustrate the scene with a flat and corporate aesthetic. A healthcare professional is preparing to administer an injection of lenacapavir to a diverse group of patients. The syringe is a visual symbol of the innovative treatment. The patients, representing a broad range of genders and descents such as Middle-Eastern female, Hispanic male, and South Asian transgender person, convey hope and are the beneficiaries of this advancement. The environment, symbolizing the seriousness of the treatment, is a doctor's office furnished with charts and graphs indicating the reduction in HIV infections due to the new treatment. Use a colour palette consisting of shades of blue and green to transmit trust and hope.

    Lenacapavir: Injeção Anual Promissora para Prevenção do HIV

    Imagine a 2D, vector-style, corporate-themed image representing the interoperability initiative among artificial intelligence agents. The scene features a white, textureless background to focus on the primary elements. Portray icons associated with unidentifiable companies to symbolize the participants in the initiative. Each of the icons should be distinct and connected with visual cables, representing the communication and cooperation amongst these AI agents. Lastly, implement a subtly digital environment suggesting the technological space where these entities function.

    AGNTCY: A Nova Iniciativa para Interoperabilidade entre Agentes de IA

    Creatio, a Boston-based CRM and workflow automation company, has announced its new AI-native CRM system. Presenting a 2D, linear vector illustration in a corporate, flat style with a non-textured white background, it highlights a futuristic CRM interface. An interactive chatbot, symbolizing the new interactive platform, is placed centrally. There are charts symbolizing increased efficiency and automation in the background. Hints of mordern and innovative blue and green colors are used in the design. Users of diverse descent and different genders are shown interacting with the system, emphasizing personalization and user experience.

    Creatio Revoluciona o CRM com Plataforma Nativa de IA

    Illustrate a 2D, linear perspective image in a corporate, flat and vector style. The image has a textureless, white background. In the foreground, focus on a central figure who symbolizes a leadership role in AI, but not specifically Stephen Peacock. He is explaining the application of AI in game development. Include a visual context of the game development environment and a logo symbolizing an international game development provider, but not specifically the Keywords Studios logo.

    Keywords Studios Lança Soluções de IA para Desenvolvimento de Jogos

    Fique por dentro das últimas novidades em IA

    Obtenha diariamente um resumo com as últimas notícias, avanços e pesquisas relacionadas a inteligência artificial e tecnologia.

    Obrigado pelo envio!

    logo genai

    GenAi Br © 2024

    • LinkedIn
    bottom of page