top of page

Gino News

terça-feira, 7 de janeiro de 2025

Dataset de Preferências Abertas Revoluciona Geração de Imagens a Partir de Texto

Tecnologia Inteligência Artificial Inovação

A comunidade do Huggingface lançou um novo dataset de preferências humanas, o Open Preferences Dataset V1, que coletou mais de 170 mil avaliações de 49 mil annotadores em apenas dois dias, visando aprimorar a geração de imagens a partir de texto.

Create a corporate-style, vector, and flat 2D image representing the breakthrough in image generation. The scene should include signs of technology like circuit designs and AI-generated images to represent innovation and computing. A silhouette of a South Asian woman should be seen observing these images, signifying human interaction. The added elements like graphics and data help illustrate the collection and analysis of preferences. Background should transition with a gentle gradient from blue to white, symbolizing a digital and futuristic environment.

Imagem gerada utilizando Dall-E 3

No campo em rápida evolução da geração de imagens a partir de texto, a qualidade dos modelos é fortemente influenciada por datasets que capturam as preferências humanas. Estes dados subjetivos são essenciais para medir e treinar modelos de forma eficaz. No entanto, reunir um dataset robusto apresenta um desafio significativo, pois exige um grande número de anotadores, o que tradicionalmente envolve altos custos.


Reconhecendo essa dificuldade, a comunidade 'Data is better together' do Huggingface decidiu agir. Eles lançaram um chamado aberto para coletar preferências para 17 mil pares de imagens, e em menos de 48 horas, conseguiram reunir 170 mil preferências de 49 mil annotadores ao redor do mundo. O dataset é composto por imagens geradas a partir de prompts refinados e filtrados, utilizando modelos como Flux e Stable Diffusion.


O dataset não apenas fornece uma quantidade significativa de preferências, mas também apresenta uma diversidade de anotadores, permitindo uma análise mais profunda das preferências em relação às imagens. Os resultados destacam diferenças nas preferências entre modelos, com o modelo FLUX sendo preferido para Anime e Manga, enquanto o Stable Diffusion foi favorecido em outras categorias.


  1. Coleta de 170 mil preferências em 2 dias.

  2. Utilização de 49 mil anotadores de diversos países.

  3. Geração de imagens com prompts filtrados e refinados.

  4. Análise de desempenho dos modelos FLUX e Stable Diffusion.

  5. Menor viés de anotador em relação a datasets anteriores.


A diversidade de anotadores e a quantidade de preferências coletadas permitem que este novo dataset traga uma perspectiva mais abrangente sobre os critérios que influenciam a preferência, como estilo e coerência. A análise também sugere que o dataset pode ser uma base valiosa para o treinamento e ajuste de novos modelos.


Em resumo, o lançamento do Open Preferences Dataset V1 pela comunidade Huggingface representa um avanço significativo na área de geração de imagens a partir de texto, promovendo maior qualidade e diversidade. Este dataset não só é um recurso valioso para pesquisadores e desenvolvedores, mas também abre portas para entendimentos mais profundos sobre as preferências humanas na avaliação de imagens. Para se manter atualizado sobre esses e outros desenvolvimentos no campo da inteligência artificial, inscreva-se em nossa newsletter e descubra conteúdos novos diariamente.


FONTES:

    1. Huggingface Blog

    2. Open Preferences Dataset

    3. Rapidata

    REDATOR

    Gino AI

    7 de janeiro de 2025 às 19:14:45

    PUBLICAÇÕES RELACIONADAS

    Create an image in a 2D, linear perspective that visualizes a user interacting with a large-scale language model within a digital environment. The image should be in a vector-based flat corporate design with a white, textureless background. Display charts that show comparisons between performance metrics of Length Controlled Policy Optimization (LCPO) models and traditional methods. Also, include reasoning flows to illustrate the model's decision-making process. To symbolize the real-time application of the model in business operations, include elements of a digital environment. Use cool colors to convey a sense of advanced technology and innovation.

    Nova Técnica Revoluciona Otimização de Raciocínio em Modelos de Linguagem

    Illustrate a 2D, linear perspective image in a corporate, flat and vector style. The image has a textureless, white background. In the foreground, focus on a central figure who symbolizes a leadership role in AI, but not specifically Stephen Peacock. He is explaining the application of AI in game development. Include a visual context of the game development environment and a logo symbolizing an international game development provider, but not specifically the Keywords Studios logo.

    Keywords Studios Lança Soluções de IA para Desenvolvimento de Jogos

    Create a 2D, linear visual representation using a flat, corporate illustration style. The image showcases an artificial intelligence model symbolized as a human brain made of circuits and connections, demonstrating the concept of reasoning and efficiency. These circuits should be set against a background that is a mix of blue and green symbolizing technology and innovation, on a textureless white base. The image must also incorporate a brightly shining light, suggestive of fresh ideas and innovations in the field. The overall color scheme should consist of cool tones to convey a professional and technological feel.

    Redução de Memória em Modelos de Raciocínio: Inovações e Desafios

    Create an image that reflects the future of artificial intelligence in healthcare. The scene should be set in a futuristic hospital environment, where healthcare professionals of diverse descents and genders are analyzing real-time data through innovative technological devices. In the backdrop, a panel displaying floating graphs and data should be visible, symbolizing the integration of AI in medical practice. The image should be from a 2D linear perspective, styled as a vector image with flat, corporate aesthetics. The background of the image should be white and textureless. Key elements include digital graphs and data - symbolizing health data analysis, healthcare professionals - representing the application of technology in medicine, and a futuristic hospital setting - indicating the forefront of health innovations.

    Mayo Clinic Inova com Reverse RAG para Combater Alucinações em AI na Saúde

    Fique por dentro das últimas novidades em IA

    Obtenha diariamente um resumo com as últimas notícias, avanços e pesquisas relacionadas a inteligência artificial e tecnologia.

    Obrigado pelo envio!

    logo genai

    GenAi Br © 2024

    • LinkedIn
    bottom of page