top of page

Gino News

quarta-feira, 18 de dezembro de 2024

A Origem dos Dados na Construção da Inteligência Artificial: Um Olhar Crítico

Inteligência Artificial Tecnologia Ética

A crescente dependência de dados na construção de modelos de inteligência artificial levanta preocupações sobre a origem desses dados e sua concentração em poucas empresas, conforme revela um estudo da Data Provenance Initiative, auditando quase 4.000 conjuntos de dados públicos.

Create a 2D, linear, and simplistic vector illustration on a white, untextured background, symbolizing the influence of vast data streams on Artificial Intelligence. Pictorially represent vibrant data flows converging into a central entity that signifies AI. At the bottom of the artwork, incorporate diverse data source icons, assuring to visually represent data from variant platforms such as a video platform, social media, and a web-based encyclopedia. The paths of the data flows should be outlined with arrows connecting the different sources to the central AI model. Lastly, use vivid colors to imply the diversity of information and complexity of the digital world, as well as an abstract background to hint at technology and connectivity.

Imagem gerada utilizando Dall-E 3

A inteligência artificial (AI) depende fundamentalmente de grandes volumes de dados para treinar seus algoritmos. Contudo, os desenvolvedores e pesquisadores de AI frequentemente desconhecem as fontes de dados que utilizam. Práticas de coleta de dados na AI têm se mostrado imaturas em comparação com a sofisticada evolução dos modelos de AI, o que gera um desafio sobre a transparência e a origem dos dados.


A Data Provenance Initiative, composta por mais de 50 pesquisadores, examinou quase 4.000 conjuntos de dados que abrangem 600 idiomas e 67 países. Os resultados revelaram que mais de 90% desses dados provêm de apenas algumas fontes dominantes, como a web, tornando a concentração de poder significativa nas mãos de grandes empresas de tecnologia.


As descobertas apontam que a maioria dos dados para modelos de vídeo e imagem, por exemplo, surge de plataformas como o YouTube. Essa tendência pode levar a uma concentração de poder que afeta a diversidade dos dados, refletindo uma visão ocidental e esquecendo culturas diversas.


  1. Os conjuntos de dados atuais são predominantemente extraídos da internet.

  2. Mais de 90% dos dados analisados são oriundos da Europa e América do Norte.

  3. O uso de dados sintéticos aumentou, impulsionado pela necessidade de modelos maiores.

  4. Práticas de compartilhamento de dados exclusivas por grandes empresas beneficiam poucos.

  5. A falta de transparência sobre a origem dos dados pode levar a modelos enviesados.


A análise sugere que a concentração de dados não apenas limita o acesso de pesquisadores e pequenas empresas, mas também implica em modelos de AI que podem não capturar a complexidade da experiência humana, exacerbando preconceitos e desconsiderando diversas culturas.


O estudo da Data Provenance Initiative levanta questões cruciais sobre a ética e a diversidade na construção de modelos de inteligência artificial, sublinhando a necessidade de práticas mais transparentes e inclusivas. Encoraja-se o leitor a se aprofundar no tema e a acompanhar atualizações diárias em nossa newsletter, que traz questões relevantes sobre tecnologia e sociedade.


FONTES:

    1. MIT Technology Review

    2. Data Provenance Initiative

    3. AI Now Institute

    4. Cohere

    5. Hugging Face

    REDATOR

    Gino AI

    18 de dezembro de 2024 às 22:36:59

    PUBLICAÇÕES RELACIONADAS

    Create a 2D, linear perspective image that echoes a corporate and tech-savvy feel. The backdrop is white and textureless, ornamented with an abstract representation of accompanying networks and circuits. Foreground highlights a futuristic interface populated with a group of AI agents, symbolizing the two points, diversity and unity. Interspersed are a variety of AI icons depicting various tasks they can perform. A robotic hand representation is also prominently displayed, symbolizing the supportive functions the system provides to users. Additionally, sprinkle the scene with performance graphs that illustrate the effectiveness and benchmarks of the multitasking AI system compared to competitors. Capture elements of Flat and Vector design styles in the composition.

    Manus: O Novo Sistema de IA que Promete Revolucionar Tarefas Autônomas

    Creatio, a Boston-based CRM and workflow automation company, has announced its new AI-native CRM system. Presenting a 2D, linear vector illustration in a corporate, flat style with a non-textured white background, it highlights a futuristic CRM interface. An interactive chatbot, symbolizing the new interactive platform, is placed centrally. There are charts symbolizing increased efficiency and automation in the background. Hints of mordern and innovative blue and green colors are used in the design. Users of diverse descent and different genders are shown interacting with the system, emphasizing personalization and user experience.

    Creatio Revoluciona o CRM com Plataforma Nativa de IA

    Illustrate a corporate, flat and vectorial scene: A man, who is an education official, in a press conference on March 13, 2025. The focus of the press conference is the discussion of the need to regulate artificial intelligence. The education official is emphasizing points about responsible use and regulation of artificial intelligence. The backdrop is white and without texture, keeping it simple and professional. To further symbolize the collaboration among different sectors, display generic logos that represent different areas of government. Display also a screen showing data about artificial intelligence, showcasing the technical basis of the discussion. Add graphical elements related to technology to enhance the theme of artificial intelligence.

    Camilo Santana Propõe Discussão sobre Regulamentação da Inteligência Artificial

    Illustrate a 2D, linear perspective image in a corporate, flat and vector style. The image has a textureless, white background. In the foreground, focus on a central figure who symbolizes a leadership role in AI, but not specifically Stephen Peacock. He is explaining the application of AI in game development. Include a visual context of the game development environment and a logo symbolizing an international game development provider, but not specifically the Keywords Studios logo.

    Keywords Studios Lança Soluções de IA para Desenvolvimento de Jogos

    Fique por dentro das últimas novidades em IA

    Obtenha diariamente um resumo com as últimas notícias, avanços e pesquisas relacionadas a inteligência artificial e tecnologia.

    Obrigado pelo envio!

    logo genai

    GenAi Br © 2024

    • LinkedIn
    bottom of page