
Gino News
quarta-feira, 29 de janeiro de 2025
Iniciativa Busca Criar Repositório Ético de Códigos para IA
A nonprofit Software Heritage lançou uma iniciativa para utilizar 22 bilhões de arquivos de código aberto, criando o maior repositório eticamente adquirido no mundo, destinado ao treinamento de assistentes de programação baseados em IA, em resposta às preocupações sobre a procedência e os direitos autorais do código.

Imagem gerada utilizando Dall-E 3
A crescente dependência de assistentes de programação baseados em Inteligência Artificial (IA) entre desenvolvedores tem levantado questões sobre a origem e a transparência do código utilizado para o treinamento desses modelos. A Software Heritage, fundada em 2016, visa enfrentar esses desafios através de um novo projeto que busca disponibilizar um repositório acessível de código de origem ética, consolidando a maior coleção de código do mundo.
Após a ascensão dos LLMs, a Software Heritage identificou seu acervo como uma valiosa fonte de dados para o treinamento de modelos de IA, possuindo atualmente mais de 22 bilhões de arquivos de código oriundos de aproximadamente 345 milhões de projetos em mais de 600 linguagens de programação.
Para facilitar o acesso e a utilização desse vasto conjunto de dados, a Software Heritage está desenvolvendo uma plataforma de dados unificada, chamada CodeCommons, que oferecerá coleções de código previamente limpas e enriquecidas com metadados relevantes, como informações de licença e links para pesquisas relacionadas.
A Software Heritage acumula uma vasta coleção de dados de código aberta desde 2016.
A iniciativa CodeCommons visa facilitar o acesso a conjuntos de códigos limpos para pesquisadores.
O projeto enfrenta desafios significativos na unificação dos formatos de dados de diferentes fontes.
A transparência e a rastreabilidade são prioridades no treinamento de IA.
O sucesso da iniciativa depende de recursos limitados e do tempo disponível.
As implicações dessa iniciativa são profundas, pois propõem um caminho mais responsável e transparente para o desenvolvimento de IA, ao mesmo tempo que preserva a herança digital do código disponível publicamente. Se bem-sucedida, a Software Heritage não apenas proporcionará modelos de IA mais éticos, mas também contribuirá para um ambiente de desenvolvimento mais colaborativo e justo.
- Promoção de práticas éticas no desenvolvimento de IA. - Aumento da transparência em projetos de código aberto. - Valorização da herança digital na era da IA. - Possibilidade de evolução na condução de pesquisas em programação.
Ao abordar essas preocupações, a Software Heritage prepara o terreno para um futuro onde o desenvolvimento de software e a IA caminham juntos de maneira ética e responsável. Isso representa não apenas uma vitória para desenvolvedores e pesquisadores, mas um avanço positivo em direção à proteção dos direitos autorais e ao reconhecimento do trabalho colaborativo na comunidade de código aberto.
A iniciativa da Software Heritage pode redefinir a forma como o código é utilizado para treinar modelos de IA, promovendo uma maior responsabilização e ética nesse processo. Para mais informações e notícias atualizadas sobre tecnologia e ética na IA, inscreva-se em nossa newsletter e mantenha-se informado.
FONTES:
REDATOR

Gino AI
29 de janeiro de 2025 às 23:52:22




