top of page

Gino News

segunda-feira, 1 de julho de 2024

Nova Iniciativa para Avaliação de Modelos de IA por Terceiros

Tecnologia Inteligência Artificial Segurança

Uma nova iniciativa foi lançada para financiar avaliações de modelos de IA desenvolvidas por organizações terceirizadas, com o objetivo de medir capacidades avançadas e riscos associados. A iniciativa busca suprir a demanda crescente por avaliações de alta qualidade e relevância para a segurança, beneficiando todo o ecossistema de IA.

Generate a 2D, flat, corporate-style, vector image on a blank white, textureless background. The image should show a robot holding a magnifying glass, symbolizing the meticulous evaluation of AI models. Include icons of a padlock and a shield to represent security and protection. There should also be an upward-pointing growth chart to indicate advancement and development in the AI field. Incorporate a world map with connections, demonstrating global collaboration in AI evaluation. The color palette should use shades of blue and green, to convey trust and innovation.

Imagem gerada utilizando Dall-E 3

A Anthropic anunciou uma nova iniciativa para financiar avaliações de modelos de IA desenvolvidas por terceiros. O objetivo é criar um ecossistema robusto de avaliações que possa medir com precisão as capacidades avançadas e os riscos dos modelos de IA. A iniciativa visa suprir a demanda crescente por avaliações de alta qualidade e relevância para a segurança, beneficiando todo o ecossistema de IA.


  1. Cibersegurança: Avaliações que medem a capacidade dos modelos de IA em operações cibernéticas.

  2. Riscos CBRN: Avaliações que analisam a capacidade dos modelos de IA em criar ameaças químicas, biológicas, radiológicas e nucleares.

  3. Autonomia dos Modelos: Avaliações que medem a operação autônoma dos modelos de IA em pesquisa e desenvolvimento, comportamentos autônomos avançados e auto-replicação.

  4. Outros Riscos de Segurança Nacional: Avaliações que identificam e medem riscos emergentes relacionados à segurança nacional.

  5. Manipulação Social: Avaliações que medem a capacidade dos modelos de IA em amplificar ameaças de persuasão, como desinformação e manipulação.


Além das avaliações focadas em segurança, a iniciativa busca desenvolver métricas que ofereçam uma compreensão mais abrangente das capacidades avançadas dos modelos e critérios de segurança relevantes. Isso inclui áreas como ciência avançada, recusa e identificação de conteúdos nocivos, avaliações multilíngues e impactos sociais.


- Plataformas de desenvolvimento de avaliações sem código: Ferramentas que permitem que especialistas em assuntos desenvolvam avaliações robustas sem necessidade de habilidades de codificação. - Avaliações para classificação de modelos: Melhorar a capacidade dos modelos de revisar e pontuar saídas de outros modelos. - Ensaios de impacto: Medir o impacto dos modelos por meio de ensaios controlados, comparando o desempenho de tarefas com e sem acesso ao modelo de IA.


A Anthropic convida propostas de avaliação através de um formulário de inscrição e oferece diversas opções de financiamento. A equipe da Anthropic revisará as submissões continuamente e oferecerá orientação para maximizar o impacto das avaliações desenvolvidas.


A iniciativa da Anthropic para financiar avaliações de modelos de IA por terceiros promete elevar os padrões de segurança e eficácia no campo da IA. Com um foco em áreas críticas como cibersegurança, riscos CBRN e manipulação social, a iniciativa busca criar ferramentas valiosas para todo o ecossistema de IA. O sucesso dessa iniciativa pode definir um novo padrão na avaliação de IA, promovendo um desenvolvimento mais seguro e responsável da tecnologia.


FONTES:
  1. Anthropic

  2. Responsible Scaling Policy

  3. Google-Proof Q&A (GPQA)

  4. METR's public task suite

  5. Reward tampering

  6. Sleeper agents

  7. Measuring model persuasiveness

  8. Application form

REDATOR

Gino AI

27 de setembro de 2024 às 20:07:26

PUBLICAÇÕES RELACIONADAS

Imagine a 2D, vector-style, corporate-themed image representing the interoperability initiative among artificial intelligence agents. The scene features a white, textureless background to focus on the primary elements. Portray icons associated with unidentifiable companies to symbolize the participants in the initiative. Each of the icons should be distinct and connected with visual cables, representing the communication and cooperation amongst these AI agents. Lastly, implement a subtly digital environment suggesting the technological space where these entities function.

AGNTCY: A Nova Iniciativa para Interoperabilidade entre Agentes de IA

Creatio, a Boston-based CRM and workflow automation company, has announced its new AI-native CRM system. Presenting a 2D, linear vector illustration in a corporate, flat style with a non-textured white background, it highlights a futuristic CRM interface. An interactive chatbot, symbolizing the new interactive platform, is placed centrally. There are charts symbolizing increased efficiency and automation in the background. Hints of mordern and innovative blue and green colors are used in the design. Users of diverse descent and different genders are shown interacting with the system, emphasizing personalization and user experience.

Creatio Revoluciona o CRM com Plataforma Nativa de IA

Illustrate a corporate, flat and vectorial scene: A man, who is an education official, in a press conference on March 13, 2025. The focus of the press conference is the discussion of the need to regulate artificial intelligence. The education official is emphasizing points about responsible use and regulation of artificial intelligence. The backdrop is white and without texture, keeping it simple and professional. To further symbolize the collaboration among different sectors, display generic logos that represent different areas of government. Display also a screen showing data about artificial intelligence, showcasing the technical basis of the discussion. Add graphical elements related to technology to enhance the theme of artificial intelligence.

Camilo Santana Propõe Discussão sobre Regulamentação da Inteligência Artificial

Illustrate a 2D, linear perspective image in a corporate, flat and vector style. The image has a textureless, white background. In the foreground, focus on a central figure who symbolizes a leadership role in AI, but not specifically Stephen Peacock. He is explaining the application of AI in game development. Include a visual context of the game development environment and a logo symbolizing an international game development provider, but not specifically the Keywords Studios logo.

Keywords Studios Lança Soluções de IA para Desenvolvimento de Jogos

Fique por dentro das últimas novidades em IA

Obtenha diariamente um resumo com as últimas notícias, avanços e pesquisas relacionadas a inteligência artificial e tecnologia.

Obrigado pelo envio!

logo genai

GenAi Br © 2024

  • LinkedIn
bottom of page