BigLaw Bench: Avaliando Modelos de Linguagem em Tarefas Legais

Tecnologia Direito Inteligência Artificial

A Harvey anunciou o lançamento do BigLaw Bench, uma versão pública de seu conjunto de dados interno, que avalia o desempenho de modelos de linguagem em tarefas legais complexas, destacando a importância de referências precisas para aumentar a confiabilidade e a eficiência das análises legais geradas por IA.

Produce a 2D, linear perspective image in a vector, corporate style with a white, textureless background. This illustration showcases a Caucasian female lawyer analyzing data on a computer. The screen displays references and citations, reflecting the importance of precise references in AI-generated legal analyses. In the backdrop, you can see graphs and legal documents signifying the performance evaluation of language models and the context in which they're being applied. These elements symbolize the modern technology used in legal practice and the target audience that benefits from it.

Imagem gerada utilizando Dall-E 3

O BigLaw Bench é um framework que avalia quantitativamente como modelos de linguagem lidam com tarefas legais do mundo real. Um dos principais indicadores de desempenho é a "pontuação de fonte", que mede a capacidade de um modelo de conectar suas respostas a documentos relevantes. A Harvey investiu consideravelmente na otimização da referência a fontes, resultando em seus modelos superando outros em termos de precisão na citação.

As fontes são essenciais no trabalho legal, pois aumentam a confiança do usuário e facilitam a navegação em documentos complexos. A Harvey identificou que, para uma fonte ser eficaz, ela precisa se conectar a um trecho específico de um documento. No entanto, essa tarefa apresenta desafios técnicos significativos, como a necessidade de especificidade e singularidade nas referências.

A pontuação de fonte é derivada da identificação de afirmações que requerem verificação e se o modelo fornece uma fonte válida.
Fontes válidas conectam afirmações a documentos específicos que as sustentam.
A Harvey está desenvolvendo soluções para melhorar a qualidade das fontes sem comprometer a qualidade das respostas.

A empresa utiliza sistemas de múltiplos modelos para gerar respostas que incluem raciocínio detalhado e fontes abrangentes, permitindo que os usuários acessem passagens específicas que apoiam as afirmações feitas.

A importância das fontes vai além da confiabilidade atual, pois elas serão fundamentais para a comunicação entre modelos em sistemas mais complexos no futuro, mitigando riscos de informações distorcidas.

A Harvey está na vanguarda da integração de referências precisas em modelos de linguagem, o que não só melhora a confiança nas análises legais geradas por IA, mas também prepara o terreno para sistemas mais eficazes e escaláveis no futuro.