
Gino News
quinta-feira, 5 de setembro de 2024
Late Chunking: A Nova Fronteira na Recuperação de Contexto Longo
No dia 5 de setembro de 2024, a JinaAI apresentou uma metodologia inovadora chamada late chunking, que busca melhorar a recuperação de informações em documentos longos, equilibrando precisão e custos, ao inverter a ordem tradicional de chunking e embedding, oferecendo uma solução promissora para aplicações de RAG.

Imagem gerada utilizando Dall-E 3
As aplicações de RAG (Recuperação Assistida por Geração) enfrentam desafios significativos ao lidarem com grandes volumes de dados e a necessidade de precisão elevada. Comumente, as soluções disponíveis tendem a sacrificar um dos dois aspectos, levando a uma escolha difícil para os usuários. A metodologia late chunking promete resolver esse dilema, oferecendo uma alternativa que combina os benefícios dos métodos mais simples com os de abordagens mais sofisticadas.
O late chunking é uma abordagem nova que preserva a informação contextual ao reverter a ordem convencional de chunking e embedding. Tradicionalmente, documentos longos eram fragmentados em pedaços menores e cada pedaço era embutido separadamente, o que não considerava as relações contextuais entre os pedaços. O novo método sugere que o documento inteiro seja embutido de uma só vez e, em seguida, os embeddings são divididos em chunks, mantendo assim as relações contextuais.
Comparado a outras abordagens, como o late interaction e a abordagem ingênua de chunking, o late chunking oferece uma solução intermediária. Com o late chunking, é possível manter a precisão na recuperação de informações com custos de armazenamento similares aos da abordagem ingênua, ao mesmo tempo que se preserva a qualidade contextual das informações.
A abordagem ingênua requer 1/500 do armazenamento comparado ao late interaction.
O late chunking mantém a redução nos requisitos de armazenamento.
A precisão aumenta conforme o comprimento do documento.
Permite menos chamadas a modelos de linguagem devido à maior eficiência.
Implementação simples em menos de 30 linhas de código.
Com a crescente demanda por soluções eficientes em recuperação de contexto longo, a abordagem late chunking se mostra como uma inovação valiosa. Este método não só oferece uma solução mais econômica, mas também promete facilitar a criação de sistemas de recuperação de alta qualidade, abordando a necessidade de contexto em documentos longos.
Em síntese, o late chunking oferece uma solução promissora para o dilema enfrentado por profissionais que lidam com grandes volumes de dados. Ao equilibrar custo e precisão, esta metodologia pode transformar a maneira como sistemas de recuperação de informações são desenvolvidos. Para mais atualizações e conteúdos úteis, inscreva-se em nossa newsletter e fique por dentro das inovações no campo da tecnologia.
FONTES:
REDATOR

Gino AI
3 de outubro de 2024 às 23:13:11




