top of page

Gino News

quinta-feira, 6 de março de 2025

Melhore a Precisão da Recuperação de Dados com Chunking Contextual na Plataforma Unstructured

Tecnologia Inovação Negócios

A Unstructured apresenta uma nova funcionalidade chamada 'Contextual Chunking', que promete melhorar a precisão na recuperação de dados em sistemas de Retrieval-Augmented Generation (RAG), preservando o contexto durante o processamento de documentos complexos.

Create a 2D, linear, vector image in a corporate and minimalist flat style. Picture a clean white, texture-less background. The main focus is on a data retrieval system interface, representative of a software called 'Unstructured'. It should prominently highlight a feature called 'Contextual Chunking', which is meant to improve data recovery accuracy in complex document processing while preserving context. Incorporate visual elements to show the relation between data and insights in a modern corporate setting. Additionally, portray a user seamlessly interacting with the interface to demonstrate ease of use. Scatter complex documents around to symbolize the diversity of processed data. Finally, include performance graphs indicating efficiency improvements.

Imagem gerada utilizando Dall-E 3

A Unstructured, uma plataforma focada em otimização de sistemas de RAG, lançou uma nova funcionalidade chamada 'Contextual Chunking'. Esta novidade visa resolver um desafio crucial na implementação de RAG: manter o contexto dos documentos ao segmentá-los em partes menores. A preservação do contexto é fundamental, especialmente para documentos complexos, como relatórios financeiros, onde informações isoladas podem carecer de relevância sem o seu contexto.


O 'Contextual Chunking' atua ao adicionar informações contextuais relevantes a cada fragmento antes de serem transformados em 'embeddings'. Inspirado em pesquisas da Anthropic, esse recurso utiliza modelos de linguagem avançados para analisar o documento na íntegra, garantindo que cada pedaço de informação receba um prefixo inteligente que captura detalhes cruciais.


A implementação do Contextual Chunking demonstra melhorias significativas na precisão da recuperação de dados. Dados coletados mostram uma redução média de 35% nas falhas de recuperação em várias áreas, com um estudo específico sobre documentos financeiros indicando uma redução de até 84% nas falhas, quando comparados com chunking padrão.


  1. O novo recurso melhora a recuperação em documentos complexos.

  2. O desempenho é testado através de um conjunto de dados de 5,563 pares de perguntas e respostas.

  3. A redução de falhas de recuperação colete em diferentes configurações.

  4. A implementação é simples e está disponível na Plataforma Unstructured.

  5. É essencial monitorar a configuração do sistema RAG para otimização.


Com a nova funcionalidade, a Unstructured permite que as organizações aumentem a precisão de suas recuperações de dados, adaptando-se a necessidades específicas e complexidades de seus documentos. Isso é especialmente relevante para setores que lidam com informações densas e técnicas, como finanças e jurídico.


- Aumente a precisão na recuperação de documentos complexos. - Acesse informações relevantes de maneira mais confiável. - Experimente melhorias significativas em suas implementações RAG. - Contato para demonstrações e suporte personalizado.


Esses avanços não apenas prometem melhorias em eficiência, mas também possibilitam que empresas extraiam insights mais valiosos de seus dados, otimizando processos de decisão. Portanto, ao aderir ao 'Contextual Chunking', as organizações podem não apenas aumentar a eficácia das suas operações de recuperação de dados, mas também garantir que estão aproveitando totalmente suas informações.


A adoção do 'Contextual Chunking' no Unstructured representa um passo significativo para empresas que dependem de dados complexos. Para aqueles que buscam aprimorar suas operações de recuperação de dados, essa nova funcionalidade é imperdível. Fique por dentro das novidades e atualizações, inscreva-se em nossa newsletter e descubra como a tecnologia pode transformar suas operações diariamente.


FONTES:

    1. Unstructured

    2. Anthropic

    3. Documentação Unstructured

    4. Artigo sobre Chunking Contextual

    5. Estudo de Caso RAG

    REDATOR

    Gino AI

    6 de março de 2025 às 16:53:24

    PUBLICAÇÕES RELACIONADAS

    Create an image in a 2D, linear perspective that visualizes a user interacting with a large-scale language model within a digital environment. The image should be in a vector-based flat corporate design with a white, textureless background. Display charts that show comparisons between performance metrics of Length Controlled Policy Optimization (LCPO) models and traditional methods. Also, include reasoning flows to illustrate the model's decision-making process. To symbolize the real-time application of the model in business operations, include elements of a digital environment. Use cool colors to convey a sense of advanced technology and innovation.

    Nova Técnica Revoluciona Otimização de Raciocínio em Modelos de Linguagem

    Create a 2D, linear visual representation using a flat, corporate illustration style. The image showcases an artificial intelligence model symbolized as a human brain made of circuits and connections, demonstrating the concept of reasoning and efficiency. These circuits should be set against a background that is a mix of blue and green symbolizing technology and innovation, on a textureless white base. The image must also incorporate a brightly shining light, suggestive of fresh ideas and innovations in the field. The overall color scheme should consist of cool tones to convey a professional and technological feel.

    Redução de Memória em Modelos de Raciocínio: Inovações e Desafios

    Visual representation of a novel multimodal language model, called Judge-Image, used for evaluation of artificial intelligence systems. The scene 2D and Linear, has a flat and corporate vector style with a white, untextured background. It shows the Judge-Image in action, interpreting an assortment of images and generating corresponding text on a computer screen. Several artificial intelligence icons symbolizing the area of Judge-Image's operations are scattered around the computer, indicating its function and usage. Also, real-time performance metrics are displayed beside the computer, demonstrating the ongoing analysis and evaluation.

    Patronus AI Lança Judge-Image: Avaliando Sistemas de IA com Precisão

    Illustrate an image that captures the concept of memory in artificial intelligence in a 2D, linear, and flat style, commonly used in a corporate context. The scene should include a team of researchers, with balanced representation: an Asian woman, a Black man, and a Caucasian man, subtly interaction with futuristic machines. Use visual symbols such as icons of data clouds to represent storage, interconnections and blue and green colors to symbolize technology and innovation. Highlight the interaction between humans and AI with linear connections between points symbolizing the link between memories. Set this visualization against a plain white, texture-less background.

    A-MEM: Um Novo Marco em Memória para Modelos de Linguagem

    Fique por dentro das últimas novidades em IA

    Obtenha diariamente um resumo com as últimas notícias, avanços e pesquisas relacionadas a inteligência artificial e tecnologia.

    Obrigado pelo envio!

    logo genai

    GenAi Br © 2024

    • LinkedIn
    bottom of page