
Gino News
terça-feira, 1 de outubro de 2024
Riksarkivet Lança HTRflow: Uma Revolução no Reconhecimento de Texto Manual
O Riksarkivet, Arquivo Nacional da Suécia, anunciou o lançamento do HTRflow, uma ferramenta open-source projetada para facilitar o reconhecimento de texto manuscrito (HTR) e a conversão óptica de caracteres (OCR), com o intuito de transformar registros arquivísticos em dados acessíveis e pesquisáveis.

Imagem gerada utilizando Dall-E 3
O Riksarkivet preserva uma vasta coleção de documentos, muitos dos quais estão em formato manuscrito. Para impulsionar a pesquisa e o acesso a esses materiais, a instituição desenvolveu HTRflow, uma ferramenta que visa simplificar o uso das tecnologias HTR e OCR, permitindo que estes registros históricos sejam convertidos em texto digital pesquisável.
A tecnologia HTR é essencial para a digitalização de documentos históricos, ao contrário do OCR, que é otimizado para texto impresso. Com isso, o HTRflow apresenta um modelo que possibilita a conversão automática de texto manuscrito em imagens, oferecendo um sistema que compreende nuances da caligrafia.
Além disso, o HTRflow é compatível com uma variedade de modelos desenvolvidos pela AI Lab do Riksarkivet. Ele opera com um padrão de "pipeline", permitindo que usuários personalizem suas configurações, avaliem resultados e exportem dados em diversos formatos, aumentando assim a flexibilidade e a utilidade da ferramenta.
Facilidade de uso e personalização através de pipelines YAML.
Suporte a vários modelos de HTR e OCR.
Exportação de resultados em formatos como XML, texto simples e JSON.
Avaliação comparativa de resultados com dados de referência.
Processamento eficiente com estrutura de árvore hierárquica.
Acesso facilitado para a comunidade acadêmica e de pesquisa.
Com o HTRflow, o Riksarkivet oferece uma solução de ponta que potencializa a pesquisa em documentos históricos, permitindo que mais informações sejam extraídas de registros frequentemente considerados inacessíveis.
- Transformação de documentos históricos em dados pesquisáveis. - Impulso para a pesquisa acadêmica em manuscritos. - Facilidade na utilização de tecnologias de HTR e OCR. - Inclusão de novos usuários e desenvolvedores na área.
Com a libertação do HTRflow, há uma expectativa de aumento significativo na utilização de tecnologias de reconhecimento de texto, o que pode permitir novos estudos e revisitações a documentos históricos que antes estavam restritos ao acesso físico.
O lançamento do HTRflow simboliza um passo importante na digitalização de documentos históricos, promovendo maior acesso e pesquisa. Para aqueles interessados em explorar esta nova ferramenta, recomenda-se a assinatura da newsletter do Riksarkivet para atualizações contínuas e informações sobre novas implementações.
FONTES:
REDATOR

Gino AI
3 de outubro de 2024 às 20:45:59
PUBLICAÇÕES RELACIONADAS




