El proyecto IMPACT en la BNE

En la jornada del pasado 5 de octubre tuvo lugar una sesión de demostración de los resultados del proyecto IMPACT en la BNE, proyecto en el que ha colaborado junto a la Universidad de Alicante (sede tecnológica de la Biblioteca Virtual Miguel de Cervantes), y que ha centrado sus esfuerzos en mejorar los resultados del OCR (Reconocimiento Óptico de Caracteres) sobre textos impresos antiguos. Una de las claves de este proyecto viene dada por su propio nombre: “Improving Access to Text” = «Mejorar el Acceso al Texto”.

El evento contó con la presencia de más de 70 participantes, entre los que estaban representados bibliotecas, archivos y empresas de digitalización de toda España, a la que acudieron tras ser convocados a través de un mailing global, el uso de foros como IWETEL y la propia página web de la Biblioteca.

Tras unas palabras de bienvenida de la Directora, en las que se recordó la labor difusora de la BNE y su voluntad de colaborar en proyectos de innovación, se sucedió un completo programa que se prolongó durante toda la jornada.

Para la ocasión se contó con la colaboración de varios ponentes relacionados directamente con IMPACT:

Katrien Depuydt y Jesse de Does, del Instituto Holandés de Lexicología (INL, Leyden)

Clemens Neudecker, de la Biblioteca Nacional de los Países Bajos (KB, La Haya)

Isabel Martínez Sempere y Xavier Ibars, de la Universidad de Alicante (UA)

Las intervenciones comenzaron con una introducción general del proyecto, explicando sus objetivos y su estructura orgánica, así como el entorno de trabajo utilizado por los socios para el desarrollo de servicios en las que se ha trabajado desde que se iniciara en enero de 2008 (Taverna, PRIMA, MyExperiment…).

Posteriormente se fueron mostrando algunas de estas herramientas utilizadas en la mejora de las imágenes (NCSR Image Enhancement Toolkit) con el fin de optimizar los resultados del OCR; la corrección colaborativa de dichos resultados (CONCERT, desarrollado por IBM); el análisis de elementos estructurales de los textos (Functional Extension Parser)…

Clemens Neudecker presentó además algunas de las mejoras que incorpora la última versión del motor OCR ABBY FineReader, algunos directamente relacionados con el propio proyecto IMPACT.
En las intervenciones de Katrien Depuydt y Jesse de Does se explicó el trabajo lingüístico realizado por los socios de IMPACT con el fin de construir diccionarios externos de asistencia a los motores de OCR, y léxicos para mejorar la Recuperación de la Información.

Isabel Martínez presentó los resultados preliminares que se han obtenido en el caso del español gracias al corpus aportado por la BNE y la Biblioteca Virtual Miguel de Cervantes. Clemens Neudecker, en su última intervención, presentó el futuro de IMPACT, que cristalizará en un Centro de Competencia cuyo lanzamiento tendrá lugar en la Final Conference, (British Library, 24-25 de octubre).

La BNE aprovechó la ocasión para dar cabida a una demo sobre un sistema de Reconocimiento de Texto Manuscrito (HTR) desarrollado por la Universidad Politécnica de Valencia, que corrió a cargo de Verónica Romero. Dicha demo despertó mucho interés entre todos los asistentes, así como entre los propios socios de IMPACT.

La jornada transcurrió de acuerdo al programa, con la inestimable aportación de los intérpretes, que también ayudaron a la hora de trasladar a los ponentes muchas de las preguntas que surgieron.

Todo el día se cubrió a través del twitter de la BNE. Las distintas intervenciones que se mostraron en la sesión estarán disponibles en los próximos días en el canal slideshare de la BNE y del propio proyecto IMPACT.

Más información:

Información sobre IMPACT en la BNE
Página del proyecto
Presentaciones de las jornadas en Slideshare

Comparte

Esta entrada tiene un comentario

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *