Etiqueta: Clasificación

Catálogos y la recopilación y ordenación del conocimiento (II): debates sobre las practicas de catalogación en el British Museum y el predecesor del Public Record Office de Gran Bretaña, ca. 1750-1850

Catalogues and the Collecting and Ordering of Knowledge (II): Debates about Cataloguing Practices in the British Museum and the Forebears of the Public Record Office of Great Britain, ca. 1750-1850

 

Heather Macneil

Archivaria, ISSN 0318-6954, n. 84, 2017, p. 1-36

Entre 1750 y 1850, las colecciones importantes de libros,  objetos y documentos se han convertido en parte del patrimonio  cultural de los Estados-nación postrevolucionarios o reformados de Europa occidental, lo cual ha generado debates a cerca de la recopilación y la organización del saber en un momento en el que las bibliotecas, los museos y los archivos, recientemente nacionalizados, comenzaban a posicionarse como instituciones del saber público (más…)

Clasificación semántica y visual de documentos digitales

Classificació semàntica i visual de documents digitals

Marçal Rusiñol

Item: revista de biblioteconomia i documentació, ISSN 0214-0349, n. 65-66, juliol-desembre 2018 / gener- juny 2019, p. 74-87

Se analizan los sistemas de procesamiento automático que trabajan sobre documentos digitalizados con el objetivo de describir los contenidos. De esta forma contribuyen a facilitar el acceso, permitir la indización automática y hacer accesibles los documentos a los motores de búsqueda. El objetivo de estas tecnologías es poder entrenar modelos computacionales que sean capaces de clasificar, agrupar o realizar búsquedas sobre documentos digitales. Así,  se describen las tareas de clasificación, agrupamiento y búsqueda. Cuando utilizamos tecnologías de  inteligencia artificial en los sistemas de clasificación esperamos que la herramienta nos devuelva etiquetas semánticas;  en sistemas de agrupamiento que nos devuelva documentos agrupados en clusters significativos; y en sistemas de búsqueda esperamos que dada una consulta, nos devuelva una lista ordenada de documentos en función de la relevancia. A continuación se da una visión de conjunto de los métodos que nos permiten describir los documentos  digitales, tanto de manera visual (cuál es su apariencia), como a partir de sus contenidos semánticos (de qué hablan).  En cuanto a la descripción visual de documentos se aborda el estado de la cuestión de las representaciones numéricas de documentos digitalizados  tanto por métodos clásicos como por métodos basados en el aprendizaje profundo (deep learning).  Respecto de la descripción semántica de los contenidos se analizan técnicas como el reconocimiento óptico de caracteres (OCR); el cálculo de estadísticas básicas sobre la aparición de las diferentes palabras en un texto (bag-of-words model); y los métodos basados en aprendizaje profundo como el método word2vec, basado en una red neuronal que, dadas unas cuantas palabras de un texto, debe predecir cuál será la siguiente palabra. Desde el campo de las ingenierías se están transfiriendo conocimientos que se han integrado en productos o servicios en los ámbitos de la archivística, la biblioteconomía, la documentación y las plataformas de gran consumo, sin embargo los algoritmos deben ser lo suficientemente eficientes no sólo para el reconocimiento y transcripción literal sino también para la capacidad de interpretación de los contenidos.

Resumen elaborado por María Osuna González

 

El nacimiento de un encabezamiento de materia

Anna M. Ferris

Library Resources & Technical Services, ISSN 0024-2527, Vol. 62, n. 1, 2018, p. 16-27

Un aspecto esencial de la clasificación es la creación del encabezamiento de materia, por el que todos los materiales incluidos en el catálogo referentes a ese tema se regirán. Esto tiene dos claros beneficios: facilitar que todos los nuevos ítems que atañan a este tema se sitúen bajo un único término descriptivo y ayudar en las búsquedas de los usuarios. Las propuestas de nuevos encabezamientos de materia en la Library of Congres (LC) se producen a través de SACO. Este proceso puede ser intimidante. El artículo explica cómo funciona. (más…)