Diseño e implementación del primer servicio genérico de almacenaje de archivos para datos de investigación en Alemania

16 octubre, 2020

Design and Implementation of the first Generic Archive Storage Service for Research Data in Germany

Felix Bach, Björn Schembera, Jos van Weze

International Journal of Digital Curation, ISSN 1746-8256, Vol. 15, n. 1, 2020

Los datos de investigación, como un bien valioso en la ciencia, deben ser salvaguardados y subsecuentemente encontrables, accesibles y reutilizables por razones de una conducta científicamente apropiada por un periodo de tiempo de varios años. Sin embargo, gestionar un almacenaje a largo plazo de los datos de investigación es una carga para instituciones e investigadores. Debido a su tamaño y a la conservación requerida, los proveedores de almacenaje son difíciles de encontrar. Para solventar este problema, el proyecto bwDataArchive comenzó a desarrollar un archivo de datos de investigación a largo plazo que es confiable, rentable y capaz de almacenar múltiples petabytes de datos. El hardware consiste en un almacenaje de cintas magnéticas, integrado con cachés y nodos de disco para el movimiento y acceso de datos. Por su parte, el software, High Performance Storage System (HPSS), fue elegido por su probada capacidad de almacenaje confiable de grandes cantidades de datos. Sin embargo, la implementación de bwDataArchive no depende de HPSS. Para su autenticación, bwDataArchive se integró en la gestión de identidades federada para las instituciones educacionales en el estado de Baden-Württemberg en Alemania. El archivo proporciona la protección de los datos a través de una copia dual en dos lugares distintos con diferentes tecnologías de cinta, accesibilidad a los datos con protocolos habituales de almacenaje, conservación asegurada durante más de diez años, preservación de datos con suma de verificación y capacidades de gestión de los datos apoyada por una estructura de directorio flexible que permite compartir y publicar. En septiembre de 2019 bwDataArchive tenía unos fondos de 9 petabytes y 90 millones de archivos, y mantiene un incremento constante de su utilización por usuarios de muchas comunidades.

http://www.ijdc.net/article/view/553

Traducción del resumen de la propia publicación

Comparte: Share on FacebookShare on Google+Tweet about this on TwitterShare on LinkedIn

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *