Original English version of this blog post is available here: https://www.force11.org/infrastructure-series-digital-preservation/
Esta es la primera entrada en la serie anual de Blogs de FORCE11 sobre infraestructura académica- Se trata de una entrevista con el director ejecutivo de CLOCKSS, Craig Van Dyck .
Preservación digital
¿Por qué empezar nuestra serie sobre Infraestructura con la preservación digital? Por una razón, la naturaleza misma de los llamados archivos oscuros hace que organizaciones como CLOCKSS / LOCKSS aseguren la disponibilidad de contenidos académicos a largo plazo. Otra razón es porque la preservación digital es ampliamente aceptada dentro de la comunidad académica como fundamental.
Los objetivos del blog traen a la superficie el trabajo a menudo escondido sobre las infraestructuras y la conservación digital. En entradas posteriores, vamos a trabajar hacia atrás, en un sentido, desde la preservación a las tecnologías y funciones a lo largo del camino. Para obtener más información sobre otras organizaciones de preservación digital, por favor recurra a Registro.
ENTREVISTA CON CRAIG VAN DYCK
Entrevista realizada por Jennifer Kemp
¿QUÉ SIGNIFICA EL TÉRMINO 'INFRAESTRUCTURA' PARA USTED / SU ORGANIZACIÓN, EN EL CONTEXTO DE LA COMUNICACIÓn científica?
En el contexto de la comunicación científica, la infraestructura se refiere a los sistemas compartidos por varias partes para llevar a cabo sus actividades. Esto incluye hardware, software, estándares, mejores prácticas y contratos sociales, así como valores compartidos, objetivos y entendimiento. Muchos de estos son específicos sobre la comunicación científica, como la vinculación a través de Crossref , o los informes de uso de COUNTER . Por supuesto, la comunidad académica también se basa en la infraestructura básica de la sociedad, a través de carreteras, tuberías, e Internet.
¿CÓMO DESCRIBIR LO QUE HACE / CÓMO explicar LA PRESERVACIÓN DIGITAL DE LAS OBRAS A LAS PERSONAS NO ESTÁN FAMILIARIZADaS CON ELLA?
La preservación digital a largo plazo es necesaria porque el contenido en línea puede estar en riesgo de desaparecer, y los investigadores requieren un acceso continuo a los recursos que utilizan para llevar a cabo su propia investigación. Si, por cualquier razón, el contenido académico desaparece de la Web, y ya no está disponible para los investigadores, un sistema de conservación como el Archivo CLOCKSS puede intervenir y facilitar el acceso, en los casos en que nadie más podría. También hay que señalar que la preservación digital es cada vez más importante también fuera de la comunicación científica. Por ejemplo, las naciones y las comunidades pequeñas están digitalizando su patrimonio cultural, que debe ser preservado a largo plazo. Mi ejemplo favorito es un barrio mexicano-estadounidense que está siendo desplazado por la gentrificación.
¿CUÁL ES LA ÚNICA COSA QUE 'SILICON VALLEY' debería HACEr DE MANERA DIFERENTE con respecto a la PRESERVACIÓN DIGITAL?
La computación en nube se ha convertido en omnipresente en muchos entornos. Sin embargo, para la preservación digital a largo plazo, las compañías líderes no son necesariamente las mejores opciones. Su carácter comercial los hace menos dignos de confianza, y sus costos para el acceso al contenido (lo cual es importante para asegurar la validez de los bits) son demasiado altos. 'Silicon Valley' podría apoyar un consorcio que podría ofrecer una solución de nube sin fines de lucro, algo adecuado para la comunidad académica.
¿qué DESEAría QUE LA GENTE NO TÉCNICa entendiera CON RESPECTO A LOS DESAFÍOS DE LA preSERVACIÓN DIGITAL?
El hecho de que un recurso está disponible en la actualidad en la web, no significa que estará disponible mañana. Y la investigación académica es muy específica. Los investigadores tienen acceso continuo a los artículos específicos, y estos informan sobre un conjunto específico de actividades altamente especializadas de los investigadores. Es fácil de encontrar recursos en la Web que parecen proporcionar información sobre cualquier tema; pero el registro académico es el origen para obtener información validada revisada por pares.
¿CÓMO SE DIFERENCIA LA PRESERVACIÓN DIGITAL CUANDO SE TRATA DE TEXTO Y DATOS O REVISTAS, LIBROS, ETC.?
La literatura académica se está diversificando y es cada vez más dinámica: ya no es sólo acerca de revistas y libros. Los estudiosos de hoy están encontrando nuevas formas para expresar sus hallazgos. Multimedia, vías de comunicación controladas por el usuario, aplicaciones, bases de datos, imágenes en 3D, incluso realidad virtual son elementos de trabajos académicos. Y hay más contenido auxiliar como pre-prints, comentarios pospublicación y anotaciones, videos y podcasts. ¿Cuáles son los límites de “la literatura académica”? ¿Qué contenido debe ser preservado a largo plazo? ¿Cuáles son las soluciones técnicas para capturar, preservar y reproducir el contenido dinámico, y si hay compromisos, cómo hacer que las compensaciones sean claras para los autores y editores? Para un servicio de preservación digital, debemos apoyar la evolución de los géneros académicos
¿QUÉ OTRAS ÁREAS DE INFRAESTRUCTURA TRABAJAn MÁS ESTRECHAMENTE O SON MÁS DEPENDIENTES DE (Y CÓMO)?
CLOCKSS funciona a través de plataformas múltiples editores, cada uno de los cuales tiene sus propias características y peculiaridades especiales. Nos basamos en las mejores prácticas de los editores que nos proporcionen trabajo eficiente con el contenido de cientos de diferentes editoriales, por ejemplo, DOI, ISSN, ISBN, el formato XML JATS, ONIX, ORCID. Encontramos que las prácticas en la publicación de revistas están bastante bien establecidas y son predecibles, mientras que para los libros, por lo menos, se cuenta con poca uniformidad. Sin embargo, cuando trabajamos con las nuevas formas de contenido antes mencionados, no se han establecido normas, y las economías de escala aún no han sido alcanzables.
EXPLIque EN DETALLE EL PROBLEMA QUE CREE QUE ES EL MÁS IRRITANTE / INTERESANTE / CONSECUENCIAL / ETC.
En lo inmediato, probablemente el tema más interesante es entender las nuevas formas de contenido para preservar y cómo. Por ejemplo, si un libro en línea está en constante cambio, ver cuál es la versión que podemos preservar, o, si queremos preservar todas las versiones, ¿cómo podemos hacer eso de forma escalable, de forma sostenible? A largo plazo, todos tenemos que estar preocupados por el apoyo financiero para la preservación digital a largo plazo, lo que no suele ser una primera prioridad, ya que veces se olvida o se da por sentado. Otro aspecto que vale la pena mencionar es que muchos recursos digitales que las bibliotecas universitarias ponen a disposición de sus usuarios no están cubiertos por un sistema de preservación, tales como “literatura gris”, o periódicos y revistas de interés general.
EN UN MUNDO PERFECTO, ¿CÓMO SERÍA LA PRESERVACIÓN DIGITAL SERÁ FINANCIADO Y GOBERNADO?
Lo mejor es que cualquier esfuerzo sea financiado y gobernado por quienes se benefician. Sin embargo, es probable que no sea práctico ni deseable para los investigadores individuales gobernar directamente los fondos y la preservación digital. Afortunadamente, las bibliotecas de investigación y editoriales académicas están bien posicionadas para actuar como sustitutos de los investigadores, como ya lo hacen para el desarrollo de colecciones y para la publicación de revistas, por ejemplo. CLOCKSS se rige por un Consejo de 12 bibliotecas de investigación y 12 editoriales académicas, y es financiado por 300 bibliotecas académicas y 300 editoriales académicas. Se trata de un modelo sostenible.
¿CUÁLES SON SUS BLOGS FAVORITOS, CONFERENCIAS, CUENTAS DE TWITTER, ETC, PARA MANTENERSE AL TANTO DE LA PRESERVACIÓN DIGITAL?
Scholarly Kitchen de la Sociedad para la publicación académica Publishing (SSP), la Conferencia de Charleston , y las reuniones bianuales de la Coalición para la Información en Red (CNI) son tres recursos primarios estimables para mantenerse al día con la preservación digital.
cuál es su detalle FAVORITo POCO CONOCIDO O su HÉROE ANÓNIMO?
El software LOCKSS (LOCKSS significa muchas copias o mantener las cosas seguras) fue fundado en las bibliotecas de la Universidad de Stanford a finales de 1990 por Vicky Reich y David Rosenthal. No son anónimos! Lo que es poco apreciado es la similitud de LOCKSS a blockchain. Algunos argumentan que LOCKSS es la primera aplicación a gran escala del concepto blockchain. El Archivo CLOCKSS utiliza el software LOCKSS.
¿QUÉ PREGUNTA QUE DESEA le PREGUNTeMOS Y POR QUÉ?
¿Cuáles son las mejores oportunidades para mejorar significativamente el estado de la preservación digital? Una buena práctica para incrustar metadatos en contenido para que los rastreadores web tengan más información sobre lo que están encontrando. Además, las herramientas mejoradas para la captura y reproducción de contenido dinámico. Y, las economías de escala para los costos de almacenamiento. La Fundación Mellon ha apoyado con dinero de subvenciones prensas universitarias y agencias de conservación para ayudar a lidiar con estos desafíos.