Contenido Exclusivo

La biblioteca más grande del mundo se vuelve digital

La CIO Judith Conklin analiza la digitalización y la migración a la nube en curso de la Biblioteca del Congreso de Estados Unidos, considerada “la más grande del mundo”, un esfuerzo masivo para hacer que más de sus 170 millones de activos estén disponibles para todos.

La CIO Judith Conklin tiene una gran tarea: migrar la biblioteca más grande del mundo a la nube.

Conklin, quien fue ascendida de CIO adjunto en septiembre después de que el ex CIO, Bernard Barton se jubilara, lidera la transformación digital de cinco años de la Biblioteca del Congreso (Library of Congress, LOC) de Estados Unidos, que hará que la institución migre millones de libros, colecciones históricas y materiales a un ambiente de nube híbrida compleja.

La medida es parte de un plan estratégico de TI lanzado en 2019 para digitalizar y poner a disposición del público gran parte de los más de 170 millones de activos físicos de la LOC desde cualquier dispositivo.

“A medida que el mundo editorial y el mundo de las bibliotecas en general se vuelven más digitales, la Biblioteca del Congreso se vuelve más digital”, explica Conklin, quien supervisa a aproximadamente 400 empleados en la Oficina del CIO, incluidos alrededor de 200 contratistas.

La Biblioteca del Congreso, que se encuentra en tres edificios –Madison, Adams y Jefferson–, “ingiere” nuevos datos y metadatos físicos y digitales continuamente. Si bien el objetivo no es digitalizar el 100 % de sus materiales, la transformación sigue siendo amplia y compleja, dice Conklin. “Hay datos que mantendremos en las instalaciones y luego hay algunos que queremos obtener las eficiencias… y la elasticidad… de la nube”.

George Westerman, científico investigador principal y profesor titular de la Sloan School of Management del MIT, dice que la ambiciosa empresa beneficia a toda la sociedad.

“Es impresionante cómo la LOC pretende ‘abrir el cofre del tesoro’ a través de lo digital, para que los diversos artefactos de la biblioteca estén disponibles para ciudadanos, maestros e innovadores de todo el país sin necesidad de que vengan a DC”, asevera Westermen.

Transformando la Biblioteca del Congreso

La LOC inicialmente trajo a Accenture para ayudar a planificar la transformación de su centro de datos, ahora completa. Este esfuerzo de tres años implicó trasladar más de 130 sistemas y aplicaciones de TI de bibliotecas de un centro de datos “obsoleto” en el edificio Madison a un centro de datos Tier III de última generación fuera de Washington, DC, así como a otros centros de datos y servicios en la nube administrados por la biblioteca y conectados a través de una WAN de rutas múltiples.

Judith Conklin, CIO, Biblioteca del Congreso
Judith Conklin, CIO de la Biblioteca del Congreso de Estados Unidos.

Con este entorno empresarial en la nube, la biblioteca ahora se está enfocando en el Sistema de Derechos de Autor Empresarial (ECS) para la Oficina de derechos de autor, el proyecto del Sistema Integrado de Investigación e Información (IRIS) para el Servicio de Investigación del Congreso (CRS) y varios proyectos para mejorar cómo la biblioteca acepta, administra y entrega el material de las colecciones, incluido un sistema de gestión de contenido audiovisual y una nueva plataforma de contenido de la biblioteca.

El proyecto ECS, que asignó datos de derechos de autor a uno de los grandes proveedores de la nube, aunque Conklin se negó a especificar cuál de los tres grandes, hará que el proceso de solicitud de derechos de autor sea más fácil y transparente. “Cada vez más personas quieren registrar sus materiales para obtener derechos de autor”, asevera Conklin, lo que lo convierte en un candidato principal para la escala y la eficiencia de la nube.

La Oficina de Derechos de Autor de Estados Unidos, que comprende varias divisiones, incluidas las recomendaciones de licencias y los registros públicos, se basa en una combinación de procesos manuales y aquellos que han sido automatizados a través de sistemas de TI que deben modernizarse. El Congreso asignó 60 millones para esta tarea y la biblioteca tiene un “plazo muy estricto” para completarla, dice Conklin. Se espera que entre en funcionamiento en octubre de 2024.

Conklin, que está renovando los procedimientos de gestión de proyectos de la biblioteca para la era digital, también se ha embarcado en un plan de almacenamiento digital de cinco años, que incluye “ingerir” o absorber muchas colecciones “nacidas digitales” que ingresan a la biblioteca en formato digital desde un variedad de fuentes, así como contenido digitalizado de ambas cámaras del Congreso.

La biblioteca ha estado almacenando datos digitalizados durante décadas en sistemas heredados tradicionales, incluidos muchos documentos y colecciones históricos importantes. Algunos documentos digitalizados permanecerán en las instalaciones y no todo estará a la vista del público.

“No es un objetivo digitalizar el 100 % de nuestras colecciones, y algunas personas están consternadas por eso”, dce Conklin, señalando que el presupuesto de la biblioteca no permite un almacén de datos digital infinito, aunque señaló que el Congreso se está relajando en hacer más datos públicos tras la aprobación de una ley hace dos años.

La Constitución de los Estados Unidos, por ejemplo, no se publicará en el sitio web de la Biblioteca del Congreso, adelanta Conklin. Sin embargo, la transformación digital de la biblioteca ha tenido un impacto en nuestra comprensión de la Constitución, ya que un conservacionista interno utilizó el análisis espectral de un borrador digitalizado de la Constitución para descubrir ediciones no descubiertas anteriormente.

“Analizaron capa tras capa de este borrador de la Constitución y dicen que encontraron ediciones… a la Constitución que no se conocían”, afirma Conklin, comparando el descubrimiento con activar cambios retroactivos.

La biblioteca también está incursionando en tecnologías experimentales de Inteligencia Artificial, como visión por computadora, aprendizaje automático y aplicaciones que se enfocan en clips de audio y artes visuales, muchas de las cuales están disponibles como software de código abierto.

Debido a que los datos y metadatos que ingresan a la Biblioteca del Congreso nunca terminan, el trabajo de transformación digital nunca se completará realmente. “Esa es la lucha de todo CIO”, asevera Conklin.

Pero sin duda, la Biblioteca del Congreso está a años luz de donde estaba cuando inició su transformación digital.

Paula Rooney, CIO.com

Lo Más Reciente

Tenable descubre nuevas técnicas de ataque en software de código abierto

El equipo de investigación de seguridad en la nube...

Shopperbot: robot mexicano que ayuda a tomar mejores decisiones de compra

Como parte de las soluciones para impulsar la hiperpersonalización...

Los ‘Scam-Yourself Attacks’ aumentan 614% en el tercer trimestre del año: informe

Los 'Scam-Yourself Attacks' o "ataques de estafa”, en los...

Newsletter

Recibe lo último en noticias e información exclusiva.

José Luis Becerra Pozas
José Luis Becerra Pozashttps://iworld.com.mx
Es Editor de CIO Ediworld México. Contáctalo en jbecerra@ediworld.com.mx o en el twitter @CIOMexico.

Tenable descubre nuevas técnicas de ataque en software de código abierto

El equipo de investigación de seguridad en la nube de Tenable descubrió nuevas técnicas de ataque en los Lenguajes Específicos de Dominio (DSLs, por...

“Mejorar la visibilidad en el ecosistema tecnológico, interno y de cara al cliente” : José Armando López Flores, CISO de Crediclub

“Queremos ser esa institución financiera que cubra con las expectativas de los clientes a través de garantizarles que su patrimonio estará seguro”. Con el objetivo...

Shopperbot: robot mexicano que ayuda a tomar mejores decisiones de compra

Como parte de las soluciones para impulsar la hiperpersonalización en la atención al cliente por medio de la tecnología, PepsiCo México desarrolló a Shopperbot....