Resumen— Las Bibliotecas Digitales (BiDi) se están convirtiendo

Transcripción

Resumen— Las Bibliotecas Digitales (BiDi) se están convirtiendo
BIBLIOTECA DIGITAL COLOMBIANA
Edwin Montoya, Patricia Ospina, Malgorzata Lisowska y Blessed Ballesteros
Resumen— Las Bibliotecas Digitales (BiDi) se están
convirtiendo en el principal medio para dar visibilidad y
acceso a la producción académica y científica de nuestras
instituciones; afrontando muchos inconvenientes para
que sus colecciones digitales sean visibles en Internet.
Factores tecnológicos (protocolos, formatos, ancho de
banda entre otros) así como el desarrollo dispar de los
recursos humano, económico y social de las instituciones
colombianas conducen a un aislamiento y falta de
integración de iniciativas institucionales, regionales y
nacionales.
La Biblioteca Digital Colombiana (BDCOL) es una
iniciativa que pretende conformar una red de
Repositorios y Bibliotecas Digitales en Colombia, que
permita dar visibilidad a la producción científica,
académica y cultural, de Universidades, Centros de
Investigación, Bibliotecas Públicas y Privadas y demás
entidades comprometidas con el progreso del país.
BDCOL pretende fomentar la creación de repositorios
institucionales mediante acciones de capacitación,
asesoría y transferencia tecnológica, de tal manera que
permita posicionar a Colombia como un país líder en la
región en la conformación de redes de información. El
proyecto fue en su primera fase desarrollado por 13
universidades y continuará en su segunda fase, la cual
pretende aumentar significativamente el número de
repositorios y de documentos digitales, a la vez que se
interconecta a iniciativas internacionales. BDCOL puede
accederse
desde
el
portal
en
Internet
http://www.bdcol.org donde todo el contenido indexado
allí es de acceso libre.
I. INTRODUCCIÓN
La búsqueda y recuperación de información digital en
Internet ha sido ampliamente dominada por los buscadores
como Google, pero éstos han estado centrados
principalmente en la indexación de la Web sin tener en
cuenta información semántica de los datos, por ejemplo
organización por colecciones, tipologías documentales o
Edwin Montoya, Investigador principal proyecto BDCOL. Universidad
EAFIT (Medellín-Colombia); e-mail: [email protected].
Patricia Ospina, Investigadora proyecto BDCOL. Universidad EAFIT
(Medellín-Colombia); e-mail: [email protected]
Malgorzata Lisowska, Investigadora BDCOL. Universidad del Rosario
(Bogotá-Colombia); e-mail: [email protected]
Blessed Ballesteros, Investigador BDCOL. Universidad del Norte
(Barranquilla-Colombia); e-mail: [email protected]
.
incorporación de metadatos objetivos planteados de la Web
Semántica, pero todavía en desarrollo. Las Bibliotecas
Digitales (BiDi) y Repositorios Digitales (ReDi) se están
convirtiendo en el principal medio de acceso a la
información digital dada su naturaleza de organización y
estructuración. Es igualmente, el principal medio para que
una institución, región o país tenga mayor visibilidad y
reconocimiento de su producción académica y científica.
Una BiDi o ReDi están compuestas por una o más
colecciones organizadas y clasificadas por metadatos de
documentos digitales que a través de un conjunto de
servicios digitales, permite a los usuarios acceder a
información relevante de acuerdo a su necesidad de
información.
Por lo tanto el primer reto para una institución es la
conformación de un repositorio digital que permita
almacenar y gestionar documentos digitales. Se encuentra
acá la primera dificultad en Colombia, ya que son muy pocas
las instituciones que han acometido procesos
de
conformación de estos proyectos, justificando este hecho en
factores como desconocimiento del tema, poco contenido
digital disponible, comprensión de conceptos como derechos
de autor y propiedad intelectual y finalmente el
desconocimiento de plataformas software.
Los beneficios más impactantes de estos repositorios, se
ven representados cuando estos se unen para conformar
redes de bibliotecas y repositorios digitales, por diferentes
intereses y coberturas. Desde redes regionales, nacionales e
internacionales, hasta redes temáticas por algún tipo de
tipología documental. El nivel de desarrollo a nivel
internacional es importante, implementándose redes
nacionales como la presente en México llamada “Red
Abierta de Bibliotecas Digitales – RABID” [1], la de Brasil
llamada “Biblioteca Digital Brasileira de Teses e
Dissertações - BDTD” [2], en Europa con el proyecto
DRIVER [3], España con el proyecto Recolecta [4] o la Red
Mundial de Tesis y Disertaciones (NDLTD) [5].
Con la Biblioteca Digital Colombiana – BDCOL [6],
comenzamos a resolver ambas dificultades; primero el
fomento a la conformación de Repositorios y Bibliotecas
Digitales en Colombia, a través de diferentes frentes como
capacitación, asesoría y fomento al desarrollo de contenido
digital en nuestras instituciones. Respecto a la capacitación
se ha impartido un curso virtual sobre bibliotecas digitales,
además de realizar algunos talleres de plataformas para
repositorios digitales con la tecnología de software abierto
(DSpace [7]). Respecto al segundo punto, en si misma
BDCOL, tiene como objetivo principal conformar la red
nacional de bibliotecas y repositorios digitales, que permita
integrar en un solo portal, toda la producción científica,
académica, cultural, patrimonial entre otros de las
instituciones comprometidas con el desarrollo del país.
Ambas líneas de acción serán detalladas en los numerales a
continuación.
II. POLÍTICAS
BDCOL ha definido un conjunto de políticas que
permitirá a los miembros o usuarios conocer las condiciones
de ingreso a la red. A continuación se listan las principales:
BDCOL se define como una Red de Bibliotecas y
Repositorios Digitales, con el objetivo de dar visibilidad
nacional e internacional a la producción académica,
científica, cultural y social de Colombia. Pertenecen a
BDCOL instituciones educativas, centros de investigación,
centros de documentación, organismos gubernamentales y
no gubernamentales, archivos y bibliotecas en general;
fomentando el uso de la red RENATA.
BDCOL se define como una red de acceso abierto, es
decir, los usuarios pueden acceder libremente al contenido
indexado por BDCOL.
BDCOL pretende indexar todas las instituciones que
posean al menos un repositorio abierto y que cumpla con las
políticas y estándares definidas para la red.
BDCOL buscará integrarse a redes internacionales que
permitan no solo aumentar la visibilidad sino beneficiar a los
usuarios de BDCOL con el aumento significativo de
contenidos digitales al estar conectados a estas redes
internacionales.
BDCOL es de acceso abierto. Todo el contenido es de
libre descarga para sus usuarios.
Los usuarios de BDCOL, serán personas naturales,
Instituciones o gremios colombianos o internacionales
interesados en consultar los contenidos digitales
recolectados vía Internet.
• OAI-PMH: Open Archives Iniciative – Protocol for
Metadata Harvester. Versión 2.0
• HTTP: Hipertexto Transfer Protocol. Versión 1.1
B. Colecciones BDCOL
Se han definido las siguientes colecciones en BDCOL, las
cuales principalmente siguen un modelo de tipología
documental y representada por las siguientes categorías:
Tesis y Disertaciones, Artículos, Revistas, Objetos y
Recursos de Aprendizaje, Multimedia, Libros, Literatura
Gris, Documentos Históricos, Patrimonial o Cultura, y
finalmente General.
C. Modelos de metadatos
BDCOL ha adoptado la Iniciativa de Metadatos Dublin
Core (Dublin Core Metadata Initiative – DCMI) [9]. Este
modelo permite describir recursos digitales en Internet y es
ampliamente utilizado en bibliotecas y repositorios digitales.
Dublin Core – DC, en su estructura básica, propone dos
conjuntos de elementos para metadatos: a) Dublin Core
Metadata Element Set - DCMES, versión 1.1 [10] y b)
DCMI Metadata Terms [11]
Actualmente se han desarrollado estándares de metadatos
para las colecciones: tesis (adaptado de ETD-MS [8] del
proyecto NDLTD[5]), artículos, multimedia, monográficos y
patrimonial. Para el caso de objetos de aprendizaje se ha
adoptado el estándar LOM-CO definido por el Ministerio de
Educación Nacional de Colombia.
Colección
BDCOL
Tesis y
Disertaciones
Modelo de
Metadatos
ETD-MS
Objetos de
Aprendizaje
LOM-CO
Multimedia
DC-MM
Artículos
DC-AR
Revistas
DC-RE
Monográfico
DC-MO
Ponencias y
Literatura
Gris
Histórico,
Patrimonial y
Cultural
General
DC-PL
III. ESTÁNDARES
Todo repositorio que se desee conectar a BDCOL deberá
cumplir un conjunto de estándares que permiten los niveles
mínimos de interoperabilidad. En la primera fase de
BDCOL, se ha concentrado en definir un conjunto básico de
protocolos de comunicaciones entre repositorios y un
modelo de metadatos para la descripción de las diferentes
tipologías documentales.
A. Protocolos de comunicación
Se han definido inicialmente dos (2) protocolos de
comunicación que soportará el portal BDCOL bajo el
modelo de Recolección. Cada uno de los repositorios se
define como un “Proveedor de datos” en uno de los
siguientes protocolos:
DC-HI
DC-GE
Descripción
Interoperability Metadata Standard for
Electronic Theses and Dissertations
version 1.00, revision 2.
Estándar basado en Dublin Core.
Learning Object Model – Colombia.
Estándar IEEE para objetos de
aprendizaje, que puede ser descrito en
Dublin Core, y definido para Colombia
(Adoptado de la propuesta del Ministerio
de Educación Nacional de Colombia)
Estándar basado en Dublin Core para
Multimedia
Estándar basado en Dublin Core para
artículos
Estándar basado en Dublin Core para
Revistas
Estándar basado en Dublin Core para
material digital monográfico
Estándar basado en Dublin Core para
Ponencias y Literatura Gris.
Estándar basado en Dublin Core para
material histórico, patrimonial y cultural
Documentos en general contenidos en
repositorios
Tabla 1. Metadatos definidos para BDCOL
IV. ARQUITECTURA Y PLATAFORMA
TECNOLÓGICA
A. Arquitectura de Integración
Básicamente existen dos modelos de integración de
repositorios y bibliotecas digitales:
1) Por recolección: en el cual el servidor (Recolector)
se conecta periódicamente a los repositorios (Proveedor de
Datos) para acceder a los metadatos. Se utiliza un modelo
basado en protocolos como OAI-PMH o HTTP.
2) Búsquedas en línea: en el cual, el servidor recibe las
consultas por parte de sus usuarios, estas mismas consultas
se aplican en cada uno de las bibliotecas digitales
registradas. Se utilizan de amplia forma protocolos como
Z39.50, SRU y SRW. En muchos contextos esta forma de
integración se conoce como Metabuscadores.
En la fase 1 de BDCOL, se adoptó un modelo por
Recolección utilizando protocolos OAI-PMH y HTTP, y
esquemas de codificación de metadatos OAI_DC y
OAI_ETD para OAI y RDF_DC para HTTP. A continuación
se presenta un esquema gráfico de la arquitectura de
BDCOL:
Fig. 1. Arquitectura de BDCOL
B. Plataforma Tecnológica
Como parte del proyecto BDCOL, se ha adaptado y
desarrollado una plataforma software que permite cumple
con las siguientes funcionalidades:
Implementación del protocolo OAI-PMH tanto como
Recolector y como Proveedor de datos hacia otras redes
nacionales o internacionales en formato OAI con DC,
ETD y LOM-CO
•
Implementación del protocolo HTTP como
Recolector de metadatos en formato RDF_DC
•
Plataforma Multicolección, esto es permite recolectar
diferentes colecciones o tipologías documentales.
•
Gestión de Repositorios. Permite crear, modificar,
listar o borrar repositorios digitales de BDCOL. Permite
especificar protocolos, modelos de metadatos, URLs. En
la versión inicial de BDCOL, solo los administradores de
BDCOL pueden registrar los repositorios, se espera que
en fases posteriores, las mismas instituciones puedan
registrar y probar el cumplimiento de los estándares de
BDCOL.
•
Portal BDCOL. Permite a los usuarios realizar una
serie de servicios como:
o
Búsqueda de información. Búsqueda básica por
un término, búsquedas avanzadas por titulo, autor,
temas, colecciones y repositorios.
o
Navegación por Colección/Repositorio.
o
Estadísticas de cantidad de documentos por
colección y repositorios.
o
Tecnologías Web 2.0 como RSS, Comentarios,
Tagging, Notificación, Personalización, entre otros.
•
El portal BDCOL se puede acceder desde la dirección:
http://www.bdcol.org y presenta una interfaz de usuario
similar a la mostrada en la figura 2.
Fig. 2. Interfaz Web de consulta en BDCOL
C. Proyecto Piloto
Como resultado de la fase 1 de la red BDCOL, se han
interconectado 10 de las 13 universidades pertenecientes al
proyecto, adicional a otros repositorios como el de la
Biblioteca Nacional de Colombia. En total se han integrado
16 repositorios (algunas instituciones poseen más de un
repositorio). La fase 1 contiene cerca de 10.000 documentos
digitales, pertenecientes a: Tesis (1200 documentos),
Artículos(4000 documentos) y Colección General con 3700
documentos.
Se espera integrar a BDCOL los nuevos repositorios
institucionales, además de realizar la interconexión con el
Banco Nacional de Objetos de Aprendizaje, gestionado por
el Ministerio de Educación Nacional de Colombia, el cual
contiene unos 1000 Objetos de Aprendizaje.
V. ADMINISTRACIÓN
Se está proponiendo la conformación de una comunidad u
organización que realice diferentes funciones. Debe ser
virtual, gestionada a través de la red, con algunas reuniones
presenciales. A continuación se presenta la propuesta de
organización para BDCOL:
para participar activamente en proyectos de integración de
redes internacionales en Latinoamérica, Europa y USA.
BDCOL no solo soluciona el problema tecnológico de
integración de repositorios, sino que pretende crear una
comunidad de bibliotecas digitales en Colombia, que
promueva el desarrollo de políticas, normas y estándares
para el contenido digital. Este proyecto fue realizado por 13
universidades, las cuales han creído que parte del desarrollo
de un país se encuentra en la democratización del
conocimiento a través de este tipo de iniciativas.
VIII. PARTICIPANTES
Fig. 3. Organización en BDCOL
VI. TRABAJO FUTURO
En el corto plazo se prevé dos líneas futuras de trabajo. La
primera línea representada por la presentación de la Fase 2
de BDCOL a la convocatoria Colciencias No 487 de 2009.
La fase 2 para esta convocatoria tiene como objetivo general
“Crear una plataforma integrada de Biblioteca Digital que
ofrezca Servicios Avanzados e implemente los estándares
definidos en BDCOL, de tal manera que facilite la
conformación de los repositorios institucionales y permita
consolidar la red nacional de repositorios y bibliotecas
digitales, aumentando el número de instituciones y
repositorios pertenecientes a la Biblioteca Digital
Colombiana utilizando la red de alta velocidad RENATA.”,
a grandes rasgos esta fase pretende aumentar el número de
repositorios y contenidos digitales, a la vez buscar la
integración a redes internacionales.
VII. CONCLUSIONES
La Biblioteca Digital Colombia, BDCOL, representa un
gran esfuerzo para consolidar en Colombia los repositorios
digitales, y por consiguiente la conformación de una red
nacional de estos repositorios. Este esfuerzo permitirá a
Colombia mejorar sus indicadores de visibilidad de toda la
producción científica, académica, cultural y patrimonial
entre otras que estará almacenada en los repositorios
institucionales. BDCOL pretende ser una red abierta y
participativa, en la cual en la medida que las instituciones
vayan desarrollando sus repositorios, éstos puedan integrarse
a BDCOL. También con este proyecto, Colombia queda a la
vanguardia de iniciativas similares en la región y se habilita
El proyecto BDCOL ha sido desarrollado por las
siguientes Universidades: Universidad de la Sabana,
Universidad de la Salle, Corporación Universitaria Minuto
de Dios, Universidad del Rosario, Universidad Nacional de
Colombia, Universidad del Norte, Universidad Autónoma
del Caribe, Universidad ICESI, Universidad Santiago de
Cali, Universidad Autónoma de Occidente, Universidad
EAFIT, Universidad de Antioquia, Universidad de Medellín
IX. AGRADECIMIENTOS
El proyecto BDCOL ha sido financiado por el Ministerio
de Educación Nacional y la Red Nacional de Tecnología
Avanzada (RENATA), a través de la convocatoria
Colciencias No 397 de 2007.
REFERENCIAS
[1] “Red Abierta de Bibliotecas Digitales” (RABID),
México, en http://ict.udlap.mx/rabid/
[2] “Biblioteca Digital de Teses e Dissertações” (BDTD),
Brasil, en http://bdtd2.ibict.br/
[3] “Digital Repository Infrastructure Vision for European
Research”
(DRIVER),
en
http://www.driverrepository.eu/
[4] “Recolector de Ciencia Abierta” (RECOLECTA),
España, en http://www.recolecta.net
[5] “Networked Digital Library of Theses and
Dissertations” (NDLTD), en http://www.ndltd.org
[6] “Biblioteca Digital Colombiana” (BDCOL), Colombia,
en http://www.bdcol.org
[7] “Plataforma Abierta de Repositorios Digitales”,
DSpace, MIT & HP, en http://www.dspace.org
[8] ETD-MS: an Interoperability Metadata Standard for
Electronic
Theses
and
Dissertations,
en:
http://www.ndltd.org/standards/metadata/etd-ms-v1.00rev2.html
[9] Dublin Core Metadata Initiative (DCMI) en:
http://dublincore.org/
[10] Dublin Core Metadata Element Set version 1.1, en:
http://dublincore.org/documents/dces/
[11] DCMI
Metadata
Terms,
en:
http://dublincore.org/documents/dcmi-terms/

Documentos relacionados