Laminasteoria_taller..

Transcripción

Laminasteoria_taller..
Taller de Manejo de Colecciones de
Datos y Metadatos para las Ciencias
E ló i
Ecológicas
y Ambientales
A bi t l
Santa Bárbara del Zulia,
Marzo de 2008
Zulay Méndez ([email protected])
Rodrigo Torréns ([email protected]
(t
@ l
)
Motivaciones del Taller
Este taller forma p
parte del entrenamiento necesario p
para q
que los
científicos, investigadores y gerentes de información de instituciones
vinculadas a la investigación científica, especialmente en el ámbito de
la ecología, clima y ambiente, adquieran los conocimientos básicos para
el manejo y gerencia de colecciones de datos y metadatos.
Con ello se persigue despertar el interés de los participantes en
preservar, difundir y compartir los datos que provienen de sus
investigaciones y esfuerzos; de este modo se busca evitar la duplicación
d esfuerzos
de
f
en la
l generación
g
ió de
d información
i f
ió y enfocar
f
l investigación
la
i
tig ió
hacia objetivos estratégicos.
Objetivos específicos del Taller
Los participantes aprenderán los conceptos básicos involucrados en el
manejo de datos y metadatos científicos y conocerán la importancia de
preservar los datos a largo
g p
plazo.
documentar y p
También conocerán algunas de las herramientas que existen para
p
a ubicar los
realizar diferentes tareas relacionadas y aprenderán
recursos de información disponibles en Internet que sean de su interés.
Base teórica
Sección 1. Datos y Metadatos. ¿Qué son? ¿Por qué son importantes?
Sección 2. Estándares de contenido para Metadatos. Lenguaje de
Metadatos para la Ecología (EML).
Sección 3. Gestión de datos ¿Dónde comenzar? Tareas iniciales.
Sección 4.
4 Herramientas para metadatos.
metadatos
Sección 5. Tareas para la creación de colecciones de datos.
Sección 6. Compartiendo los metadatos. Otros aspectos sobre los
metadatos.
Sección 1. Datos y Metadatos. ¿Qué son? ¿Por qué son importantes?
•
•
•
•
•
•
•
•
•
•
•
•
1.1 ¿Qué son los "datos"?
1 2 Datos científicos
1.2
científicos.
1.3 Degradación de los datos en el tiempo.
1.4 Uso de los datos científicos a largo plazo.
1 5 ¿Cómo
1.5
Có
llograr ell uso secundario
d i y a llargo plazo
l
d
de llos d
datos?
t ?G
Gestión
tió d
de D
Datos.
t
1.6 ¿Qué significa la palabra metadatos?
1.7 ¿Qué es una colección de datos?.
1.8 Preguntas que se deberían poder responder usando metadatos.
1.9 Aspectos fundamentales que describen los metadatos.
1.10 Formas o modelos básicos de metadatos
1.11 Importancia de los metadatos.
1.12 Ejemplos de metadatos y de comunidades que usan metadatos.
1.1 ¿Qué son los “datos”?
• Los datos constituyen registros de información de diferentes tipos que
pueden obtenerse de varias maneras: manualmente, automáticamente
a través de instrumentos, o a través de procesamiento realizado por
computadores.
computadores
• Por lo general están asociados o son producto de una investigación
científica.
1.2 Datos científicos
GEOESPACIALES
Datos georeferenciados que representan
en papel o digitalmente elementos o
características de la superficie terrestre a
diferentes escalas, tales como vías,
cursos de agua, límites
í
políticos,
í
escuelas, usos del suelo, etc; en
resumen, algo que se puede trazar.
http://main.nc.us/GIS/guide/spatial/
NO GEOESPACIALES
Datos numéricos, alfanuméricos o tipo
texto recabados en campo o registrados
por instrumentos.
i t
t Pueden
P d no tener
t
ubicación geo-espacial.
…1.2 Datos científicos
Ejemplos de datos geoespaciales:
Mapas
Situación Relativa
Local
Imágenes
áge es de satélite
saté te
N
Mi casa !!
…1.2 Datos científicos
Ejemplos de datos NO geoespaciales:
Datos discretos basados en tiempo
Datos tabulares en página web
Texto delimitado
1.3 Degradación de los datos en el tiempo
Ejemplo de degradación normal de los contenidos de información
asociados
i d con datos
d t a través
t é del
d l tiempo
ti
Momento de publicación
Contenidos de
Información
Detalles específicos acerca de la
recolección de los datos se pierden
al pasar el tiempo
Retiro o cambio de
carrera del científico
recolector
Accidente puede destruir
datos y documentación
Muerte del investigador y
subsecuente pérdida de
registros restantes
Tiempo
Tomado de: [Michener, 1997]
1.4 Uso de los datos científicos a largo plazo
Depende de que sean:
•Organizados
Organizados y de fácil acceso
•Consistentes
•Bien
Bi d
documentados
t d
•Facilidad de comprensión por parte
de usuarios
Si no se documentan los datos,
datos
pierden su valor y hay que
desecharlos.
Esto se traduce en pérdida de
esfuerzos, tiempo y dinero.
1.5 ¿Cómo lograr el uso secundario y a largo plazo de los
Datos científicos? Gestión de datos.
PROCESO DE GESTIÓN
Ó DE DATOS
1. Adquirir / capturar los
datos
2. Acceso del usuario a un
conjunto de datos comprensible
completamente documentado
recuperar-compartir datos
Valor agregado que ayuda a maximizar el retorno de la inversión
mediante la posibilidad de usar varias veces los mismos conjuntos de
datos
1.5 ¿Cómo lograr el uso secundario y a largo plazo de los
Datos científicos? Gestión de datos.
Herramientas organizativas y tecnológicas que pueden hacer posible
la gestión de datos:
Formación de Redes de colaboración entre científicos
y entre usuarios de información
Tecnologías de Información y Comunicaciones (TIC)
Uso de metadatos y estándares de intercambio de información
1.6 ¿Qué significa la palabra “metadatos”?
•"Datos sobre los datos“
•“..Conjunto común de términos y definiciones que describen las
principales propiedades o características de los datos”. (Díaz .,2003,p1)
•"Nivel superior de la información, o instrucciones que describen el
contenido,, contexto,, calidad,, estructura,, y accesibilidad de una colección
de datos específica" (Michener, 1997, p.331).
1.7 ¿Qué es una colección de datos?
Dos conceptos sencillos:
• Conjunto de datos de una misma clase.
• “Una colección de datos es una serie de observaciones recolectadas
con la misma metodología”
g
[LTER-Luquillo, 2001]
…1.7
1 7 ¿Qué es una colección de datos?
Ejemplo de dos colecciones de datos de una estación climatológica
1.8 Preguntas que se deberían poder responder usando metadatos
• ¿Qué describe la colección de datos?
• ¿Quién produjo la colección de datos?
• ¿Por
P qué
é ffue creada
d la
l colección?
l ió ?
• ¿Cómo se creó la colección de datos?
• ¿Cuan confiables son los datos?
• ¿Cómo sería posible obtener una copia de la colección de datos?
• ¿Quién escribió los metadatos?
1.9 Aspectos fundamentales que describen los metadatos
Los Metadatos describen diferentes aspectos de los datos, incluyendo:
• Identificación: ¿cual es el nombre de la colección de datos
(dataset)? ¿Quien creó la colección?, ¿que área geográfica cubre?.
• Qué temas se incluyen, ¿cuan actualizada está la información?
¿Hay restricciones para acceder o usar los datos?.
• Calidad de los datos: ¿cuan buenos son los datos? ¿Existe
información que permite a los usuarios decidir si los datos se
adaptan a sus propósitos? ¿Qué exactitud tienen los datos? ¿Los
d t están
datos
tá completos?
l t ? ¿Cómo
Có
se puede
d verificar
ifi
l consistencia
la
i t
i
de los datos?.
… 1.9 Aspectos fundamentales que describen los metadatos
• Información sobre entidades y atributos: ¿qué información
(parámetros, variables, columnas de datos) está incluida? ¿ Cómo
está codificada o formateada la información? ¿Qué codificación se
usó?.
ó?
• Distribución: ¿quien posee los datos? ¿A quien se los puedo pedir?
¿En q
¿
qué formatos están disponibles?
p
¿
¿Están disponibles
p
en
Internet? ¿Cuanto cuestan los datos?.
[ De: http://www.main.nc.us/GIS/guide/using/tutp6nsdi.html
http://www main nc us/GIS/guide/using/tutp6nsdi html ]
1.10 Formas o modelos básicos de metadatos
a)
b)
c)
Mc
M
D
M1
M
D
D
Metadatos como parte de los
datos (Datos de catalogación
dentro de un libro))
D=Dato
M M t d t
M=Metadato
M2
Metadatos externos al
recurso de información
((Ficha bibliográfica
g
en una
biblioteca)
D
Meta-metadatos (colecciones
de metadatos)
…1.10 Formas o modelos básicos de metadatos
Publisher's Cataloging In Publication Data (Prepared by
Quality Books, Inc.)
B ll P
Bell,
Patricia
t i i J
J.
Roughing it elegantly: a practical guide to canoe camping / by Patricia J.
Bell ;
illustrated by Linda Oliver Isakson
Isakson. -2nd
2nd ed
ed.
p. cm.
Includes bibliographical references and index.
LCCN: 93-74305
ISBN 0-9618227-0-8
1. Camping-United States2. Camping-United States-Equipment and supplies
3. Canoes and canoeing-United States I. Title
GV790.B45 1994
796.54'0973
QBI96-86
Metadatos externos al
recurso de información
ó
(Ficha bibliográfica en una
biblioteca)
…1.10 Formas o modelos básicos de metadatos
Modelo de un catálogo de colecciones (meta-metadatos):
Mc
M1
D1
Mc
Colección de datos y metadatos
M2
D2
Catalogo de colecciones
Mn
Metadatos de colección
Dn
Colección de Datos
…1.10 Formas o modelos básicos de metadatos
Ejemplo de catálogo de colecciones (en internet):
[ http://gce-lter.marsci.uga.edu/lter/asp/db/data_catalog.asp ]
1 11 IImportancia
1.11
t
i d
de llos metadatos
t d t
• Facilitar el procesamiento, análisis y modelado de los datos: Dada la
naturaleza
l
di á i de
dinámica
d los
l datos
d
en un entorno de
d red,
d una vez creados
d
pueden ser utilizados por múltiples sistemas y para diferentes propósitos.
• Facilitar la determinación de la conveniencia de los datos para cumplir con
un objetivo específico: Los metadatos son consecuentemente un requisito
esencial para localizar los datos y productos, evaluarlos y conocer cual es
su actual disponibilidad.
• Organizar y mantener el acervo del conjunto de datos de una
organización: Los metadatos ayudan a organizar y mantener las grandes
inversiones en datos, evitan la duplicación de esfuerzos y proveen, la
información sobre la posesión de datos y productos de una organización
(Valor agregado).
… 1.11
1 11 Importancia
I
t
i d
de los
l metadatos
t d t
• Los
os metadatos
etadatos puede
pueden ayuda
ayudar a los
os ccientíficos,
e t cos, a los
os investigadores,
est gado es, a
al
estudiante, al planificador, al político, y en general, al ciudadano común a
encontrar y utilizar los datos que apoyen las investigaciones y la toma de
decisiones. También benefician al creador de ellos y a mantener el valor
de los mismos y poder asegurar su uso continuo a lo largo del tiempo.
• E
En consecuencia,
i la
l utilización
tili ió y manejo
j de
d metadatos
t d t respaldado
ld d por
estándares nacionales, guías y políticas, beneficia el crecimiento
económico y los intereses sociales y ambientales de una nación.
1.12 Ejemplos de metadatos y de comunidades que usan metadatos
•
•
•
•
•
Bibliotecas.
Científicos.
Organizaciones gubernamentales.
gubernamentales
Negocios, Comercio Internacional.
dust a, etc.
etc
Industria,
… 1.12
1 12 Ejemplos de metadatos y de comunidades que usan metadatos
Documentación de datos
g
ecológicos
… 1.12 Ejemplos de metadatos y de comunidades que usan metadatos
Metadatos Geoespaciales
http://cndg.clearinghouse.gub.uy/
… 1.13
1 13 Ejemplos de metadatos y de comunidades que usan metadatos
Muestra metadatos Sistema de
Información de Biodiversidad de
Colombia
http://www.siac.net.co/sib/metadatos
Sección 2. Estándares de contenido para Metadatos.
Lenguaje de Metadatos para la Ecología (EML)
•
•
•
•
•
2.1 ¿Para qué estándares? ¿Cuales estándares existen?.
2.2 Lenguajes y formatos de representación de metadatos.
2.3 Ecological Metadata Language (EML).
2.4 Características básicas de EML.
2 5 Recursos en el Web sobre estándares y EML.
2.5
EML
2.1 ¿Para qué estándares? ¿Cuáles estándares existen?
Un estándar establece un sistema común de terminología y de definiciones
para documentar datos.
El objetivo en un estándar de metadatos será mejorar la organización y
administración de los datos, y proveer información sobre los datos
disponibles en una organización a terceros.
El estándar de metadatos instrumenta a un productor o usuario con la
información apropiada para caracterizar los datos haciendo posible la
catalogación de los conjuntos de datos que facilitan el descubrimiento,
recuperación y reutilización de la información.
… 2.1 ¿Para qué estándares? ¿Cuáles estándares existen?
•Los estándares permiten la localización rápida de cierto elemento. Si
se utiliza un estándar, encontrar la información específica en un
catálogo de metadatos será mucho más fácil que si no se utiliza ningún
estándar.
estándar
•Los estándares permiten búsquedas automatizadas. Cuando se
utilizan los estándares,
estándares las computadoras se pueden programar
permitiendo buscar y encontrar conjuntos de datos útiles.
… 2.1 ¿Para qué estándares? ¿Cuáles estándares existen?
•Un beneficio de los estándares es que se han generado a través de un
proceso de consulta (con otros "expertos") y ofrecen una base a partir de
la cual pueden desarrollarse perfiles nacionales u orientados de acuerdo
con materias.
materias
•Ayudan a minimizar la duplicación de esfuerzos en la elaboración,
recolección procesamiento o distribución de la información.
recolección,
información
… 2.1 ¿Para qué estándares? ¿Cuáles estándares existen?
Algunos de los estándares para metadatos geoespaciales,
geoespaciales biológicos y
ambientales más usados son:
•FGDC-CSDGM.
FGDC CSDGM Content Standard for Digital Geospatial Metadata
Metadata.
Federal Geographic Data Committe (1994): Datos geoespaciales.
[http://www fgdc gov]
[http://www.fgdc.gov]
•FGDC-NBII. Perfil Biológico de FGDC. Biología y ciencias naturales.
[http://www nbii gov]
[http://www.nbii.gov].
•Global Change Master Directory Interchange Format – DIF. (1993)
Ciencias de la Tierra.
Tierra [http://gcmd.gsfc.nasa.gov]
[http://gcmd gsfc nasa gov]
… 2.1 ¿Para qué estándares? ¿Cuáles estándares existen?
•Darwin
D
i C
Core (D
(DwC).
C) Colecciones
C l i
d
de Hi
Historia
t i N
Natural.
t l
•Descriptores para Metadatos no-geoespaciales. NCEAS-LTER (1997)
D t ecológicos.
Datos
lógi
B
Base
d
dell estándar
tá d EML.
EML
La razón de que existan tantos estándares es
que los metadatos se emplean para diversas
cosas.
… 2.1 ¿Para qué estándares? ¿Cuáles estándares existen?
Ejemplo:
Estructura del estándar de datos
geoespaciales del FGDC
2.2 Lenguajes y formatos de representación de estádares de
metadatos
Los metadatos se pueden representar de diferentes maneras:
•En
E papel:l anotaciones,
t i
tablas,
t bl en dibujos
dib j o mapas, etc.
t
p
archivos texto,, archivos HTML,, en tablas de
•En archivos de computadora:
Bases de datos, archivos XML, etc.
Los archivos de computadora pueden (deberían) seguir un esquema
estándar de representación de información (de los que se habló antes).
… 2.2 Lenguajes y formatos de representación de metadatos
<HTML>
<HEAD><TITLE>Estacion la Hechicera 2001<TITLE>
<META NAME="DC.Title"
CONTENT="Datos Estación la Hechicera 2001">
<META NAME="DC.Description"
CONTENT="Colección de datos climáticos capturados por la estacion
meteorológica
La Hechicera. Esta estación es parte de la Red de Estaciones del Edo.
Mérida.">
<META NAME
NAME="DC
DC.Creator.Name
Creator Name"
CONTENT="Carlos Guada">
<META NAME="DC.Publisher"
CONTENT="Centro de Calculo Científico, Universidad de Los Andes">
<META NAME="DC.Type"
CONTENT="text">
<META NAME="DC.Date.Issued"
CONTENT="2001">
<META NAME="DC.Subject.Geographic"
CONTENT="La Hechicera, Mérida, Venezuela">
<META NAME="DC.Coverage.dateStart"
CONTENT="01-2001">
<META NAME="DC.Coverage.dateEnd"
CONTENT="12-2001">
<META NAME="DC.Format"
CONTENT="text/txt">
CONTENT=
text/txt >
<META NAME="DC.Identifier.URL"
CONTENT="http://www.cecalc.ula.ve/datos/lahechicera/2001/">
<META NAME="DC.Rights.Use"
CONTENT="Uso libre mencionando la fuente (DC.Identifier.URL)">
</HEAD>
<BODY>
<h1>Datos Estación Hechicera 2001</h1>
<a href="/webclima/datos/lahechicera/2001/"> Ver archivo texto con datos año
2001 </a>
</BODY>
</HTML>
Metadatos Dublin Core
dentro de una pagina Web
(Búsqueda y catalogación de
recursos de información en
Internet.)
… 2.2 Lenguajes y formatos de representación de metadatos
Metadatos usando XML y EML
como estandar de
representación (visualizado en
un navegador Web)
… 2.2 Lenguajes y formatos de representación de metadatos
Archivo anterior visualizado
como página HTML en un
navegador Web)
… 2.3 Ecological Metadata Language (EML)
EML (Ecological Metadata Language) es un estándar basado en XML
para describir datos ecológicos.
p y
p
por diversas organizaciones:
g
Está siendo desarrollado y apoyado
•ESA (Ecological Society of America).
•NCEAS (National Center for Ecological Analysis and Synthesis).
Synthesis)
•LTER (Long Term Ecological Research Network).
•ILTER (International Long Term Ecological Research Network).
•OBFS (Organization of Biological Field Stations).
•Etc.
… 2.3 Ecological Metadata Language (EML)
En Diciembre de 2002 se p
publicó la versión 2.0.0 del estándar EML ((lo
llaman EML2).
Actualmente se esta intentando difundir el uso de EML2 entre la
comunidad ecológica de todo el mundo, lo que traería innumerables
beneficios en cuanto al trabajo colaborativo, intercambio de información,
procesamiento automático de datos y metadatos, etc.
[ http://knb.ecoinformatics.org/software/eml/ ]
2.4 Características básicas de EML
Clases de descriptores genéricos para Metadatos no-geoespaciales de
Michener (1997) en los que se basó EML.
I Descriptores de la colección de datos
I.Descriptores
II.Descriptores de la investigación que originó los datos
III Accesibilidad y condición de la colección de datos
III.Accesibilidad
IV.Descriptores de la estructura de los datos
V Descriptores suplementarios
V.Descriptores
2.4 Características básicas de EML
Módulos más importantes de EML.
Mód l EML
Módulos
D
Descripción
i ió
eml-access
Información de acceso y permisología de acceso
eml attribute
eml-attribute
Atributos de las tablas de información (información de columnas dentro
de las tablas)
eml-dataset
Información general de la colección
eml-entity
Información de entidades (descripción de tablas de información)
eml-physical
Información del archivo de datos (formato, codificación, etc.)
eml-literature
Metadatos para citas de la colección
eml-project
Metadatos a nivel de proyecto
eml-protocol
Información sobre los métodos de investigación y de recolección de
datos
2.5 Estándares y catálogos de colecciones de metadatos y datos
Dilemas a resolver:
•Los datos que yo necesito ¿existen?
•¿Dónde están?
•¿Cómo los obtengo?
…2.5 Estándares y catálogos de colecciones de metadatos y datos
Un catálogo de colecciones de metadatos y datos sirve para el
descubrimiento, localización y consulta de datos , de forma que los
usuarios p
puedan buscar los p
por temas,, lugar,
g , autor,, escala,, tipo
p de
producto, etc.
El estándar
á
de metadatos instrumenta a un productor o usuario con la
información apropiada para caracterizar los datos haciendo posible la
catalogación de los conjuntos de datos que facilitan el descubrimiento,
recuperación y reutilización de la información.
…2.5 Estándares y catálogos de colecciones de metadatos y datos
Clearinghouses de datos (Data Clearinghouses)
Sistema descentralizado de servidores de búsqueda en Internet que
contienen metadatos estructurados y datos (colecciones de datos)
[D www.epa.gov ]
[De:
Cliente
Puerta de Entrada
(Gateway)
...
Servidores de metadatos y datos
…2.5 Estándares y catálogos de colecciones de metadatos y datos
Comunidad que usa Clearinghouses de forma más extendida: FGDC
http://clearinghouse1.fgdc.gov/fgdc/EDCgateway_sp.html
…2.5 Estándares y catálogos de colecciones de metadatos y datos
http://knb.ecoinformatics.org/index.jsp
Sección 3. Gestión de datos ¿Dónde comenzar?
Tareas iniciales
•
•
•
•
•
•
3.1 Definición de objetivos generales de manejo de información.
3 2 Definición de políticas de manejo de datos
3.2
3.3 Hacer un inventario de los datos.
3.4 Catego
3
Categorizar
a y da
dar prioridades
p o dades a las
as colecciones
co ecc o es de datos.
datos
3.5 Seleccionar los procedimientos y herramientas a utilizar.
3.6 Proceso básico de preparación y publicación de colecciones de
datos.
3.1 Definición de objetivos generales de manejo de información
Ejemplo de definición de objetivos:
•Publicar todos los datos y/o metadatos de investigaciones finalizadas
( en proceso)) en ell Web
(o
W b (siguiendo
( i i d los
l requerimientos
i i t de
d las
l políticas
líti
de manejo de información de la institución o red de trabajo).
•Mejorar
j
la calidad de los metadatos.
•Crear herramientas de consulta para los catálogos de colecciones.
•Crear herramientas Web que ayuden
documentación de las colecciones de datos.
en
el
•Definir y seguir políticas de manejo y uso de los datos.
Etc…
Etc
proceso
de
3.2 Definición de políticas de manejo de datos
Ejemplo de asuntos a definirse:
•Decidir quien realizara el procesamiento, limpieza y aseguramiento de
l calidad
la
lid d y validez
lid de
d los
l datos.
d t
•Establecer el formato en el que se transferirán los datos.
•Decidir
Decidir quien será el responsable de documentar las colecciones de
datos.
•Decidir que datos serán publicados y bajo qué condiciones o reglas.
• Seleccionar estándar, etc.
…3.2 Definición de políticas de manejo de datos
Ejemplo de política de manejo de información (Proceso y política de manejo
de información de Estación Coweeta LTER)
1. Investigador principal (PI) comienza el proceso de documentación.
1
documentación
2. Metadatos son creados y colocados en el Web (dentro de un plazo de seis
meses del inicio del proceso).
3 S
3.
Se completa
l t la
l recolección
l ió de
d datos,
d t ell análisis
áli i y síntesis.
í t i
4. Manuscritos se aceptan para publicación.
5. Datos colocados en el sitio Web como datos Tipo 2.
6. Pasan tres años. Datos se migran a estatus Tipo 1.
períodos máximos limite,, y los
Las fechas mencionadas son consideradas p
investigadores están obligados a migrar sus datos al Tipo 1 (libre acceso) tan
pronto como les sea posible.
3.3 Hacer un inventario de los datos
Hay que saber exactamente lo que se tiene.
• Revisar cuales datos están disponibles y si se dispone de una mínima
información sobre ellos (metadatos)
Puede ser la oportunidad de capturar y recuperar información
perdida sobre los datos
3.4 Categorizar y dar prioridades a las colecciones de datos
• Hacer una primera clasificación (si no existe) siguiendo criterios de
importancia de la colección para los investigadores locales y para
posibles futuros usuarios externos de los datos.
3.5 Seleccionar los procedimientos y herramientas a utilizar
• Elaborar o tener a mano procedimientos de documentación.
ó
• Familiarizarse con el estándar de documentación a seguir.
• Tener a mano herramientas útiles que ayudan en cada paso del
proceso.
Sección 4. Herramientas de creación de metadatos
• 4.1 Morpho.
• 4.2
4 2 IInterfaz
t f web
bd
de captura
t
de
d datos
d t
4.1 Herramientas de creación de metadatos
Interfaz web de captura de metadatos
•Para documentar colecciones en
línea (KNB)
• No requiere ninguna instalación,
solo un navegador Web y conexión
a Internet.
… 4.1 Herramientas de creación de metadatos
Interfaz web de captura
p
de metadatos
• En desarrollo para ECO-RED.
• Actualmente en prueba.
4.2 Morpho
•Morpho
Morpho es una aplicación multi
multiplataforma que permite a los
ecólogos crear y organizar metadatos
y datos y almacenarlos localmente o
en un servidor de red compartido.
•Los metadatos pueden ser buscados
y recuperados tanto localmente como
a través de la red.
•Morpho
puede
ser
obtenido
gratuitamente a través del sitio Web
de KNB (knb.ecoinformatics.org).
… 4.2 Morpho
•Morpho es parte de un
esfuerzo de la KNB (Knowledge
(
g
Network for Biocomplexity) para
ayudar a manejar datos
ecológicos
g
estandarizando los
metadatos usados para
describirlos, y proveer métodos
para compartir datos y
metadatos.
… 4.2 Morpho
Ventajas uso de Morpho
• Proceso de creación de metadatos en formato estándar EML es
transparente
p
al usuario. No tiene q
que conocer detalles de EML ni de
XML para crear archivos de metadatos.
• Facilidades de publicación de colecciones en red KNB-LTER.
• Programa
P
gratuito
t it que se puede
d usar tanto
t t a nivel
i l individual
i di id l como a
nivel de red.
• Flexible ante futuros cambios en estándar.
• Multiplataforma (Windows, Linux, Macintosh).
… 4.2 Morpho
Desventajas uso de Morpho
• Desarrollo muy nuevo. Todavía tiene algunos errores.
• No existe aún versión traducida al español.
español
• Cambia continuamente de versión y características (el último año se ha
estabilizado bastante gracias a que el estándar EML también se
estabilizó).
… 4.2 Morpho
Características Morpho
Qué son perfiles:
• Identificación individual de entrada para Morpho.
• Incluye identificación de usuario.
Qué son paquetes de datos:
• Agrupación lógica de datos (colecciones de datos).
• Bajo un perfil se pueden crear muchos paquetes (colecciones) de datos.
Qué son usuarios:
• Identificación individual de persona asociada a un perfil.
… 4.2 Morpho
La_glorieta
Sección 5. Tareas para la creación de colecciones de datos
• 5.1 Escogiendo
g
e instalando las herramientas.
• 5.2 Usando una herramienta de creación de metadatos.
• 5.3 Validación y revisión de metadatos.
5.1 Escogiendo e instalando las herramientas
Considerar:
•
•
•
•
•
•
Personal de soporte técnico disponible.
E t
Entrenamiento
i t necesario.
i
Sistema Operativo disponible.
Características del Hardware disponibles.
disponibles
Disponibilidad de conexión a Internet.
Características de la herramienta (dificultad o facilidad de usousabilidad-, idioma de la interfaz, etc.)
5.2 Usando una herramienta de creación de metadatos
Recomendaciones:
• Realizar trabajo previo de recopilación de datos segun se indicó en
sección 3.
3
• Llenar la mayor cantidad de campos posible, no sólo los obligatorios
• Definir y aplicar procedimientos de respaldo de información.
5.3 Validación y revisión de metadatos
Recomendaciones:
• Ubicar dónde se estan generando y guardando los archivos de
metadatos
etadatos y datos (herramientas
( e a e tas instaladas
sta adas localmente).
oca e te) En Windows
do s y
Linux se pueden “perder” fácilmente en el disco duro.
• Consultar datos en Clearinghouse o Repositorio una vez enviados
(Morpho planillas y herramientas Web)
(Morpho,
Web).
• Comprobar completitud de metadatos.
• Comprobar
p
correcta ggeneración de metadatos.
Sección 6. Compartiendo los metadatos. Otros aspectos sobre
los metadatos
• 6.1 ¿Qué voy a hacer con los metadatos? ¿A quien le sirve los
metadatos? (uso local vs. uso global).
• 6.2
6 2 Haciendo que sus metadatos se puedan intercambiar.
intercambiar
• 6.3 Publicación y distribución de colecciones de datos.
• 6.4 El futuro.
6.1 ¿Qué voy a hacer con los metadatos?
¿A quién le sirven los metadatos? (uso local vs uso global)
•
•
•
•
Uso local.
Uso por parte de la red.
Uso por parte de pares de investigación.
investigación
Uso global.
Datos
y metadatos
Científicos miembros de red de
i
investigación
ti ió
Científicos y usuarios
externos
Científicos del mismo campo de investigación
6.2 Haciendo que sus metadatos se puedan intercambiar
Para intercambiarlos sólo basta seguir un estándar?
NO!!
Hace falta además:
• Seguir políticas de uso de los datos.
• Tener personal encargado de los datos y metadatos entrenados para
las diferentes tareas involucradas.
involucradas
• Conexión o acceso regular a Internet deseable.
• Servidor central de almacenamiento para datos y metadatos de toda la
red de trabajo deseable.
… 6.3 Distribución y Publicación de metadatos
Decidirse por uno o más métodos de distribución y publicación
• Incluir los metadatos dentro del recurso de información.
• Imprimir los registros de metadatos en papel o guardar una copia de la
versión
ió di
digital
it l en cualquier
l i medio
di d
de almacenamiento
l
i t digital.
di it l
• Distribuir los metadatos en Internet. Los metadatos "en-línea" son una
herramienta efectiva para que los usuarios encuentren los datos.
• Enviar los metadatos acordes a un estándar a un servidor central
(Clearinghouse). Usando los elementos definidos en el estándar,
proveedores de datos y metadtos pueden colocar sus colecciones
disponibles a usuarios en todo el mundo (buscables y accesibles a
través de Internet).
Internet)
… 6.3 Distribución y Publicación de metadatos
Mantenimiento:
• Mantener los metadatos actualizados y revisarlos periódicamente.
Si la colección de datos cambia, documentar los cambios en los
metadatos.
metadatos
6.4 El Futuro
Usos futuros:
• Redes de manejo de conocimientos basadas en datos y metadatos
((intención de KNB).
)
• Acceso a herramientas analíticas "en-línea" para integrar varias
herramientas como SAS
SAS, MATLAB,
MATLAB etc
etc. con acceso a datos de red de
científicos (LTER).
• Herramientas para producir formas alternativas de metadatos que
permitan a cualquier sitio participar fácilmente en otras bases de datos
internacionales y Clearinghouses de datos (FGDC, GCMD, NBII, etc.).
Por su atención
Muchas Gracias
Zulay
u ay Méndez:
é de [email protected]
u ay@u a e
Rodrigo Torréns: [email protected]

Documentos relacionados