Laminasteoria_taller..
Transcripción
Laminasteoria_taller..
Taller de Manejo de Colecciones de Datos y Metadatos para las Ciencias E ló i Ecológicas y Ambientales A bi t l Santa Bárbara del Zulia, Marzo de 2008 Zulay Méndez ([email protected]) Rodrigo Torréns ([email protected] (t @ l ) Motivaciones del Taller Este taller forma p parte del entrenamiento necesario p para q que los científicos, investigadores y gerentes de información de instituciones vinculadas a la investigación científica, especialmente en el ámbito de la ecología, clima y ambiente, adquieran los conocimientos básicos para el manejo y gerencia de colecciones de datos y metadatos. Con ello se persigue despertar el interés de los participantes en preservar, difundir y compartir los datos que provienen de sus investigaciones y esfuerzos; de este modo se busca evitar la duplicación d esfuerzos de f en la l generación g ió de d información i f ió y enfocar f l investigación la i tig ió hacia objetivos estratégicos. Objetivos específicos del Taller Los participantes aprenderán los conceptos básicos involucrados en el manejo de datos y metadatos científicos y conocerán la importancia de preservar los datos a largo g p plazo. documentar y p También conocerán algunas de las herramientas que existen para p a ubicar los realizar diferentes tareas relacionadas y aprenderán recursos de información disponibles en Internet que sean de su interés. Base teórica Sección 1. Datos y Metadatos. ¿Qué son? ¿Por qué son importantes? Sección 2. Estándares de contenido para Metadatos. Lenguaje de Metadatos para la Ecología (EML). Sección 3. Gestión de datos ¿Dónde comenzar? Tareas iniciales. Sección 4. 4 Herramientas para metadatos. metadatos Sección 5. Tareas para la creación de colecciones de datos. Sección 6. Compartiendo los metadatos. Otros aspectos sobre los metadatos. Sección 1. Datos y Metadatos. ¿Qué son? ¿Por qué son importantes? • • • • • • • • • • • • 1.1 ¿Qué son los "datos"? 1 2 Datos científicos 1.2 científicos. 1.3 Degradación de los datos en el tiempo. 1.4 Uso de los datos científicos a largo plazo. 1 5 ¿Cómo 1.5 Có llograr ell uso secundario d i y a llargo plazo l d de llos d datos? t ?G Gestión tió d de D Datos. t 1.6 ¿Qué significa la palabra metadatos? 1.7 ¿Qué es una colección de datos?. 1.8 Preguntas que se deberían poder responder usando metadatos. 1.9 Aspectos fundamentales que describen los metadatos. 1.10 Formas o modelos básicos de metadatos 1.11 Importancia de los metadatos. 1.12 Ejemplos de metadatos y de comunidades que usan metadatos. 1.1 ¿Qué son los “datos”? • Los datos constituyen registros de información de diferentes tipos que pueden obtenerse de varias maneras: manualmente, automáticamente a través de instrumentos, o a través de procesamiento realizado por computadores. computadores • Por lo general están asociados o son producto de una investigación científica. 1.2 Datos científicos GEOESPACIALES Datos georeferenciados que representan en papel o digitalmente elementos o características de la superficie terrestre a diferentes escalas, tales como vías, cursos de agua, límites í políticos, í escuelas, usos del suelo, etc; en resumen, algo que se puede trazar. http://main.nc.us/GIS/guide/spatial/ NO GEOESPACIALES Datos numéricos, alfanuméricos o tipo texto recabados en campo o registrados por instrumentos. i t t Pueden P d no tener t ubicación geo-espacial. …1.2 Datos científicos Ejemplos de datos geoespaciales: Mapas Situación Relativa Local Imágenes áge es de satélite saté te N Mi casa !! …1.2 Datos científicos Ejemplos de datos NO geoespaciales: Datos discretos basados en tiempo Datos tabulares en página web Texto delimitado 1.3 Degradación de los datos en el tiempo Ejemplo de degradación normal de los contenidos de información asociados i d con datos d t a través t é del d l tiempo ti Momento de publicación Contenidos de Información Detalles específicos acerca de la recolección de los datos se pierden al pasar el tiempo Retiro o cambio de carrera del científico recolector Accidente puede destruir datos y documentación Muerte del investigador y subsecuente pérdida de registros restantes Tiempo Tomado de: [Michener, 1997] 1.4 Uso de los datos científicos a largo plazo Depende de que sean: •Organizados Organizados y de fácil acceso •Consistentes •Bien Bi d documentados t d •Facilidad de comprensión por parte de usuarios Si no se documentan los datos, datos pierden su valor y hay que desecharlos. Esto se traduce en pérdida de esfuerzos, tiempo y dinero. 1.5 ¿Cómo lograr el uso secundario y a largo plazo de los Datos científicos? Gestión de datos. PROCESO DE GESTIÓN Ó DE DATOS 1. Adquirir / capturar los datos 2. Acceso del usuario a un conjunto de datos comprensible completamente documentado recuperar-compartir datos Valor agregado que ayuda a maximizar el retorno de la inversión mediante la posibilidad de usar varias veces los mismos conjuntos de datos 1.5 ¿Cómo lograr el uso secundario y a largo plazo de los Datos científicos? Gestión de datos. Herramientas organizativas y tecnológicas que pueden hacer posible la gestión de datos: Formación de Redes de colaboración entre científicos y entre usuarios de información Tecnologías de Información y Comunicaciones (TIC) Uso de metadatos y estándares de intercambio de información 1.6 ¿Qué significa la palabra “metadatos”? •"Datos sobre los datos“ •“..Conjunto común de términos y definiciones que describen las principales propiedades o características de los datos”. (Díaz .,2003,p1) •"Nivel superior de la información, o instrucciones que describen el contenido,, contexto,, calidad,, estructura,, y accesibilidad de una colección de datos específica" (Michener, 1997, p.331). 1.7 ¿Qué es una colección de datos? Dos conceptos sencillos: • Conjunto de datos de una misma clase. • “Una colección de datos es una serie de observaciones recolectadas con la misma metodología” g [LTER-Luquillo, 2001] …1.7 1 7 ¿Qué es una colección de datos? Ejemplo de dos colecciones de datos de una estación climatológica 1.8 Preguntas que se deberían poder responder usando metadatos • ¿Qué describe la colección de datos? • ¿Quién produjo la colección de datos? • ¿Por P qué é ffue creada d la l colección? l ió ? • ¿Cómo se creó la colección de datos? • ¿Cuan confiables son los datos? • ¿Cómo sería posible obtener una copia de la colección de datos? • ¿Quién escribió los metadatos? 1.9 Aspectos fundamentales que describen los metadatos Los Metadatos describen diferentes aspectos de los datos, incluyendo: • Identificación: ¿cual es el nombre de la colección de datos (dataset)? ¿Quien creó la colección?, ¿que área geográfica cubre?. • Qué temas se incluyen, ¿cuan actualizada está la información? ¿Hay restricciones para acceder o usar los datos?. • Calidad de los datos: ¿cuan buenos son los datos? ¿Existe información que permite a los usuarios decidir si los datos se adaptan a sus propósitos? ¿Qué exactitud tienen los datos? ¿Los d t están datos tá completos? l t ? ¿Cómo Có se puede d verificar ifi l consistencia la i t i de los datos?. … 1.9 Aspectos fundamentales que describen los metadatos • Información sobre entidades y atributos: ¿qué información (parámetros, variables, columnas de datos) está incluida? ¿ Cómo está codificada o formateada la información? ¿Qué codificación se usó?. ó? • Distribución: ¿quien posee los datos? ¿A quien se los puedo pedir? ¿En q ¿ qué formatos están disponibles? p ¿ ¿Están disponibles p en Internet? ¿Cuanto cuestan los datos?. [ De: http://www.main.nc.us/GIS/guide/using/tutp6nsdi.html http://www main nc us/GIS/guide/using/tutp6nsdi html ] 1.10 Formas o modelos básicos de metadatos a) b) c) Mc M D M1 M D D Metadatos como parte de los datos (Datos de catalogación dentro de un libro)) D=Dato M M t d t M=Metadato M2 Metadatos externos al recurso de información ((Ficha bibliográfica g en una biblioteca) D Meta-metadatos (colecciones de metadatos) …1.10 Formas o modelos básicos de metadatos Publisher's Cataloging In Publication Data (Prepared by Quality Books, Inc.) B ll P Bell, Patricia t i i J J. Roughing it elegantly: a practical guide to canoe camping / by Patricia J. Bell ; illustrated by Linda Oliver Isakson Isakson. -2nd 2nd ed ed. p. cm. Includes bibliographical references and index. LCCN: 93-74305 ISBN 0-9618227-0-8 1. Camping-United States2. Camping-United States-Equipment and supplies 3. Canoes and canoeing-United States I. Title GV790.B45 1994 796.54'0973 QBI96-86 Metadatos externos al recurso de información ó (Ficha bibliográfica en una biblioteca) …1.10 Formas o modelos básicos de metadatos Modelo de un catálogo de colecciones (meta-metadatos): Mc M1 D1 Mc Colección de datos y metadatos M2 D2 Catalogo de colecciones Mn Metadatos de colección Dn Colección de Datos …1.10 Formas o modelos básicos de metadatos Ejemplo de catálogo de colecciones (en internet): [ http://gce-lter.marsci.uga.edu/lter/asp/db/data_catalog.asp ] 1 11 IImportancia 1.11 t i d de llos metadatos t d t • Facilitar el procesamiento, análisis y modelado de los datos: Dada la naturaleza l di á i de dinámica d los l datos d en un entorno de d red, d una vez creados d pueden ser utilizados por múltiples sistemas y para diferentes propósitos. • Facilitar la determinación de la conveniencia de los datos para cumplir con un objetivo específico: Los metadatos son consecuentemente un requisito esencial para localizar los datos y productos, evaluarlos y conocer cual es su actual disponibilidad. • Organizar y mantener el acervo del conjunto de datos de una organización: Los metadatos ayudan a organizar y mantener las grandes inversiones en datos, evitan la duplicación de esfuerzos y proveen, la información sobre la posesión de datos y productos de una organización (Valor agregado). … 1.11 1 11 Importancia I t i d de los l metadatos t d t • Los os metadatos etadatos puede pueden ayuda ayudar a los os ccientíficos, e t cos, a los os investigadores, est gado es, a al estudiante, al planificador, al político, y en general, al ciudadano común a encontrar y utilizar los datos que apoyen las investigaciones y la toma de decisiones. También benefician al creador de ellos y a mantener el valor de los mismos y poder asegurar su uso continuo a lo largo del tiempo. • E En consecuencia, i la l utilización tili ió y manejo j de d metadatos t d t respaldado ld d por estándares nacionales, guías y políticas, beneficia el crecimiento económico y los intereses sociales y ambientales de una nación. 1.12 Ejemplos de metadatos y de comunidades que usan metadatos • • • • • Bibliotecas. Científicos. Organizaciones gubernamentales. gubernamentales Negocios, Comercio Internacional. dust a, etc. etc Industria, … 1.12 1 12 Ejemplos de metadatos y de comunidades que usan metadatos Documentación de datos g ecológicos … 1.12 Ejemplos de metadatos y de comunidades que usan metadatos Metadatos Geoespaciales http://cndg.clearinghouse.gub.uy/ … 1.13 1 13 Ejemplos de metadatos y de comunidades que usan metadatos Muestra metadatos Sistema de Información de Biodiversidad de Colombia http://www.siac.net.co/sib/metadatos Sección 2. Estándares de contenido para Metadatos. Lenguaje de Metadatos para la Ecología (EML) • • • • • 2.1 ¿Para qué estándares? ¿Cuales estándares existen?. 2.2 Lenguajes y formatos de representación de metadatos. 2.3 Ecological Metadata Language (EML). 2.4 Características básicas de EML. 2 5 Recursos en el Web sobre estándares y EML. 2.5 EML 2.1 ¿Para qué estándares? ¿Cuáles estándares existen? Un estándar establece un sistema común de terminología y de definiciones para documentar datos. El objetivo en un estándar de metadatos será mejorar la organización y administración de los datos, y proveer información sobre los datos disponibles en una organización a terceros. El estándar de metadatos instrumenta a un productor o usuario con la información apropiada para caracterizar los datos haciendo posible la catalogación de los conjuntos de datos que facilitan el descubrimiento, recuperación y reutilización de la información. … 2.1 ¿Para qué estándares? ¿Cuáles estándares existen? •Los estándares permiten la localización rápida de cierto elemento. Si se utiliza un estándar, encontrar la información específica en un catálogo de metadatos será mucho más fácil que si no se utiliza ningún estándar. estándar •Los estándares permiten búsquedas automatizadas. Cuando se utilizan los estándares, estándares las computadoras se pueden programar permitiendo buscar y encontrar conjuntos de datos útiles. … 2.1 ¿Para qué estándares? ¿Cuáles estándares existen? •Un beneficio de los estándares es que se han generado a través de un proceso de consulta (con otros "expertos") y ofrecen una base a partir de la cual pueden desarrollarse perfiles nacionales u orientados de acuerdo con materias. materias •Ayudan a minimizar la duplicación de esfuerzos en la elaboración, recolección procesamiento o distribución de la información. recolección, información … 2.1 ¿Para qué estándares? ¿Cuáles estándares existen? Algunos de los estándares para metadatos geoespaciales, geoespaciales biológicos y ambientales más usados son: •FGDC-CSDGM. FGDC CSDGM Content Standard for Digital Geospatial Metadata Metadata. Federal Geographic Data Committe (1994): Datos geoespaciales. [http://www fgdc gov] [http://www.fgdc.gov] •FGDC-NBII. Perfil Biológico de FGDC. Biología y ciencias naturales. [http://www nbii gov] [http://www.nbii.gov]. •Global Change Master Directory Interchange Format – DIF. (1993) Ciencias de la Tierra. Tierra [http://gcmd.gsfc.nasa.gov] [http://gcmd gsfc nasa gov] … 2.1 ¿Para qué estándares? ¿Cuáles estándares existen? •Darwin D i C Core (D (DwC). C) Colecciones C l i d de Hi Historia t i N Natural. t l •Descriptores para Metadatos no-geoespaciales. NCEAS-LTER (1997) D t ecológicos. Datos lógi B Base d dell estándar tá d EML. EML La razón de que existan tantos estándares es que los metadatos se emplean para diversas cosas. … 2.1 ¿Para qué estándares? ¿Cuáles estándares existen? Ejemplo: Estructura del estándar de datos geoespaciales del FGDC 2.2 Lenguajes y formatos de representación de estádares de metadatos Los metadatos se pueden representar de diferentes maneras: •En E papel:l anotaciones, t i tablas, t bl en dibujos dib j o mapas, etc. t p archivos texto,, archivos HTML,, en tablas de •En archivos de computadora: Bases de datos, archivos XML, etc. Los archivos de computadora pueden (deberían) seguir un esquema estándar de representación de información (de los que se habló antes). … 2.2 Lenguajes y formatos de representación de metadatos <HTML> <HEAD><TITLE>Estacion la Hechicera 2001<TITLE> <META NAME="DC.Title" CONTENT="Datos Estación la Hechicera 2001"> <META NAME="DC.Description" CONTENT="Colección de datos climáticos capturados por la estacion meteorológica La Hechicera. Esta estación es parte de la Red de Estaciones del Edo. Mérida."> <META NAME NAME="DC DC.Creator.Name Creator Name" CONTENT="Carlos Guada"> <META NAME="DC.Publisher" CONTENT="Centro de Calculo Científico, Universidad de Los Andes"> <META NAME="DC.Type" CONTENT="text"> <META NAME="DC.Date.Issued" CONTENT="2001"> <META NAME="DC.Subject.Geographic" CONTENT="La Hechicera, Mérida, Venezuela"> <META NAME="DC.Coverage.dateStart" CONTENT="01-2001"> <META NAME="DC.Coverage.dateEnd" CONTENT="12-2001"> <META NAME="DC.Format" CONTENT="text/txt"> CONTENT= text/txt > <META NAME="DC.Identifier.URL" CONTENT="http://www.cecalc.ula.ve/datos/lahechicera/2001/"> <META NAME="DC.Rights.Use" CONTENT="Uso libre mencionando la fuente (DC.Identifier.URL)"> </HEAD> <BODY> <h1>Datos Estación Hechicera 2001</h1> <a href="/webclima/datos/lahechicera/2001/"> Ver archivo texto con datos año 2001 </a> </BODY> </HTML> Metadatos Dublin Core dentro de una pagina Web (Búsqueda y catalogación de recursos de información en Internet.) … 2.2 Lenguajes y formatos de representación de metadatos Metadatos usando XML y EML como estandar de representación (visualizado en un navegador Web) … 2.2 Lenguajes y formatos de representación de metadatos Archivo anterior visualizado como página HTML en un navegador Web) … 2.3 Ecological Metadata Language (EML) EML (Ecological Metadata Language) es un estándar basado en XML para describir datos ecológicos. p y p por diversas organizaciones: g Está siendo desarrollado y apoyado •ESA (Ecological Society of America). •NCEAS (National Center for Ecological Analysis and Synthesis). Synthesis) •LTER (Long Term Ecological Research Network). •ILTER (International Long Term Ecological Research Network). •OBFS (Organization of Biological Field Stations). •Etc. … 2.3 Ecological Metadata Language (EML) En Diciembre de 2002 se p publicó la versión 2.0.0 del estándar EML ((lo llaman EML2). Actualmente se esta intentando difundir el uso de EML2 entre la comunidad ecológica de todo el mundo, lo que traería innumerables beneficios en cuanto al trabajo colaborativo, intercambio de información, procesamiento automático de datos y metadatos, etc. [ http://knb.ecoinformatics.org/software/eml/ ] 2.4 Características básicas de EML Clases de descriptores genéricos para Metadatos no-geoespaciales de Michener (1997) en los que se basó EML. I Descriptores de la colección de datos I.Descriptores II.Descriptores de la investigación que originó los datos III Accesibilidad y condición de la colección de datos III.Accesibilidad IV.Descriptores de la estructura de los datos V Descriptores suplementarios V.Descriptores 2.4 Características básicas de EML Módulos más importantes de EML. Mód l EML Módulos D Descripción i ió eml-access Información de acceso y permisología de acceso eml attribute eml-attribute Atributos de las tablas de información (información de columnas dentro de las tablas) eml-dataset Información general de la colección eml-entity Información de entidades (descripción de tablas de información) eml-physical Información del archivo de datos (formato, codificación, etc.) eml-literature Metadatos para citas de la colección eml-project Metadatos a nivel de proyecto eml-protocol Información sobre los métodos de investigación y de recolección de datos 2.5 Estándares y catálogos de colecciones de metadatos y datos Dilemas a resolver: •Los datos que yo necesito ¿existen? •¿Dónde están? •¿Cómo los obtengo? …2.5 Estándares y catálogos de colecciones de metadatos y datos Un catálogo de colecciones de metadatos y datos sirve para el descubrimiento, localización y consulta de datos , de forma que los usuarios p puedan buscar los p por temas,, lugar, g , autor,, escala,, tipo p de producto, etc. El estándar á de metadatos instrumenta a un productor o usuario con la información apropiada para caracterizar los datos haciendo posible la catalogación de los conjuntos de datos que facilitan el descubrimiento, recuperación y reutilización de la información. …2.5 Estándares y catálogos de colecciones de metadatos y datos Clearinghouses de datos (Data Clearinghouses) Sistema descentralizado de servidores de búsqueda en Internet que contienen metadatos estructurados y datos (colecciones de datos) [D www.epa.gov ] [De: Cliente Puerta de Entrada (Gateway) ... Servidores de metadatos y datos …2.5 Estándares y catálogos de colecciones de metadatos y datos Comunidad que usa Clearinghouses de forma más extendida: FGDC http://clearinghouse1.fgdc.gov/fgdc/EDCgateway_sp.html …2.5 Estándares y catálogos de colecciones de metadatos y datos http://knb.ecoinformatics.org/index.jsp Sección 3. Gestión de datos ¿Dónde comenzar? Tareas iniciales • • • • • • 3.1 Definición de objetivos generales de manejo de información. 3 2 Definición de políticas de manejo de datos 3.2 3.3 Hacer un inventario de los datos. 3.4 Catego 3 Categorizar a y da dar prioridades p o dades a las as colecciones co ecc o es de datos. datos 3.5 Seleccionar los procedimientos y herramientas a utilizar. 3.6 Proceso básico de preparación y publicación de colecciones de datos. 3.1 Definición de objetivos generales de manejo de información Ejemplo de definición de objetivos: •Publicar todos los datos y/o metadatos de investigaciones finalizadas ( en proceso)) en ell Web (o W b (siguiendo ( i i d los l requerimientos i i t de d las l políticas líti de manejo de información de la institución o red de trabajo). •Mejorar j la calidad de los metadatos. •Crear herramientas de consulta para los catálogos de colecciones. •Crear herramientas Web que ayuden documentación de las colecciones de datos. en el •Definir y seguir políticas de manejo y uso de los datos. Etc… Etc proceso de 3.2 Definición de políticas de manejo de datos Ejemplo de asuntos a definirse: •Decidir quien realizara el procesamiento, limpieza y aseguramiento de l calidad la lid d y validez lid de d los l datos. d t •Establecer el formato en el que se transferirán los datos. •Decidir Decidir quien será el responsable de documentar las colecciones de datos. •Decidir que datos serán publicados y bajo qué condiciones o reglas. • Seleccionar estándar, etc. …3.2 Definición de políticas de manejo de datos Ejemplo de política de manejo de información (Proceso y política de manejo de información de Estación Coweeta LTER) 1. Investigador principal (PI) comienza el proceso de documentación. 1 documentación 2. Metadatos son creados y colocados en el Web (dentro de un plazo de seis meses del inicio del proceso). 3 S 3. Se completa l t la l recolección l ió de d datos, d t ell análisis áli i y síntesis. í t i 4. Manuscritos se aceptan para publicación. 5. Datos colocados en el sitio Web como datos Tipo 2. 6. Pasan tres años. Datos se migran a estatus Tipo 1. períodos máximos limite,, y los Las fechas mencionadas son consideradas p investigadores están obligados a migrar sus datos al Tipo 1 (libre acceso) tan pronto como les sea posible. 3.3 Hacer un inventario de los datos Hay que saber exactamente lo que se tiene. • Revisar cuales datos están disponibles y si se dispone de una mínima información sobre ellos (metadatos) Puede ser la oportunidad de capturar y recuperar información perdida sobre los datos 3.4 Categorizar y dar prioridades a las colecciones de datos • Hacer una primera clasificación (si no existe) siguiendo criterios de importancia de la colección para los investigadores locales y para posibles futuros usuarios externos de los datos. 3.5 Seleccionar los procedimientos y herramientas a utilizar • Elaborar o tener a mano procedimientos de documentación. ó • Familiarizarse con el estándar de documentación a seguir. • Tener a mano herramientas útiles que ayudan en cada paso del proceso. Sección 4. Herramientas de creación de metadatos • 4.1 Morpho. • 4.2 4 2 IInterfaz t f web bd de captura t de d datos d t 4.1 Herramientas de creación de metadatos Interfaz web de captura de metadatos •Para documentar colecciones en línea (KNB) • No requiere ninguna instalación, solo un navegador Web y conexión a Internet. … 4.1 Herramientas de creación de metadatos Interfaz web de captura p de metadatos • En desarrollo para ECO-RED. • Actualmente en prueba. 4.2 Morpho •Morpho Morpho es una aplicación multi multiplataforma que permite a los ecólogos crear y organizar metadatos y datos y almacenarlos localmente o en un servidor de red compartido. •Los metadatos pueden ser buscados y recuperados tanto localmente como a través de la red. •Morpho puede ser obtenido gratuitamente a través del sitio Web de KNB (knb.ecoinformatics.org). … 4.2 Morpho •Morpho es parte de un esfuerzo de la KNB (Knowledge ( g Network for Biocomplexity) para ayudar a manejar datos ecológicos g estandarizando los metadatos usados para describirlos, y proveer métodos para compartir datos y metadatos. … 4.2 Morpho Ventajas uso de Morpho • Proceso de creación de metadatos en formato estándar EML es transparente p al usuario. No tiene q que conocer detalles de EML ni de XML para crear archivos de metadatos. • Facilidades de publicación de colecciones en red KNB-LTER. • Programa P gratuito t it que se puede d usar tanto t t a nivel i l individual i di id l como a nivel de red. • Flexible ante futuros cambios en estándar. • Multiplataforma (Windows, Linux, Macintosh). … 4.2 Morpho Desventajas uso de Morpho • Desarrollo muy nuevo. Todavía tiene algunos errores. • No existe aún versión traducida al español. español • Cambia continuamente de versión y características (el último año se ha estabilizado bastante gracias a que el estándar EML también se estabilizó). … 4.2 Morpho Características Morpho Qué son perfiles: • Identificación individual de entrada para Morpho. • Incluye identificación de usuario. Qué son paquetes de datos: • Agrupación lógica de datos (colecciones de datos). • Bajo un perfil se pueden crear muchos paquetes (colecciones) de datos. Qué son usuarios: • Identificación individual de persona asociada a un perfil. … 4.2 Morpho La_glorieta Sección 5. Tareas para la creación de colecciones de datos • 5.1 Escogiendo g e instalando las herramientas. • 5.2 Usando una herramienta de creación de metadatos. • 5.3 Validación y revisión de metadatos. 5.1 Escogiendo e instalando las herramientas Considerar: • • • • • • Personal de soporte técnico disponible. E t Entrenamiento i t necesario. i Sistema Operativo disponible. Características del Hardware disponibles. disponibles Disponibilidad de conexión a Internet. Características de la herramienta (dificultad o facilidad de usousabilidad-, idioma de la interfaz, etc.) 5.2 Usando una herramienta de creación de metadatos Recomendaciones: • Realizar trabajo previo de recopilación de datos segun se indicó en sección 3. 3 • Llenar la mayor cantidad de campos posible, no sólo los obligatorios • Definir y aplicar procedimientos de respaldo de información. 5.3 Validación y revisión de metadatos Recomendaciones: • Ubicar dónde se estan generando y guardando los archivos de metadatos etadatos y datos (herramientas ( e a e tas instaladas sta adas localmente). oca e te) En Windows do s y Linux se pueden “perder” fácilmente en el disco duro. • Consultar datos en Clearinghouse o Repositorio una vez enviados (Morpho planillas y herramientas Web) (Morpho, Web). • Comprobar completitud de metadatos. • Comprobar p correcta ggeneración de metadatos. Sección 6. Compartiendo los metadatos. Otros aspectos sobre los metadatos • 6.1 ¿Qué voy a hacer con los metadatos? ¿A quien le sirve los metadatos? (uso local vs. uso global). • 6.2 6 2 Haciendo que sus metadatos se puedan intercambiar. intercambiar • 6.3 Publicación y distribución de colecciones de datos. • 6.4 El futuro. 6.1 ¿Qué voy a hacer con los metadatos? ¿A quién le sirven los metadatos? (uso local vs uso global) • • • • Uso local. Uso por parte de la red. Uso por parte de pares de investigación. investigación Uso global. Datos y metadatos Científicos miembros de red de i investigación ti ió Científicos y usuarios externos Científicos del mismo campo de investigación 6.2 Haciendo que sus metadatos se puedan intercambiar Para intercambiarlos sólo basta seguir un estándar? NO!! Hace falta además: • Seguir políticas de uso de los datos. • Tener personal encargado de los datos y metadatos entrenados para las diferentes tareas involucradas. involucradas • Conexión o acceso regular a Internet deseable. • Servidor central de almacenamiento para datos y metadatos de toda la red de trabajo deseable. … 6.3 Distribución y Publicación de metadatos Decidirse por uno o más métodos de distribución y publicación • Incluir los metadatos dentro del recurso de información. • Imprimir los registros de metadatos en papel o guardar una copia de la versión ió di digital it l en cualquier l i medio di d de almacenamiento l i t digital. di it l • Distribuir los metadatos en Internet. Los metadatos "en-línea" son una herramienta efectiva para que los usuarios encuentren los datos. • Enviar los metadatos acordes a un estándar a un servidor central (Clearinghouse). Usando los elementos definidos en el estándar, proveedores de datos y metadtos pueden colocar sus colecciones disponibles a usuarios en todo el mundo (buscables y accesibles a través de Internet). Internet) … 6.3 Distribución y Publicación de metadatos Mantenimiento: • Mantener los metadatos actualizados y revisarlos periódicamente. Si la colección de datos cambia, documentar los cambios en los metadatos. metadatos 6.4 El Futuro Usos futuros: • Redes de manejo de conocimientos basadas en datos y metadatos ((intención de KNB). ) • Acceso a herramientas analíticas "en-línea" para integrar varias herramientas como SAS SAS, MATLAB, MATLAB etc etc. con acceso a datos de red de científicos (LTER). • Herramientas para producir formas alternativas de metadatos que permitan a cualquier sitio participar fácilmente en otras bases de datos internacionales y Clearinghouses de datos (FGDC, GCMD, NBII, etc.). Por su atención Muchas Gracias Zulay u ay Méndez: é de [email protected] u ay@u a e Rodrigo Torréns: [email protected]