Estado del Arte Internacional
Transcripción
Estado del Arte Internacional
Elaborado por: Universidad Catolica del Norte Universidad de La Frontera REUNA Fecha: Enero 2010 Financiado por: Programa de Investigación Asociativa PIA CONICYT Nota: Se autoriza la reproducción total y/o parcial de este libro, por cualquier medio impreso y/o digital, para fines de investigación y ampliación y difusión del conocimiento (no comerciales), citando las respectivas fuentes. PREFACIO A lo largo de su trayectoria y respondiendo al mandato de sus socios, la Corporación REUNA ha buscado promover y apoyar el desarrollo de la comunidad de educación superior, investigación e innovación del país. La gestión de una infraestructura nacional de Red Académica globalmente conectada, la incorporación y el desarrollo de tecnologías, servicios y aplicaciones de vanguardia que promueven la conexión, la comunicación y la colaboración, y la articulación de los actores que puedan ver sus investigaciones y proyectos beneficiados con éstas, son las vías que ha tomado REUNA para cumplir sus objetivos. En el año 2000 la Corporación se conecta a la red de investigación y educación norteamericana, Internet2, el 2004, a la red latinoamericana, RedCLARA, y desde el año 2006 trabaja intensamente para incentivar la discusión nacional en torno a la e-Ciencia. A nivel mundial se está dando un fuerte impulso al despliegue de las eInfraestructuras para impulsar y permitir el avance de la ciencia colaborativa. La importancia que ello ha representado para las ciencias es crucial; la explotación eficiente de centros y/o recursos de excelencia y a la existencia de nuevas formas de compartir conocimiento en todas las áreas de investigación son dos signos claros de esto y la profundidad del impacto de tan significativa evolución llevó al cambio de paradigma, a la modificación de la forma en que se desarrolla el quehacer científico desde el Polo Norte hasta la Antártica. En el presente contexto, este estudio constituye un avance complementario al ya realizado en el área de Astronomía, y –consideramos- significativo para motivar la definición de acciones que conduzcan a la consolidación de una eInfraestructura nacional. Más aún, las grid y los sistemas que generan y sobre los cuales operan, poseen una gran cantidad de propiedades latentes que aumentan y extienden aquellas que son propias de la computación tradicional, y están aportando grandes beneficios a la academia, la ciencia, la pequeña, mediana y gran industria, y a los gobiernos (aspectos que pudieron validarse ampliamente en el trabajo realizado en el Proyecto de Articulación Ciencia-Empresa, en el cual se enmarca el presente documento). La necesidad en Chile de una infraestructura tecnológica colaborativa de apoyo a la investigación astronómica, nov 2008. Estudio financiado por el Programa Kawax (PIA) Taller de Articulación para la Vinculación de Ciencia y Empresa: E-Ciencia E-Industria: Hacia una Infraestructura de Grid Nacional AGRADECIMIENTOS Red Universitaria Nacional (REUNA) quiere agradecer a todos quienes hicieron posible la realización de este estudio; a cada uno de los autores y a quienes apostaron junto a nosotros por una propuesta integrada para evidenciar la necesidad de una e-Infraestructura nacional. Nuestros reconocimientos son para el Centro de Modelamiento Matemático (CMM) - Universidad de Chile, el Centro de Excelencia de Modelación y Computación Científica (CEMCC) - Universidad de La Frontera, la Universidad de Concepción, la Universidad Católica del Norte y el Centro de Estudios Avanzados en Zonas Áridas (CEAZA) – Universidad de La Serena, por aceptar y apoyar esta iniciativa, y para el Programa de Investigación Asociativa (PIA) de la Comisión Nacional Científica y Tecnológica (CONICYT) que, confiando en nuestra visión, financió este estudio. Especial mención merecen los científicos, investigadores, académicos, tanto nacionales como internacionales, que nos entregaron su visión y conocimientos para construir esta propuesta. Por último, queremos agradecer con especial énfasis al Comité CienciaEmpresa y al equipo de profesionales de REUNA. Índice de Contenidos 1 Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia 15 1.1 Marco Conceptual 15 1.2 Definición general de una grid 16 1.3 1.3.1 1.3.2 1.3.1 Tipos de e-Infraestructuras Infraestructura para la e-Ciencia Elementos de una e-Infraestructura Arquitectura de Seguridad en la Plataforma Grid 18 19 22 29 2 Capítulo II Estado del Arte Internacional 39 2.1 Introducción 39 2.2 Incorporación de HPC en el mundo 40 2.3 2.3.1 2.3.2 2.3.3 2.3.4 2.3.5 2.3.6 Proyectos de e-Infraestructuras APGRID (www.apgrid.org) AUSTRIAN GRID (www.austriangrid.at) BalticGrid II (www.balticgrid.org) The Belgian Grid for Research (Begrid) (www.begrid.be) BiG Grid - Grid Holandesa de e-Ciencia (http://www.nwo.nl) Recursos grid 41 41 43 46 48 50 66 3 Capítulo III: Estado del arte en Latinoamérica 79 3.1 Introducción 79 3.2 3.2.1 3.2.2 3.2.3 Avances en computación grid en Latinoamérica Computación grid en Colombia Computación grid en Argentina Computación grid en Brasil 82 82 84 85 4 Capítulo IV: Estado del Arte Nacional 87 4.1 Iniciativa articulada por REUNA 4.1.1 Iniciativas Centro de Modelamiento Matemático CMM, Universidad de Chile 4.1.2 Iniciativas Universidad Católica del Norte 4.1.3 Iniciativas CEAZA, Universidad de La Serena 4.1.4 Iniciativas de la Universidad de La Frontera 4.1.5 Iniciativas de la Universidad Técnica Federico Santa María 4.1.6 Iniciativas de la Universidad de Talca 4.1.7 Iniciativas de la Universidad del Bío-Bío 4.1.8 Iniciativas de la Universidad Austral 4.1.9 Iniciativas de la Universidad de Valparaíso 4.1.10Computación grid de apoyo a la Astronomía 87 5 Capítulo V: Estado del Arte Internacional 5.1 5.1.1 5.1.2 5.1.3 5.1.4 5.1.5 5.1.6 5.1.7 Tendencias de investigación en clima Desafíos para el registro climático global La observación, base de la investigación climática Gestión y administración de datos derivados de la observación Otras problemáticas Los modelos matemáticos como aporte al estudio del clima y el tiempo Esfuerzos existentes en Chile Fenómenos climáticos 89 91 93 94 94 95 95 95 96 96 99 99 99 102 103 105 107 109 110 5.2 Iniciativas Internacionales: e-infraestructuras para el desarrollo de la e-ciencia en Clima 5.2.1 Tipos de e-Infraestructura 5.2.1 Proyectos Internacionales de e-Infraestructuras para la e-Ciencia en Clima 5.3 115 115 121 Visión Futura 6 Capítulo VI:Estado del Arte Nacional 156 161 6.1 Instituciones y/o grupos de investigación a nivel nacional 161 6.2 Proyectos a nivel nacional 180 7 Capítulo VII: Estado del Arte Internacional 7.1 Introducción 7.2 Tendencias de investigación en Biociencias 7.3 Iniciativas Internacionales: 185 185 188 e-Infraestructuras para el desarrollo de la e-Ciencia 7.3.1 Descripción tecnológica de la e-infraestructura 7.3.2 Descripción de Iniciativas 189 190 191 7.4 Apoyo de la e-infraestructura en la investigación 213 7.5 Visión Futura 213 8 Capítulo VIII:Estado del Arte Nacional 215 8.1 Investigación y Colaboración 215 8.2 Instituciones y/o grupos de investigación a nivel nacional 217 8.3 Identificar las áreas científicas que se trabajan en Chile 218 8.4 Productividad e impacto Científico 219 8.5 8.5.1 8.5.2 8.5.3 8.5.4 Iniciativas en las áreas de Biociencias Proyecto UCRAV SACGRID ACTION-GRID EELA-2 219 219 220 220 220 9 Capítulo IX:Necesidades futuras de Tecnologías de Información en Chile 9.1 223 Introducción 223 9.2 Determinación de las industrias en estudio 9.2.1 La elección de un camino. 225 225 9.3 El Consejo Nacional de Innovación para la Competitividad 226 9.4 Los siete sectores elegidos 227 9.5 Requerimientos de TIC de los siete clusters privilegiados 228 9.6 Offshoring 9.6.1 Requerimiento de TIC 229 230 9.7 Acuicultura 9.7.1 Requerimiento de TIC 231 231 9.8 Minería del cobre 9.8.1 Requerimiento de TIC 232 232 9.9 Alimentos Procesados 9.9.1 Requerimiento de TIC 233 234 9.10 Fruticultura 9.10.1Requerimiento de TIC 234 235 9.11 Turismo 9.11.1Requerimiento de TIC 236 236 9.12 Servicios Financieros 9.12.1Requerimiento de TIC 237 237 Estado del Arte Nacional e Internacional en las áreas Clima, Biociencia y Tecnología Grid Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia 1 Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia 1.1 Marco Conceptual “E-Ciencia es el concepto que define a aquellas actividades científicas que se desarrollan a través de la utilización de recursos geográficamente distribuidos a los que se accede mediante Internet. Pero recursos como cálculo y almacenamiento masivo -los más frecuentemente requeridos en el ámbito de la e-Ciencia-, no se satisfacen con la Internet comercial, ellos requieren de las redes de alta velocidad dedicadas a la investigación -las denominadas Redes Académicas. Éstas y las aplicaciones de trabajo colaborativo que en ellas se desarrollan, están creando un escenario ideal para la interacción entre investigadores”. Consecuentemente, para el desarrollo e la e-Ciencia se requiere de la e-infraestructura o plataforma tecnológica que la da sustento. El término e-Infraestructura se refiere a un nuevo ambiente de investigación, donde investigadores trabajando en el contexto de sus instituciones base o en iniciativas científicas nacionales o multinacionales, obtienen acceso compartido a instalaciones o recursos científicos únicos o distribuidos (incluyendo datos, instrumentos, capacidad de cómputo y comunicaciones), independiente de sus características individuales o su localización en el mundo. E-Infraestructura abarca redes de computadores, grids, data centers, registros de servicios, autenticación, autoridad certificadora, capacitación, servicio helpdesk. Más importante, es la integración de todos estos elementos lo que define la e-Infraestructura. E-Ciencia en REUNA [http://.www.reuna.cl/index.php/es/e-ciencia] Consultado en abril 20, 2010. 15 Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia Un conjunto de desarrollos de e-Infraestructura han alcanzado un grado de maduración; la computación grid es hoy la base estándar típicamente usada para cómputo y administración de datos requeridos en el desarrollo de investigación colaborativa. 1.2 Definición general de una grid Varios conceptos similares coexisten acerca de qué es una grid. Uno de ellos, elaborado por el Grid Computing Information Centre (asociación dedicada exclusivamente al desarrollo de esta tecnología), llama grid a un “tipo de sistema paralelo y distribuido que permite compartir, seleccionar y reunir recursos ‘autónomos’ geográficamente distribuidos en forma dinámica y en tiempo de ejecución, dependiendo de su disponibilidad, capacidad, desempeño, costo y calidad de servicio requerida por sus usuarios”. Según esta definición, se busca aprovechar la sinergia que surge de la cooperación entre recursos computacionales y proveerlos como servicios. Otra definición más estructurada es la expuesta por Foster, Kesselman y Tuecke, precursores de la computación grid; ésta plantea la existencia de Organizaciones Virtuales (OV) como puntos de partida de su enfoque. Una Organización Virtual es “un conjunto de individuos y/o instituciones definida por reglas que controlan el modo en que comparten sus recursos”. Básicamente, son organizaciones unidas para lograr objetivos comunes. Ejemplos de OVs podrían ser proveedores de servicios de aplicaciones o almacenamiento, equipos de trabajo empresarial realizando análisis y planeamiento estratégico, miembros de una planta de energía evaluando trabajo de campo, universidades involucradas en un proyecto de investigación conjunto, etc. Las OVs varían enormemente en cuanto a sus objetivos, alcance, tamaño, duración, estructura, comunidad y sociología. Sin embargo, existen varios requerimientos y problemas subyacentes tales como la necesidad de relaciones flexibles para compartir recursos, niveles de control complejos y precisos, variedad de recursos compartidos (programas, archivos, datos, sensores y redes, entre otros), modos de funcionamiento (individual, multiusuario), calidad de servicio, etc. Las tecnologías actuales o bien no proveen espacio para la variedad de recursos involucrados o no aportan la flexibilidad y control de las relaciones cooperativas necesarias para establecer las OVs. Foster, I. y Kesselman, C. (eds.). The Grid: Blueprint for a New Computing Infrastructure. Morgan Kaufmann, 1999. 16 http://www.textoscientificos.com/redes/computacion-grid Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia Como solución, se propone la grid como un modelo de trabajo para “compartir recursos en forma coordinada y resolver problemas en organizaciones virtuales multi-institucionales de forma dinámica”. De esta manera, varias instituciones pueden formar distintas OVs e incluso formar parte de más de una al mismo tiempo, realizando diferentes roles e integrando distintos recursos como se muestra en la Figura 1. Organización A Organización B Organización Virtual 1 Organización Virtual 2 Organización C Figura 1. Una organización real puede participar en una o más OVs compartiendo algunos o todos sus recursos. Se muestran tres organizaciones reales (los círculos de puntos) y dos OVs (conformadas por los recursos compartidos en cada caso). Las políticas que controlan el acceso a los recursos varían de acuerdo a las organizaciones reales, los recursos y las OVs involucradas. Nótese que existen recursos que componen una o más OVs y otros que no se comparten. Idem 3. 17 Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia Para lograr este nuevo cometido, se han desarrollado varios protocolos, servicios y herramientas que intentan sustentar organizaciones virtuales escalables. Debido a su enfoque, basado en compartir recursos de manera dinámica y multiorganizacional, las tecnologías grid se complementan en vez de competir con las tecnologías de computación distribuida existentes. 1.3 Tipos de e-Infraestructuras Las e-Infraestructuras han ido evolucionando a medida que aumentan las comunidades de usuarios, las necesidades de herramientas administrativas y de control, el acceso a datos, las mejoras en las redes avanzadas y el procesamiento. Junto con el aumento de la cantidad de grids académicas y nacionales, han comenzado a emerger dos tipos centrados en el área de negocios grid y servicios comerciales de grid. Vamos a describir una tipología de e-infraestructuras que nos permita entender mejor las necesidades de seguridad y comunicación, los grupos de investigación que se benefician al reunirse en entornos grid, las comunidades que se generan para resolver problemas específicos y la extensión al área privada con sus respectivos beneficios. Esta tipología está basada en los lineamientos más generales que se observan del desarrollo del grid computing (computación grid) y es un tema en gran expansión. Cabe mencionar que en sourceforge.net se encuentran a la fecha 1150 proyectos de grid computing dedicados tanto a herramientas grid como a desarrollar soluciones específicas a problemas de investigación y desarrollo tecnológico. El deseo de compartir recursos computacionales, datos y equipamiento especializado requiere de confianza afianzada en protocolos de buen uso, cuotas de acceso, administración de la información generada, seguridad en la transferencia de información y personal administrativo dedicado al mantenimiento del equipamiento, entre otros. Esto se reduce a construir procedimientos y software que ayuden a la estandarización de las diferentes necesidades. Los grupos que se han centrado en este problema han conformado las Grid Computing Organizations. Ellas se centran en: •Desarrollo de estándares y buenas prácticas •Desarrollo de toolkits, frameworks y middleware Aguilar, Gladys. Grid computing para cálculo intensive, Reporte de tesis. Universidad Nacional del Nordeste, Argentina. 18 Grid Computing, IBM Press 2004. Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia •Construcción de soluciones basadas en grid •Trabajo para adoptar conceptos grid en productos comerciales Se utilizará este lineamiento para describir diferentes tipos de eInfraestructuras. 1.3.1 Infraestructura para la e-Ciencia En la construcción de soluciones, el Departmento de Energía de Estados Unidos se ha centrado en desarrollar el DOE Science Grid (DOE: Department of Energy) para apoyar la investigación en el área de energía [www.sciencegrid.org]. En Europa, EUROGrid reúne en una red a los mayores centros de cómputo y al proyecto Data Grid, que trabaja con CERN (dedicado a la investigación en física de altas energías), CNRS (en materia de imágenes biológicas y médicas) y ESA/ESRIN (observaciones geológicas). El proyecto TeraGrid de NSF (Fundación Nacional de Ciencias de los Estados Unidos), trabaja en el lanzamiento de la mayor comunidad científica distribuida. Numerosas organizaciones se han desarrollado en torno a compartir recursos de cómputo y almacenamiento en aplicaciones como: • Astronomía: Astro-grid • Bioinformática: BioinfoGrid, IMPACT, INSTRUCT, Mygrid • Clima: C3 Grid • Geociencias: Degree, NEESit • Física de Partículas: GridPP, HEP Grid • Medicina: MediGRID, neuGRID Sin embargo, algunas se han centrado solamente en cómputo, como NWGrid, en el Reino Unido, reuniendo alrededor de 400 nodos. Otras se han centrado solamente en datos, como GERES-med, repositorio de aplicaciones médicas con sede en Portugal. Finalmente, existen proyectos de e-Ciencia centrados en el uso de instrumentación específica como los radiotelescopios ASTRON y el colisionador de partículas ATLAS, entre otros. 1.3.1.1 Negocios y Cloud Computing En lo referido a las organizaciones comerciales, los esfuerzos se han centrado en compartir recursos y en la virtualización. Esto se traduce en Web 19 Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia services, capacidades de virtualización de hardware, como clusters o blades, y capacidades de software en administración de recursos. Las empresas dedicadas a desarrollar productos son IBM Business on Demand, HP con sus centros de datos y computación utilitaria, Sun Microsystems con la tecnología N1 y Microsoft con la estrategia .NET. En este contexto surge el concepto de cloud computing, donde, manteniendo el concepto de servicio de cómputo bajo demanda, la principal característica está en la propiedad centralizada de los recursos. 1.3.1.2 Infraestructuras Comunitarias (voluntariado) Una de las fortalezas de la computación grid es la posibilidad de reunir a diferentes actores en un trabajo conjunto para cooperar en el desarrollo de diferentes soluciones, como las grids nacionales, o, simplemente, para compartir recursos propios en función de una causa, como voluntarios de una organización benéfica. En el caso de las grid nacionales, han sido los gobiernos quienes han observado el potencial de la computación grid en el desarrollo de la investigación científica y tecnológica de sus países, por ello algunos financian proyectos de integración de universidades y centros de investigación para compartir recursos computacionales y de almacenamiento. Dentro de algunas naciones se encuentran grids de diferentes características, lo cual muestra las ventajas competitivas que aportan al desarrollo. Ejemplos de esto son casi todos los países europeos, China, India, Tailandia, Taiwan, Colombia y Brasil. Las grid nacionales han permitido que los países que las poseen se integren a proyectos mayores de investigación como EELA, entre Europa y Latinoamérica, DEISA, entre los centros de cómputo europeos, o a grids intercontinentales, como EUAsiaGrid, EUChinaGrid y EUIndiaGrid, reportando altos beneficios en términos de investigación y desarrollo. En el caso de la computación voluntaria (volunteer computing), cada voluntario ayuda a crear una grid al compartir sus recursos, esto es, donando el tiempo libre de sus PCs para que investigaciones de alto impacto social puedan desarrollarse. Uno de los primeros proyectos exitosos en este ámbito es BOINC (Berkeley Open Infraestructura for Network Computing, http://boinc.berkeley. edu ), que en su marco lleva a cabo la famosa búsqueda de inteligencia artificial SETI@Home; esta iniciativa opera mediante un protector de pantalla que se activa en los tiempos inactivos del PC del donante/voluntario para analizar las señales 20 http://www.ibm.com/ibm/cloud Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia del radiotelescopio de Arecibo que busca patrones no existentes en la naturaleza. Actualmente SETI@Home cuenta con casi un millón de participantes y más de dos millones de computadores provenientes de 234 países. BOINC ha desarrollado otros 26 proyectos con orientación científica, reuniendo 1,6 millones de usuarios y 3,7 millones de computadores. Otras iniciativas se han desarrollado buscando mejorar las condiciones de vida de todos los habitantes del planeta. Un ejemplo calve es el World Community Grid, con proyectos en energías limpias, alimentación y salud pública. En la misma línea pero en otro ámbito, Grid4all pretende democratizar el acceso a tecnologías de información y hacer que todos quienes están en la red compartan sus recursos10. 1.3.1.3 Servicios Comerciales En torno a la grid se han desarrollado servicios de integración de tecnologías y difusión del conocimiento para que la comunidad conozca, participe y aproveche esta tecnología en su trabajo. Grid Infoware (http://www.gridcomputing.com/) es un sitio dedicado a reunir cientos de proyectos grid en diferentes áreas y documentar su uso y aplicación, mostrando ejemplos concretos de éxito, conferencias, y otros centros de información. Gridtalk se encarga de destacar los proyectos grid europeos, difundiendo los resultados del proyecto EEGE. ICEAGE se encarga de difundir y capacitar en el uso y administración de tecnologías grid a través de escuelas de verano. Otro servicio que ha destacado por su impacto, son las revistas de difusión de computación grid. Grid Computing Planet mantiene en su sitio noticias, avisos publicitarios, desarrollo e implementación de tecnologías, aportando al desarrollo comercial de las soluciones grid. iSGTW - International Science Grid This Week es un semanario de promoción de la computación grid y su impacto en la ciencia; posee más de 3500 lectores en más de 100 países y está financiada por el Departmento de Energía de Estados Unidos y NSF. 10 http://www.worldcommunitygrid.org/ 21 Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia 1.3.2 Elementos de una e-Infraestructura 1.3.2.1 Middleware El middleware permite a las aplicaciones utilizar, de forma conjunta o coordinada, recursos disponibles en diversos centros. Las tecnologías de middleware más utilizadas en entornos científicos son Globus Toolkit, gLite y Unicore, las que se describen a continuación. 1.3.2.1.1 Globus Globus Toolkit es un software de código de fuente abierta que, impulsado por Globus Alliance, permite la construcción de grids. Globus está compuesto por servicios locales para la explotación eficiente de recursos (gestores de colas batch, librerías de programación paralela, herramientas de depuración y monitorización, etc. Ver Figura 2), servicios grid básicos de autenticación y acceso a los datos, información y estructura de los recursos y ejecución de aplicaciones y seguimiento, servicios grid de alto nivel, de acceso rápido y eficiente a los servicios básicos, y herramientas grid para el desarrollo de aplicaciones. El middleware de Globus permite a las aplicaciones emplear, de forma conjunta o coordinada, recursos disponibles en diversos centros. La tecnología más utilizada en entornos científicos parte con Globus Toolkit y es complementada con otros paquetes (Ver Figura 1). 1.3.2.1.1.1 Servicios locales Incluye el desarrollo de herramientas para explotar los recursos en la Intranet del centro de investigación. En este campo existen, en la actualidad, muchos servicios disponibles para realizar un uso eficiente de los recursos locales, de ellos podemos destacar las herramientas de monitorización de los diferentes recursos físicos del cluster, los gestores de colas batch, las librerías de programación paralela, y las herramientas de depuración y monitorización de aplicaciones. 1.3.2.1.1.2 Servicios grid básicos Global Grid Forum es el organismo encargado de definir los estándares de servicios y protocolos necesarios para crear la infraestructura o tecnología grid. Aunque existen otras tecnologías grid como Legion, Unicore o MOL, la mayoría de 22 Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia Aplicaciones Condor- SerGHerramientas MPI GridWay GASS GridFTP Condor LSF Grid Nimrod’G DataGrid CrossGrid Servicios Grid básicos Metacomputing Directory Service MPI PBS Servicios Grid alto nivel SGE Workstations Servids. Unix Desktops Serv. Windows Globus Security Interface Servicios locales Recursos GRAM Replica Catalog I/0 TCP Linux GrADS UDP AIX Solaris Cluster Linux SMFs MPPs Figura 2. Tecnología Grid: Taxonomía de Globus. los proyectos grid actuales se están construyendo basados en los servicios y protocolos proporcionados por Globus Toolkit. La tecnología Globus ha sido seleccionada como estándar de facto por las doce compañías más importantes del sector de computación de altas prestaciones (Compaq, Cray, SGI, Sun Microsystems, Entropia, IBM, Microsoft, Platform Computing y Veridian, en Estados Unidos; y Fujitsu, Hitachi y NEC, en Japón). La versión actual de Globus, basada en Open Grid Services Architecture (OGSA), muestra una clara convergencia hacia la tecnología de Web Services utilizada en el campo del e-Business, a ésta apuesta Globus Toolkit (GT). Esta evolución representa una gran oportunidad para lograr una amplia aceptación y difusión de la tecnología grid, que puede extenderse, al igual que lo hizo la WWW, desde su ámbito original, en el área de la computación científica, al de las aplicaciones comerciales. 23 Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia Globus Toolkit es una colección de componentes de software de código y arquitectura abiertos, diseñados para soportar el desarrollo de aplicaciones de alto rendimiento sobre entornos distribuidos tipo grid. Realmente se trata de un conjunto de componentes autónomos que permiten al diseñador construir una grid. Cada componente proporciona un servicio básico como autenticación, asignación de recursos, información, comunicación, detección de fallos y acceso remoto a datos. Los sistemas y aplicaciones grid pueden desarrollarse empleando los siguientes servicios y protocolos como elemento básico: • GT CORE: Implementa los estándares de OASIS WSRF (Web Services Resources Framework) y WSN (Web Service Notification). • Seguridad, formada por dos servicios: - Grid Security Infrastructure (GSI), que permite la autenticación y comunicación segura sobre redes abiertas. - Community Authorization Service (CAS), que define a los proveedores de recursos políticas de control de acceso para comunidades. • Gestión de datos (Data Management), incluye tres servicios: - GridFTP, protocolo para la transferencia segura y fiable optimizada y su API Global Access to Secondary Storage (GASS Transfer API). - Reliable File Transfer Service (RFT), un servicio OGSA que permite controlar y monitorizar transferencias que usen GridFTP. - Replica Location Service (RLS), que mantiene y provee de acceso a información de localización de datos. • Gestión de recursos (Resource Management), formado por: - Grid Resource Allocation and Management (GRAM), que provee una interfaz para solicitar y usar recursos remotos para la ejecución de trabajos. - Servicios de información (Information Service). • Monitoring and Discovery System (MDS3), que proporciona información sobre los recursos disponibles en el Grid y su estatus. • XIO: Globus XIO es una utilidad de entrada/salida que proporciona una API para el acceso a sistemas de IO. 24 Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia 1.3.2.1.1.3 Servicios Grid de alto nivel A pesar del tremendo esfuerzo realizado por la comunidad científica, la ejecución y la gestión de trabajos en una grid resulta una tarea ardua y difícil, debido principalmente a la naturaleza dinámica y compleja que caracteriza a las grid. Habitualmente el usuario ha de encargarse manualmente de todos los pasos involucrados en la ejecución de un trabajo, como descubrimiento y selección de recursos, inicialización, envío, monitorización, migración y finalización. Para facilitar el uso de esta tecnología, se están desarrollando servicios grid de alto nivel y herramientas que realicen de forma automática y eficiente los pasos que hoy debe llevar a cabo el usuario, además de adaptar la ejecución de un trabajo a las condiciones dinámicas de la grid (disponibilidad, carga, costo, etc.) y a las demandas dinámicas de la aplicación (tiempo máximo de ejecución, presupuesto, necesidad de hardware/software específico, etc.). 1.3.2.1.1.4 Herramientas grid En este nivel se incluyen herramientas de más alto nivel como librerías de programación, entornos especializados para la resolución de problemas y otras herramientas de ayuda al desarrollo de aplicaciones. Éstas se basan en los componentes básicos y de alto nivel. Aunque Global Grid Forum está coordinando un gran esfuerzo colectivo de estandarización, la grid aún es una tecnología en vías de consolidación y su desarrollo está en confluencia con el de los Web Services. Dentro del mundo industrial, también se apoya a esta tecnología a través de Enterprise Grid Alliance. 1.3.2.1.2 gLite Para el proyecto europeo de Habilitación de Grids para e-Ciencia (EGEE), se decidió que lo mejor sería una aproximación en dos fases. Originalmente, EGEE utilizaba una capa intermedia basada en los trabajos de su predecesor, el proyecto de Grid de Datos Europeo (EDG, su sigla en inglés), luego evolucionó hacia una capa intermedia de LCG, la que empleó en sus primeras fases. EGEE ha desarrollado y reestructurado prácticamente la totalidad de esta capa intermedia, convirtiéndola en una nueva solución de middleware: gLite. Ésta hoy se implanta en el servicio de preproducción. gLite combina una capa intermedia básica con una gama de servicios de mayor nivel. 25 Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia Distribuida bajo una licencia de fuente abierta, gLite es favorable para los negocios e integra componentes de los mejores proyectos actuales de capa intermedia, tales como las herramientas Condor y Globus Toolkit, así como componentes desarrollados para el proyecto LCG. El resultado es una óptima solución básica de capa intermedia, compatible con programadores tales como PBS, Condor y LSF; su construcción se ha llevado a cabo con el objetivo de asegurar la interoperabilidad y la provisión de servicios fundamentales que faciliten el desarrollo de aplicaciones en grid en todos los campos. 1.3.2.1.2.1 El desarrollo En el desarrollo del software están colaborando varios centros de investigación académica e industrial, organizados por diferentes actividades: seguridad, acceso a recursos (elementos computacionales y de almacenamiento), contabilidad, gestión de datos, gestión de cargas de trabajo, registro y mantenimiento de libros, información y monitorización, y supervisión y aprovisionamiento del trabajo en red. El desarrollo y la implantación también tienen el apoyo del programa extensivo de infraestructura-f (infraestructura de formación) de EGEE. Éste da un amplio soporte que cubre desde la documentación en línea hasta los seminarios presenciales y los tutoriales transmitidos vía Internet. La formación también está disponible en el banco de pruebas de diseminación GILDA, que cuenta con su propia Autoridad de Certificación (CA) y permite a los usuarios y a los administradores del sistema probar todos los aspectos de la implantación y el uso de gLite. 1.3.2.1.2.2 El producto Los servicios en grid de gLite están basados en una arquitectura orientada al servicio, que permite conectar fácilmente el software a otros servicios en grid, y también facilita el cumplimiento de los estándares futuros en el campo de los grid, por ejemplo el Web Service Resource Framework (WSRF) de OASIS y la Open Grid Service Architecture (OGSA) del Global Grid Forum. gLite está considerado como un sistema modular que permite que los usuarios implementen diferentes servicios según sus necesidades, sin verse obligados a utilizar el sistema completo. Con esto se pretende que cada usuario adapte el sistema a su situación particular. 1.3.2.1.3 UNICORE El sistema UNICORE – Uniform Interface to Computing Resources – fue originalmente concebido en el año 1997 para permitir que los centros de 26 Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia supercómputo en Alemania proveyesen a sus usuarios acceso en forma continua, segura e intuitiva a los recursos heterogéneos en los centros. Como resultado, los proyectos UNICORE 4 y UNICORE Plus 5 fueron financiados por BMBF, el Ministerio Alemán para la Educación y la Investigación, con los objetivos que se refieren a continuación. UNICORE fue diseñado para ocultar las fusiones que resultan de arquitecturas diferentes de hardware, del proveedor de sistemas operativos específicos, de sistemas incompatibles de gestión de recurso y de ambientes diferentes de aplicaciones. Un objetivo clave de UNICORE era retener la autonomía de la organización y la autonomía administrativa de los centros. Para poder utilizar la totalidad de los beneficios ed UNICORE, ninguno de los proveedores de Internet debía ser forzado a cambiar las prácticas históricas de los centros informáticos, ni las convenciones de nombres y políticas de seguridad. Desde el comienzo, la seguridad fue parte del diseño de UNICORE, siempre basándose en el estándar X.509. Los certificados son utilizados para autenticar servidores, el software, y los usuarios, así como para encriptar la comunicación a través del Internet abierto. Por último, UNICORE tenía que ser utilizable por científicos e ingenieros, sin que requiriesen estudiar la documentación del proveedor o del sitio específico. Una interfaz gráfica fue desarrollada para ayudar a los usuarios a crear y gestionar los trabajos. UNICORE soporta el acceso a recursos –computadoras, datos y aplicaciones– para el espectro completo de la estructura organizacional: - Consistente, utilización estandarizada de las diferentes arquitecturas y sistemas dentro de una organización. - Seguridad, acceso basado en Internet a recursos distribuidos geográficamente de una organización global. - Organizaciones virtuales, combinando los recursos de compañías independientes para el soporte de comunidades de usuarios seleccionados. 1.3.2.1.3.1 Seguridad y Confianza La seguridad y confianza son los criterios claves, aquellos que determinan si la tecnología grid será exitosa. UNICORE tiene una arquitectura para dar el soporte 27 Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia a los requerimientos de seguridad más estrictos. Los certificados, de acuerdo al estándar X.509, proveen la base de la arquitectura de seguridad UNICORE; éstos sirven como identificaciones de usuario a través de la grid: son mapeados a las cuentas en diferentes sistemas. Este enfoque tiene tres ventajas significativas, especialmente para organizaciones virtuales: • Los sitios participantes no tienen que cambiar sus convenciones establecidas. • Los usuarios no necesitan saber los nombres de usuarios locales y contraseñas en los distintos sistemas • Los proveedores de recursos pueden siempre identificar el originador de una petición y pueden así cobrar al usuario por el consumo del recurso en forma confiable. La clave privada del usuario es usada para firmar y encriptar la petición, por ejemplo para el envío de los trabajos, los cuales permiten a los componentes del servidor de UNICORE detectar cualquier manipulación que se realice con los datos mientras éste se encuentre en tránsito (a través de Internet) y mapea el certificado a la cuenta apropiada en el sistema objetivo. Los certificados también autentican los sistemas pares mutuamente en una grid UNICORE. El gateway aceptará solamente peticiones desde un cliente o un sistema par que pueda proveer un certificado de confianza. Simétricamente, el cliente se comunicará solamente con Gateways confiables. Los Gateways y otros servidores residen detrás de un firewall. El software cliente es ejecutado desde el sistema personal del usuario – un equipo de escritorio que puede residir en la oficina o a través de un notebook conectado a Internet desde cualquier lugar. Los servidores UNICORE requieren que solamente un puerto y un servicio esté abierto en el firewall por sitio. El código Java que implementa el Gateway es pequeño en tamaño; más aún si éste ha sido profundamente inspeccionado por expertos de seguridad de compañías líderes en TI, tales como T-Systems; aún no se le han encontrado vulnerabilidades. Los certificados, como base para la seguridad, requieren la existencia de una Infraestructura de Clave Pública (PKI). Esencialmente, los participantes en una grid UNICORE tienen que acordar cuáles Autoridades Certificadoras (CA) serán de confianza. Sin embargo, UNICORE no está limitado a exactamente un CA. Durante la operación de una grid UNICORE varios CA pueden ser aceptados concurrentemente. 28 Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia 1.3.1 Arquitectura de Seguridad en la Plataforma Grid En esta sección nos enfocaremos en la seguridad del servicio grid con una discusión detallada sobre los desafíos de seguridad enfrentados por la comunidad grid en general, y luego exploraremos los detalles de las soluciones de seguridad provistos por el OGSA (Open Gris Service Architecture – Globus Alliance11). La compartición de recursos entre los participantes de organizaciones virtuales heterogéneos es un proceso complejo debido a los desafíos enfrentados en la integración, interoperabilidad y relaciones de confianza. Podemos explicar con mayor profundidad examinando los siguientes factores: Desafíos de la Integración: Existen numerosos frameworks de seguridad, estándares e implementaciones disponibles hoy en día. La mayoría de estas organizaciones, individuos y/o recursos tienen sus propias preferencias acerca de los requerimientos de seguridad que sean más convenientes para su propio ambiente. No podemos reemplazar todos estos frameworks de seguridad ni tampoco seremos capaces de tener una alternativa común. Esto implica enfocarse en los participantes para usar los frameworks existentes e integrar en forma continua con ellos. Por tanto la arquitectura de seguridad de OGSA se basa en los mecanismos de seguridad existentes y en su extensión, de tal manera que éste pueda incorporar nuevos servicios de seguridad cuando estén disponibles y que sean capaces de integrarlos con los servicios de seguridad pre-existentes. Desafío de Interoperabilidad: La compartición de estos recursos interoperables puede extenderse en muchos dominios de reinos de seguridad y sus respectivas necesidades de interoperabilidad de seguridad en cada capa de la implementación del servicio. Examinaremos distintos niveles en los siguientes puntos: • A nivel de protocolos, distintos dominios necesitan intercambiar mensajes a través de sus capas de protocolos y necesitan tener interoperabilidad en cada capa del stack de protocolos. • A nivel de políticas, la interoperabilidad de seguridad requiere que cada participante especifique cualquier política que este desea decretar para poder establecer una conversación segura, y estas políticas necesitan interoperar mutuamente. • Al nivel de identidad, se requieren mecanismos para identificar un usuario de un dominio a otro dominio. Para cualquier invocación a través de dominios para ser exitoso en un ambiente seguro, se requiere absolutamente de un mapeo de identidades y credenciales a la identidad del dominio objetivo. 11 http://www.globus.org/ogsa/ 29 Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia Desafío de la Relación de Confianza: La confianza entre los participantes en una organización virtual dinámica es el aspecto más complejo de lograr, y ésta debe ser evaluada por cada sesión o petición. Esto requiere de una federación que asegure la existencia de una relación de confianza entre los participantes. grid. La Figura 3 muestra las categorías de los desafíos de seguridad en un ambiente Integrate Extensible architecture Using existing services Implementation agnostic Figura Interoperate Secure Interoperability Protocol mapping Federation Publish QoS 3. Trust Trust relationship Trust establishment Assertion Categorías de los desafíos de seguridad son complejas en un ambiente grid. 1.3.1.1 Arquitectura de Seguridad OGSA La arquitectura de seguridad OGSA enfrenta los problemas de arriba a través de mecanismos de seguridad que son plug-and-play en el lado del cliente y del servicio. El ambiente grid requiere una plataforma OGSA con el mecanismo de seguridad para dar el soporte, integrar y unificar modelos de seguridad populares, mecanismos, protocolos, plataformas y tecnologías. Elementos de Seguridad Común requeridos para un ambiente grid Autenticación Provee puntos de integración para múltiples mecanismos de autenticación y el medio para converger el mecanismo específico utilizado en cualquier operación de autenticación dada. 30 Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia Delegación Ofrece facilidades para la delegación de derechos de acceso de los solicitadores a los servicios. Estos derechos de acceso delegados deben ser transferidos a las tareas a ser realizadas, y por un tiempo limitado, para poder limitar el riesgo de mal uso. Ingreso de una sola vez Esta capacidad permite a un servicio de usuario utilizar múltiples recursos con un solo proceso de ingreso explícito y, por tanto, de ahí para adelante automáticamente delegar la misma credencial autenticada para los siguientes accesos de recursos sin la necesidad de la intervención del usuario, dentro de un periodo específico de tiempo. Estas sesiones de ingreso pueden incluir acceso de recursos en otros dominios usando una delegación de credencial de servicio. Ciclo de vida de la credencial y renovación Las credenciales tienen un tiempo de uso limitado, y la mayoría de los trabajos grid pueden tomar bastante tiempo en ejecutarse. Esto puede causar que las credenciales sean invalidadas, llevando al sistema a un estado también inválido. Para evitar esto, un sistema grid debe soportar notificaciones de no expiración de credencial y facilidades de revalidación de la misma. Autorización Este modelo permite el acceso controlado a los servicios OGSA basados en políticas de autorización (p.ej., quién puede acceder a un servicio y bajo qué condición) adjuntos a cada servicio. Además, esto permite a los solicitantes especificar políticas de invocación (p. ej., en quién confía el cliente confía para proveer el servicio pedido). La autorización debería acomodar varios modelos de control de acceso e implementaciones. Privacidad Las políticas de privacidad deben ser tratadas como un tipo de política de autorización que trae la semántica de privacidad a una sesión de uso del servicio. Similar a la autorización, la seguridad OGSA debe permitir tanto al solicitante y al servicio forzar las políticas de privacidad, por ejemplo, tomando en cuenta cosas como la información identificable personal (PII), el propósito de la invocación, etc. Confidencialidad Proteger la confidencialidad del mecanismo de comunicación subyacente (transporte de servicios de red), y la confidencialidad de los mensajes o documentos que fluyen sobre el mecanismo de transporte en una infraestructura compatible OGSA. El requerimiento de confidencialidad incluye transporte punto a punto, como también mecanismos de almacenamiento y envío. 31 Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia Integridad de Mensajes Éste provee mecanismos para detectar el cambio no autorizado a los mensajes. El uso del chequeo de la integridad de los mensajes o de los documentos es determinado por una o más políticas, a su vez definidas por la Calidad de Servicio (QoS) de la prestación. Intercambio de Políticas Permite a los clientes y servicios intercambiar información de políticas en forma dinámica, para establecer un contexto de seguridad negociado entre ellos. Tal información de políticas contendrá requerimientos de autenticación, soporte de funcionalidad, restricciones, reglas de privacidad, etc. Registro Seguro Para eliminar el repudio, la notarización y auditoría, se provee facilidades de registro (logging) para que todas las conversaciones sean seguras, especialmente para el registro de negociaciones. Aseguramiento Provee un medio para calificar el nivel de aseguramiento de la seguridad que puede ser esperada desde un ambiente de hospedaje. Éste puede ser utilizado para expresar características de protección del ambiente, tales como protección de virus, utilización de firewall, acceso VPN interno, etc. Manejabilidad Provee manejabilidad de funciones de seguridad, tales como administración de identidad, administración de políticas, administración de clave secreta y otros aspectos críticos. Firewall Trasversal Los firewall de seguridad están presentes en la mayoría en la redes de sistemas distribuidos para prevenir que mensajes no deseados ingresen a un dominio respectivo. La grid, siendo una organización virtual, nota que los firewalls pueden causar desafíos en la transferencia de mensajes entre los participantes. Esto obliga al modelo de seguridad de OGSA a rodear la protección del firewall sin comprometer la seguridad del host local. Asegurando la Infraestructura de OGSA Asegurando la infraestructura de OGSA se asegura el OGSI (Open Grid Services Infrastructure). El modelo debe incluir aseguramiento de componentes como Grid HandleMap, servicio de descubrimiento, etc. 32 Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia 1.3.1.2 Servicios de Seguridad La arquitectura de seguridad de OGSA tiene una tarea insuperable en el establecimiento de un modelo de seguridad para capturar todos los requerimientos indicados en los párrafos anteriores. Como una progresión natural, la arquitectura de seguridad de OGSA está alineada con el modelo de seguridad de Web Services. La Figura 4 muestra el modelo de la arquitectura de seguridad de OGSA. Intrusion management Antivirus management Policy management Secure Conversation privacy rules Access Control Authorization Enforcement Credential Identity Mapping service policy authorization policy User management Policy expression and exchange (WSDL, WS-SecurePolicy, WS-Policy) Key management Binding seWS-WS-Security) identity mapping rules Figura 4. Arquitectura de seguridad de OGSA. La Figura 4 muestra el modelo de seguridad del núcleo utilizado en el ambiente grid. Todos los servicios grid se comunican entre sí, basados en un conjunto de lazos especificados por los servicios. Éstos deben tratar con los detalles de seguridad incluyendo confidencialidad de mensajes, integridad y autenticación. Normalmente hablando, estos lazos son inicializados en un conjunto de políticas basado en tiempo de ejecución. Estas políticas de seguridad pueden ser especificadas como documentos estáticos, tales como documentos WSDL o Política-WS, o pueden ser negociados en tiempo de ejecución basado en las capacidades del cliente y el servicio. Las políticas comunes especificadas incluyen elementos soportados tales como mecanismo de autenticación, confidencialidad/integridad requerida, políticas de confianza, políticas de privacidad, y afirmaciones de seguridad. Una vez que el cliente del servicio grid y los proveedores de servicio descubren la política 33 Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia de seguridad receptiva, ellos pueden entrar en un modo de conversación segura y establecer un canal resguardado para el intercambio de mensajes. Este canal debe también forzar todas las garantías de QoS de seguridad que fueron acordadas. A continuación se exploran los detalles de cada uno de estos componentes en más detalle, para comprender mejor las tecnologías de interés en cada capa del modelo de componentes de seguridad. 1.3.1.3 Elementos anexos de Seguridad La anexión de seguridad de transporte incluye SOAP, IIOP, JMS, HTTP, etc, y cada uno de estos protocolos de transporte tiene diferentes requerimientos de seguridad para la autenticación, integridad de mensajes y confidencialidad. Por ejemplo, HTTP y SSL combinados comprenden “HTTPS” como un canal de conversación segura, garantizando la integridad y la confidencialidad de los mensajes, aún con la limitación de un protocolo de canal punto a punto. Este protocolo de servicio de red puede también requerir servicios de coordinación de más alto nivel para flujos de extremo a extremo a través de intermediarios (p. ej., firewalls, proxy servers, etc.). En el caso de los mensajes SOAP, el modelo WS-Security provee un patrón de intercambios seguros, utilizando los encabezados SOAP como el portador de intercambio de información de seguridad. La integridad y confidencialidad de los mensajes SOAP pueden ser luego protegidas usando firmas digitales con XML y estándares de encriptación; WS-Security luego provee perfiles de seguridad para el intercambio de esta información. Otra infraestructura de ligamiento de nivel de seguridad incluye CSIv2 para la comunicación basada en IIOP adoptada por los proveedores de CORBA y el J2EE 1.4 como un estándar obligatorio para el intercambio de mensajes seguros IIOP. 1.3.1.4 Expresión e Intercambio de Políticas Para que pueda existir un intercambio de mensajes seguros, tanto la petición del servicio como el proveedor del mismo deben acordar ciertas políticas para que ocurran la recepción segura del mensaje y la conversación. Este acuerdo de políticas debe llevarse a cabo anticipadamente (p.ej., información estática) o en tiempo de ejecución (p. ej., dinámica), y las mejores posibles selecciones de ligamientos de seguridad deben ser realizadas tanto dellado del proveedor del servicio con en el de la petición del servicio de conversación. La grid, siendo un ambiente altamente dinámico, también requiere políticas dinámicas y decisiones que deben 34 Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia ser efectuadas en tiempo de ejecución. Estas políticas dinámicas pueden estar asociadas con el servicio WSDL o ser intercambiadas a través de negociaciones colaborativas. Uno de los candidatos tecnológicos notables en las áreas de intercambio de políticas es WS-Policy, el cual detalla cómo los proveedores y las peticiones de servicio pueden especificar sus requerimientos y capacidades respectivas. La próxima capa está relacionada a la naturaleza y aplicación de estas políticas. Esto es, una asociación segura entre los puntos terminales del servicio; mapeo de identidades y traducción de credenciales, y políticas de autorización y de privacidad los que proveen control de acceso a los servicios. 1.3.1.5 Asociación segura En el contexto grid, las comunicaciones entre el que pide y el que provee un servicio son, a menudo, conversaciones de largo alcance a través de varios intercambios de mensajes. La arquitectura de seguridad OGSA especifica crear un contexto seguro durante la negociación inicial entre el cliente y el servicio, mientras utiliza el mismo contexto para proteger los mensajes subsiguientes. El contexto seguro es luego acoplado con el transporte de los servicios de red y este concepto está ya disponible con la mayoría de los protocolos de seguridad (p. ej., SSL y IIOP-CSIv2). Para el ambiente de cómputo grid OGSA, el soporte de conversación segura es provisto usando el protocolo WS-SecureConversation. 1.3.1.6 Mapeo/Traducción de Identidad y Credenciales Un ambiente grid consiste de múltiples confianzas (p. ej., organizaciones virtuales) y dominios de seguridad. Para cruzar las fronteras del dominio se requiere autenticación mutua. Así, existe un requerimiento para mapear y/o traducir las credenciales desde un dominio a otro. Esta interoperación necesita una “federación” de dominios y sus mecanismos de seguridad. Esta federación puede ser lograda a través del mapeo y/o traducción de identidades y/o credenciales desde un dominio a otro utilizando algún servicio intermediario de confianza, gateways o proxies. En el contexto de Web services, hay algún trabajo que define esta federación de patrón y modelo de intercambio de mensajes. La comunidad grid espera la WS-Federation para llegar a ser un enfoque basado OGSA de servicios grid. 35 Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia 1.3.1.7 Reforzamiento de autorización La autorización para acceder a un recurso es controlada por políticas reforzadas en el lado del ambiente del proveedor del recurso. Hoy en día, hay varios mecanismos de autorización comerciales disponibles a través de la industria. Los más prominentes son la autorización basada en el rol, la basada en la regla y la basada en la identidad. La selección de estos mecanismos está completamente referida a los requerimientos de servicio, capacidades de hospedaje de la plataforma y el dominio de la aplicación (p. ej., B2B, B2C, G2C, etc.). WS-Authorization provee detalles más concretos de cómo son especificadas y administradas las políticas de acceso para servicios grid y Web services. En los escenarios grid actuales, la mayoría de los accesos a los recursos es controlado considerando la identidad de quien hace la petición. Esto requiere que el recurso mantenga una lista de control de acceso (ACL) con la identidad del usuario final, o con su identidad mapeada. En el segundo caso, debe ocurrir un mapeo o traducción de la identidad antes que el usuario final pueda acceder al o los recursos. 1.3.1.8 Reforzamiento de Privacidad Mantener el anonimato, o la capacidad de retener la información privada, es uno de los requerimientos de núcleo en muchos ambientes de servicios grid. Las organizaciones involucradas en el mundo grid pueden necesitar declarar sus requerimientos de privacidad y, a la inversa, pueden necesitar monitorear la privacidad de los resultados de reforzamiento de ésta. La especificación WSPrivacy provee mecanismos para describir un modelo, incrustar información privada e intercambiar esta información en conjunto con los mensajes. En el caso de requerimientos de protección de privacidad que deben ser declarados a los clientes, el ambiente grid debe adherirse al modelo WS-Policy, y así alinearse con los esfuerzos P3P del W3C. 1.3.1.9 Confianza Cada miembro de una Organización Virtual va a tener una infraestructura de seguridad que incluya el servicio de autenticación, registro de usuario, motor de autorización, firewalls, protección a nivel de red y otros servicios de seguridad. Estas políticas de seguridad son definidas en el dominio de seguridad en el cual ellos existen. Este modelo autocontenido requiere una confianza entre los miembros de la organización virtual antes que ellos puedan acceder a los servicios anteriores. Ésta puede ser llamada “membresía en la Organización Virtual” y permitirá un conjunto de políticas entre los participantes de la Organización Virtual, políticas de 36 Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia mapeo de identidad y credenciales, y/o una membresía con el lado de confianza a través de algunos proxies o gateways. El modelo de confianza grid está basado en la especificación WS-Trust. 1.3.1.10 Servicios de Seguridad de Núcleo para OGSA Para poder lograr las capacidades anteriormente mencionadas, el estándar de seguridad grid OGSA ha definido un conjunto de servicios abstractos encima de la plataforma y del framework de seguridad existente. Estos servicios son expuestos a través del WSDL. La Figura 5 detalla los servicios de la plataforma de seguridad OGSI y sus relaciones con otros componentes OGSA. A continuación exploraremos con más detalle los candidatos de servicio de seguridad: • Servicio de Autenticación. Valida la identidad del que pide el servicio. Un ejemplo puede ser el mecanismo de autenticación básico donde la identidad del usuario y contraseña son validados dentro del registro del usuario. • Servicio de mapeo de identidad. Provee una función de mapeo de identidad donde una identidad de servicio puede ser mapeada a otra identidad de servicio en otro dominio. Estos servicios no están relacionados con el servicio de autenticación. • Servicio de Autorización. Resuelve la petición para acceder a un servicio verificando las políticas de acceso asociado con la petición. El servicio de seguridad OGSA se basa en el mecanismo de control de acceso al ambiente del equipo usando la identidad del peticionario del servicio y las políticas asociadas con este último. • Servicio de políticas de organización virtual. El servicio de seguridad OGSA puede utilizar el framework de políticas OGSA para proveer el almacenamiento, aplicación y validación de políticas. • Servicio de conversión de credenciales. Responsable para la conversión de credencial de usuario a otro tipo o forma de credencial. • Servicio de auditoría. Responsable de producir los registros de las actividades de seguridad y de hacerlo sobre la base de las políticas especificadas. • Servicio de perfiles. Se refiere a la creación y el almacenamiento de los perfiles, incluyendo los datos personales. • Servicio de privacidad. Está relacionado con la clasificación de políticas. Estos servicios pueden ser utilizados para forzar los requerimientos de privacidad para un servicio de petición y del proveedor. 37 Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia OGSA Services OGSA Security Service Candidates No Security Authentication Authorization ID mapping VO Policy Credential Mapping Privacy WS-Security, WS-Trust, WS-Secure Conversation, WS-Policy, WS-Privacy,... OGSI XML Audit/Profile Native Registries and Services IIOP/HTTP/SSL/SOAP Figura 5. Componentes de seguridad de la plataforma OGSA. 38 Capítulo II: Estado del Arte Internacional 2 Capítulo II Estado del Arte Internacional 2.1 Introducción “Hay cientos de grid computacionales alrededor del mundo. Muchas se están usando en e-Ciencia, posibilitando la ejecución de proyectos que serían imposibles de realizar sin el poder computacional de la grid. • “Los biólogos están empleando grids para simular miles de posibles drogas en sus computadores, con el objetivo de descubrir una molécula capaz de bloquear proteínas específicas de ciertas enfermedades. • “Los científicos de la Tierra están empleando grids para registrar los niveles de ozono, usando satélites, descargando diariamente cientos de Gigabytes de datos (¡el equivalente a 150 CDs cada día!) • “Los físicos de altas energías están aplicando las grids en su búsqueda por una mejor comprensión del Universo, sobre la base de una grid de decenas de miles de computadoras de escritorio para almacenar y analizar los 10 Petabytes de datos (¡equivalentes a los datos que pueden contener alrededor de 20 millones de CDs!) producidos anualmente por el Gran Colisionador de Hadrones (Large Hadron Collider). Miles de físicos en docenas de universidades alrededor del mundo quieren analizar esos datos.. • “Los ingenieros están usando las grid para estudiar energías alternativas, tales como la fusión de energía. • “Los artistas hoy usan las grid para crear complejas animaciones para las películas (puedes ver un buen ejemplo en Kung Fu Panda). • “Los cientistas sociales hoy estudian la vida de las abejas, el maquillaje que emplea nuestra sociedad y los secretos de la historia, mediante el uso de las grid. • “... y más, más, ¡mucho más! 39 Capítulo II: Estado del Arte Internacional “La computación grid no solo provee los recursos que permiten a nuestros científicos manejar grandes colecciones de datos, además permite que estos datos estén distribuidos por todo el mundo, los que significa que los equipos de científicos pueden trabajar en proyectos internacionales desde la comodidad de sus propios laboratorios. “La computación Grid está brindándole poder a la ciencia de todo el orbe, al proveerle de la tecnología que se requiere para explorar nuevos modos de hacer ciencia. Hoy los científicos pueden compartir datos, espacio de almacenamiento de datos, poder computacional y resultados. Unidos, los investigadores pueden hoy, como nunca antes, enfrentar de mejor modo los grandes cuestionamientos: desde la cura a las enfermedades y el manejo de desastres, hasta el calentamiento global y los misterios del universo”12. Las grid internacionales cruzan las fronteras de los países, expandiendo las culturas, las lenguas, las tecnologías y más, para crear recursos internacionales y darle poder a la ciencia global, empleando computación global. 2.2 Incorporación de HPC en el mundo Estos grandes centros de HPC (high performance computing – computación de alto rendimiento) en el mundo están conformados por grandes clusters que se unen a través de una grid como un estándar para compartir recursos distribuidos y accesibles a través de Internet; en ellos es posible compartir el cálculo, el almacenamiento y la información, entre otros. La evolución de las redes de comunicación de alta velocidad dedicadas a la investigación y las tecnologías y aplicaciones colaborativas, están creando un escenario idóneo para la interacción entre investigadores. La herramienta más utilizada en entornos científicos es Globus Toolkit, software de código fuente abierto, impulsado por Globus Alliance, que permite la construcción de grids. En poco más de cinco años, tanto en Estados Unidos como en Europa se han puesto en marcha diferentes proyectos grid, entre los que se destacan el proyecto EELA (con financiamiento europeo y participación de países europeos y latinoamericanos) y PRAGMA GRID (Estados Unidos). 12 GridCafe, Las Grid del Mundo, en: [http://www.gridcafe.org/las-grid-delmundo_ES.html] 40 Capítulo II: Estado del Arte Internacional 2.3 Proyectos de e-Infraestructuras A continuación se presentan algunos de los proyectos grid que son actores de este nuevo concepto de la computación. En la tabla se da cuenta del nombre del proyecto y de la institución coordinadora, y se entrega una breve explicación del mismo, las aplicaciones que soporta, los recursos locales, el capital humano que se necesita para su administración y algunos recursos grid. 2.3.1 APGRID (www.apgrid.org) Institución Coordinadora National Institute of Advanced Industrial Science and Technology(AIST) Países Participantes Australia, Canadá, China, Hong Kong, India, Japón, Malasia, Nueva Zelanda, Filipinas, Singapur, Corea del Sur, Taiwán. Tailandia, USA, Vietnam Instituciones participantes • Australia: APAC, ANU, Monash U., U. of Melbourne, Sydney VisLab,U. of Adelaide, Griffith U. • Canadá : National Research Council, CANARIE • China: ICT/CAS, CNC/CAS, SDB/CAS • Hong Kong : CSIS/HKU, Computer Center/HKU • India: CDAC, U. of Hyderabad • Japón: AIST, TITECH, U. of Tsukuba, RIKEN, KDDI, Osaka U., NAIST, Doshisha U., Kyushu Inst. of Technology, U. Tokyo, RACE / U. Tokyo, Waseda U. • Malasia :USM, UTM • Nueva Zelanda: U. of Otago • Filipinas: Ateneo de Manila Univ. • Singapur: NGO, iHPC, NTU, NUS, SCS, APSTC • Corea del Sur: KISTI • Taiwán: NCHC, ASCC • Tailndia: NECTEC, Kasetsart U., KMITNB • U.S.A.:Indiana U., SDSC, San Jose State U. • Vietnam: MOSTE, NCST Integración Abierta a la comunidad Área científica / Aplicaciones Earth Science: Climate simulation, Fluid simulation, Earthquake engineering. Bio Informatics: Genome science Sitio web www.apgrid.org 41 Capítulo II: Estado del Arte Internacional Comunidad del Asia - Pacífico vigente desde el 2001 para crear testbeds (sitios de prueba), promover las tecnologías grid y otras labores de desarrollo de tecnologías grid propiamente tales, como Ninf-G. Su propósito es desarrollar una asociación entre las comunidades de Asia y el Pacífico, considerándose como un punto de encuentro para todos los investigadores, además de ser un canal de comunicación a la GGF, la red y hacia otras comunidades (por ejemplo, TeraGrid, UK-eScience, EUGrid, etc). Participan actualmente 49 organizaciones de 14 países. Enhance Economic Competitiveness of the Rigion by Increasing the Research Power for Science and Technology Execution of Asia Pacific Grid Application Project Emerging Industry : IT,BT, NT ET, etc. Industry: Semiconductor, Car, Steel, Machimery, etc. al Gri sive Grid ) ten Large capacity Storages Research Instruments R&D Resources In Asia Countries n In omputatio (NGI Killer Application) Computers C -( APGrid Implementation Project ess Gri d) Acc -( Grid Project & Support In the Asia Pacific d) - (Dat a Grid Creative Experts Middleware (Globus, KMI-R1, ...) High Speed Networks (APII,STARTAP, Sing AREM, ...) 2.3.1.1 Recursos Grid Globus Toolkit 2 MPICH-G2: Data-parallel Programming Ninf-G2: Task-parallel Programming SCMSWeb: Resource monitoring Nimrod-G: Parametric modeling system Iperf: Network measurement Grid Data Farm: Grid File System 42 Capítulo II: Estado del Arte Internacional 2.3.2 AUSTRIAN GRID (www.austriangrid.at) Institución Coordinadora Miembros del consorcio de las instituciones participantes. Países Participantes Austria Instituciones participantes • Institute of Graphics and Parallel Processing, Johannes Kepler University • Department of Computer Sciences, University of Salzburg • Institute of Computer Science, University of Innsbruck • RISC-Research Institute for Symbolic Computation, Johannes Kepler University • Department of Distributed Systems, University of Vienna • Department of Telecooperation, Johannes Kepler University • Research Lab Computational Technologies and Applications, University of Vienna • FAW, Johannes Kepler University • Department of Distributed and Multmedia Systems, Universtiy of Vienna • Department of Informations Management, Johannes Kepler University • Department of Knowledge and Business Engineering, Universtiy of Vienna • University of Applied Sciences Vorarlberg • Kanzelhoehe Observatory for Solar and Environmental Research, Karl Franzens University Graz • Institute of Bioinformatics, Johannes Kepler University • Core Unit for Medical Statistics and Informatics,Medical University of Vienna • Institute of Materials Chemistry,Vienna University of Technology • Institute of Meteorology and Geophysics Innsbruck, University of Innsbruck • Institute of Computational Mathematics, Johannes Kepler University • Institute for Mathematics and Scientific Computing, Karl Franzens University Graz • Institute for Informatics, University of Innsbruck • Department of Scientific Computing, University of Vienna • Institute of Astro- and Particle Physics, University of Innsbruck Integración Abierto a la comunidad científica austríaca Área científica / Aplicaciones Investigación base en middleware grid; evaluación de grids a través de diseño de aplicaciones científicas; establecer un centro de servicios computacionales distribuido en Austria y sustentable en el tiempo; promover desarrollo de proyectos entre la industria e investigadores. Principalmente, hay proyectos del área de física de altas energías Sitio web www.austriangrid.at 43 Capítulo II: Estado del Arte Internacional Ministerium Eu Projekt Management Koordinator J. Volkert, B. Buchberger, D. Kuhn Projektbüro PAK R. Kobler, W. Schreiner, T. Fahringer AGFZ Austrian Grid Forschungszentrum AGFZ Austrian Grid Entwicklungszentrum AGFZ Austrian Grid Servicezentrum Grudlagen 18 WP Risc Software GmbH Leiter Integrierte Anwendungen 8 WP Aufbau eines Entwicklungszentrums 1 WP Aufbau einer nachhaltigen Infrastruktur 3 WP Sonstige Anwendungen Projektkoordinierungskomitee Red nacional austriaca cuya investigación fundamental es en el ámbito de los middleware de la red informática, además del establecimiento de un centro de servicios que integre investigación y aplicaciones industriales. Austrian Grid está financiada por BMWF (Federal Ministry of Science and Research). La organización de la grid considera la siguiente estructura: AGFZ: Centro de Investigación de la grid austriaca, realiza investigación básica en grandes redes, desarrolla prototipos y apoya los investigadores que utilizan la tecnología grid para sus proyectos. AGEZ: Centro de Desarrollo; sirve como punto de encuentro para la industria y la investigación. Su objetivo es el desarrollo de cooperaciones y servicios para el uso industrial de la tecnología Grid. 44 Capítulo II: Estado del Arte Internacional AGSZ: es el centro nacional de EGI (Iniciativa de Grid Europea). Ejecuta y mantiene la infraestructura de la red austriaca. 2.3.2.1 Recursos Locales Capacidad de Cómputo 722 cores Almacenamiento 16 Tb Software Servicios Heredados de EGEE Redes Otros Site Master RAM SI00 SF00 LRM ALTIX-UIBK altix1.uibk.ac.at 16 16 0 15026 1078 1942 torque JKU altix1.jku.austriangrid.at 64 57 7 65536 1078 1942 pbs JKU hydra.gup.uni-linz.ac.at 16 16 0 2025 667 633 pbs JKU lilli.edvz.uni-linz.ac.at 256 256 0 993322 1335 3020 Marvin blade.labs.fhv.at 24 23 1 7971 1000 950 sge dps-prod karwendel.dps.uibk.ac.at 112 110 0 15401 1499 1861 sge hc-cluster hc-ma.uibk.ac.at 234 132 37 3899 877 833 sge 722 610 45 Total CPUs Free Jobs (Fuente: http://agrid.uibk.ac.at/austriangrid/ ) 45 Capítulo II: Estado del Arte Internacional 2.3.2.2 Recursos Grid Middleware gLite, basado en EGEE. 2.3.3 BalticGrid II (www.balticgrid.org) Institución Coordinadora KTH - Royal Institute of Technology, Suecia Países Participantes Estados Bálticos Instituciones participantes Estonia, Latvia, Lithuania, Belarus, Polonia, Suiza, Suecia. Integración Miembros de BalticGrid solamente. Área científica / Aplicaciones High Energy Physics, Material Science and quantum chemistry, framework for engineering modelling task, nano-sciences, engineering sciencs, linguistics, bioinformatics and biomedical imaging Sitio web http://www.balticgrid.eu/ BalticGrid tiene como propósito establecer una infraestructura de grid para apoyar a científicos bálticos y bielorrusos a través del consorcio BG-II. Proyecto financiado por la Unión Europea mediante el Séptimo Programa Marco, en el área de actividad de “Infraestructuras para la Investigación”, FP7-INFRA-2007-1.2.3. Su período de ejecución se extiende desde el 1 de mayo de 2008 hasta el 30 de abril de 2010. 2.3.3.1 Recursos Locales Capacidad de Cómputo 4200 CPU en total en 26 sitios Almacenamiento 500 Tb Software Gamess, MPI Servicios Heredados de EEGE Redes Otros 46 Capítulo II: Estado del Arte Internacional Según http://www.balticgrid.eu/Activities/SA1_Activity/resources : Lituania: * 32 nodos con procesadores Pentium Celeron, 100GB de almacenamiento, apoyo de BalticGrid, DTeam VO-s. UI disponible para usuarios locales. * 4 nodos Itanium 2, 20 GB de almacenamiento, apoya a la OV BalticGrid, UI disponible. Polonia: * 34 nodos Itanium 2 1.3 GHz, 60GB de almacenamiento, apoya a las OV de Alice, BalticGrid, Biomed, CompChem, DTeam y Voce. UI disponible para usuarios locales. * 50 nodos Itanium 2 1.3 GHz, 250GB de almacenamiento, apoya a las OV de BalticGrid, DTeam y otras. Estonia: * 6 AMD Athlon MP, 2 TB de almacenamiento, apoya a las OV de BalticGrid, CMS, Estonia, DTeam. * 10 AMD Athlon64 3500+, 7 TB de almacenamiento, apoya a las OV de BalticGrid, CMS, DTeam, UI disponible para usuarios locales * 25 nodos (dual Opteron 275) cluster, 14 TB de almacenamiento. Latvia: * 21 AMD Opteron (146), 1.7 TB storage, supports BalticGrid, CMS, OPS, GAMESS, LHCb, BGtut VO-s. UI available for local users. * 5 nodes 20cores(Dualcore-Opteron 275) * 1 node P4, 5GB storage 2.3.3.2 Recursos Grid Interopreación entre UNICORE, ARC, gLite, integrado en BalticGrid. Un sistema interesante es el de “Grupos de Soporte de Aplicaciones”, que, conformado por un equipo de técnicos, brinda soporte a los usuarios, operando como interfaz entre los científicos y los administradores de cada sitio. Estos equipos se conforman en cada país para ayudar en los procesos de migración de las aplicaciones al ambiente de grid. 47 Capítulo II: Estado del Arte Internacional 2.3.4 The Belgian Grid for Research (Begrid) (www.begrid.be) Institución Coordinadora Belgian National Research Network (BELNET) Países Participantes Bélgica Instituciones participantes Hogeschool Antwerpen, Katholieke Universiteit Leuven, Universiteit Antwerpen, Universiteit Gent, Université Libre de Bruxelles, Vlaams Instituut voor de Zee, Vrije Universiteit Brussel Facultés Universitaires Notre-Dame de la Paix (Namur) En proceso de incorporación : Faculté Polytechnique de Mons, Centre of Excellence in Information and Communication Technologies y Vlaams Instituut voor Technologisch Onderzoek Integración Abierta a miembros de BELNET Área científica / Aplicaciones Ciencia en general: física de altas energías, astrofísica, ciencias de la Tierra, etc. Sitio web www.begrid.be BEgrid es la infraestructura de grid de cómputo y datos de la grid belga para la investigación. 2.3.4.1 Recursos Locales Capacidad de Cómputo 1000+ cores Almacenamiento 3 Tb Software Servicios Heredados de EEGE Redes Otros BEgrid cuenta con 1000 CPUs y 3 terabytes de capacidad de almacenamiento. La capacidad de cálculo y almacenamiento se distribuye entre los distintos participantes en el proyecto: * Cluster BELNET: VOMS, broker de recursos, UI, BDII, LFC, no hay nodos de trabajo 48 Capítulo II: Estado del Arte Internacional * FUNDP: 3 nodos de trabajo (6 CPUs) * HA: 4 nodos de trabajo * K.U.Leuven: UI, 46 máquinas, 4 servidores, 42 nodos de trabajo (232 CPUs) * UA: RB, UI, 81 máquinas, 5 servidores, 76 nodos de trabajo (160 CPUs) * UGent: RB, UI, 79 máquinas, 8 servidores, 72 nodos de trabajo (230 CPUs) * VLIZO: 6 nodos de trabajo (412 CPUs), 10 Tbyte de almacenamiento * VUB/ULB: RB, UI, 71 máquinas, 20 servidores, 51 nodos de trabajo (232 CPUs) 2.3.4.2 Recursos Grid BEgrid escogió a gLite como middleware. Esta elección fue motivada por el estado avanzado del software y su aplicación en ambientes de investigación en muchos países europeos. 49 Capítulo II: Estado del Arte Internacional 2.3.5 BiG Grid - Grid Holandesa de e-Ciencia (http://www.nwo.nl) Institución Coordinadora Países Participantes Instituciones participantes • Stichting Nationale Computer Faciliteiten • Nederlands Bio-Informatica Centrum • Nationaal Instituut voor Kernfysica en Hoge-Energie Fysica Holanda • DANS • LHC Computing Grid : La misión de proyecto LHC Computing (LCG) es el de construir y mantener un almacenamiento de datos y análisis de toda la infraestructura para la comunidad de física de altas energías que utilizará el LHC. • LOFAR: Estudio de señales electrónicas • Netherlands Bioinformatics Centre NBIC: Coordina la investigación y actividades de apoyo para estimular el desarrollo del campo de la bioinformática en los Países Bajos. • Philips Research COS group,: Investigación Privada • Virtual Laboratory for e-Science Application Programme: Ligado a la investigación de ciencias ed datos intensiva, informática alimentaria, imágenes biomédicas, biología de sistemas, ecología y tele-ciencia, entre otros. • Centrum voor Klimaat Onderzoek: El Centre for Climate Research (CKO) es una cooperación entre el Institute for Marine and Atmospheric Research (IMAU) de la Universidad Utrecht, el National Institute of Public Health and Environmental Protection (RIVM), y el Royal Netherlands Meteorological Institute (KNMI). El objetivo principal de CKO es mejorar la coordinación y la cooperación entre las partes en el ámbito de la investigación climática. Integración Área científica / Aplicaciones Comunidades de investigadores holandeses: ciencias de la vida, astronomíam física de partículas, meteorología, e investigación en clima y manejo de aguas. Sitio web www.biggrid.nl Big grid es un consorcio de instituciones que tiene como propósito realizar una grid nacional como infraestructura para la e-Ciencia, que permita integrar y mantener la continuidad de muchas comunidades de investigación holandesas, que abarcan ámbitos tan importantes como las ciencias de la vida, astronomía, física de partículas, meteorología, clima y gestión del agua, entre otros. El consorcio nació en 2005, con un financiamiento de 30M euros para un período de 4 años. La propuesta es un esfuerzo de colaboración de NCF, NBIC y NIKHEF. 50 Capítulo II: Estado del Arte Internacional 2.3.5.1 Recursos Locales Capacidad de Cómputo Almacenamiento Software Servicios Redes Otros Los planes del 2005 para BiG Grid eran los que se muestran a continuación: BIG GRID capacity in 2009 In today’s (2005) technology this would correspond to 27600 kSI2k 10530 processors Mass storage on tape 7910 Terabyte 1700000 DVD’s Fast disks 6190 Terabyte 1317000 DVD’s Disk caches and data acquisition space 1670 Terabyte 20875 home PC disks Total compute cluster capacity Big Grid dispone de servicios de almacenamiento y procesamiento de datos, distribuidos como se explica en los siguientes párrafos. 2.3.5.2 SARA Reken en Netwerkdiensten - Iniciativa Holandesa de grid (www.sara.nl) 2.3.5.2.1 Recursos Locales •CPU con alto flujo de información: 36 kSI2k (MATRIX), 460 kSI2k (GINA), 1875 kSI2k (LISA) •Capacidad de cómputo de CPU: vía NCF Procesamiento de Datos Nikhef •CPU con alto flujo de información: 960 kSI2k (PRD) •Almacenamiento: 86 Terabyte sólo disco de red 51 Capítulo II: Estado del Arte Internacional Future housing: Philips Research: PHICOS •CPU con alto flujo de información: - kSI2k () • Almacenamiento: - Terabyte sólo disco de red Futuro sitio de albergue: Rijks Universiteit Groningen Centrum voor Informatie Technologie (RUG-CIT) • CPU con alto flujo de informaciónt: 300 kSI2k Para el proyecto se consideran entre otros costos operacionales, dos system managers por cuatro años, por un total de 800.000 € (100.000 € anuales cada uno). 2.3.5.2.1 Recursos Grid No se explica en detalle. 2.3.5.3 The Hungarian ClusterGrid Infrastructure (CG) (www.mgkk.hu) Institución Coordinadora Países Participantes Hungría Instituciones participantes Eötvös Loránd University of Sciences (ELTE), Technical University of Budapest (BME), Computer and Automation Research Institute of the Hungarian Academy of Sciences (MTA-SZTAKI), Office for National Information and Infrastructure Development (NIIF/HUNGARNET). Integración Abierto a miembros de NIIF/HUNGARNET Área científica / Aplicaciones Sitio web www.clustergrid.iif.hu El proyecto ClusterGrid aspira a integrar el procesador Intel basado en PC en un conjunto de clusters único, amplio, de extensión nacional, interconectados. Los PC son provistos por participantes de institutos húngaros, tales como colegios secundarios, universidades o bibliotecas públicas; la infraestructura central y la coordinación es provista por NIIF/HUNGARNET. Cada institución que contribuye al proyecto usa sus PCs para sus propios propósitos durante las horas laborales, por ejemplo para propósitos educacionales o de trabajo de oficina, y ofrece su infraestructura para altos flujos de información cuando no están empleándola para sus propósitos, durante las noches o los fines de semana que no se trabaja. El uso combinado durante el día (modalidad individual) y la noche (modalidad 52 Capítulo II: Estado del Arte Internacional grid), le permite a ClusterGrid emplear los ciclos de CPU (que de cualquier modo estarían perdidos) para proveer de una fuerte infraestructura computacional a la comunidad nacional de investigación. El proyecto inició sus operaciones en el año 2003 y hasta el 2005 tuvo participación activa de sus miembros. A partir de dicha fecha, la iniciativa pasó a ser el Centro Húngaro de Competencias en Computación Grid (MGKK, su sigla en húngaro) (www.mgkk.hu). 2.3.5.3.1 Recursos Locales Capacidad de Cómputo Almacenamiento Software Servicios Redes Otros En su inicio (2003), se disponía de nodos de trabajo con procesadores Intel de 1,6 Ghz, destacando el buen rendimiento en I/O. Los PC son del tipo IBM Intellisation E Pro o HP vectra. En la actualidad, la configuración soporta tareas secuenciales y tareas paralelas mediante la biblioteca PVM (Parallel Virtual Machine). Dispone de herramientas de desarrollo de software basadas en GNU como compiladores (gcc, g++, g77) junto con PVM, accesibles en la máquina de enterada. También dispone de herramientas de software de desarrollo de Condor, tales como condor_compile. 53 Capítulo II: Estado del Arte Internacional Recursos disponibles en enero de 2009 Institución Ubicación Ciudad Número de Nodos Budapest Business School Library Budapest 40 Budapest Polytechnic Tavaszmező str. Budapest 100 Budapest Polytechnic Bécsi str. Budapest 62 Budapest Polytechnic Népszínház str. Budapest 20 Budapest University of Economic Science Sóház Building and Public Administration Budapest 20 College of Dunaújváros SZSZK Dunaújváros 60 Eötvös Loránd University Lovarda Center Budapest 100 Eötvös Loránd University DB Lab Budapest 60 Eszterházy Károly College, Eger Central Building Budapest 80 Georgikon Faculty of Agriculture Computer Lab 1 Keszthely 40 Hungarian University of Craft and Design Central Building Lab Budapest 16 Kempelen Farkas Student Information Kálvin sqr. and Resource Center Budapest 250 Pázmány Péter Catholic University Práter street Budapest 40 Kölcsey Ferenc College Main Building Debrecen 20 Semmelweis University Computer Lab 1 Budapest 18 Semmelweis University Student>s Center Budapest 20 Szent István University Library Gödöllő 20 Szent István University AOTK Budapest 20 Széchenyi István University Building B Gyõr 130 Technical University of Budapest HSZK Budapest 60 University of Debrecen Central Building Debrecen 60 University of Kaposvár ATK Kaposvár 20 University of Miskolc IIS Building Miskolc 18 University of Pécs Faculty of Technical Sciences Pécs 23 54 Capítulo II: Estado del Arte Internacional University of Pécs Faculty of Natural Sciences Pécs 20 University of Szeged EFK Szeged 40 University of Szeged TIK Szeged 160 University of Veszprém Central Building Veszprém 40 University of West Hungary Library Sopron 60 Zrínyi Miklós University of Defense Library Budapest 20 2.3.5.3.2 Recursos Grid Los servidores de la grid-bone (GBone) son máquinas IBM X220, el punto de entrada central es un computador Dell PowerEdge 2650 que incluye dos procesadores 2.0 GHz Xeon. El sistema operativo generalmente es Linux: en los PC hay distribuciones RedHat 7.3, en las máquinas en la GBone hay Debians y RedHats. El planificador local es Conder. Cada laboratorio es tratado como un grupo Condor individual y los distintos grupos están interconectados por un mecanismo de agrupación Condor nativo. El punto de entrada es un conjunto Condor “singular”. 2.3.5.4 Croatian National Grid Infrastructure (CRO NGI) Iniciativa Nacional Croata de Infraestructura Grid (http:// www.cro-grid.hr) Institución Coordinadora University Computing Centre, Sarajevo, Croacia (SRCE) Países Participantes República de Croacia Instituciones participantes SRCE, FESB, IRB, ETFOS, GRADRI Integración Miembros de solamente. Área científica / Aplicaciones Cómputo científico en general Sitio web http://www.cro-ngi.hr/index.php?id=1334&L=1 La Iniciativa Nacional Croata de Infraestructura Grid es un entorno integrado de cómputo y almacenamiento. Es un recurso compartido que sirve a la comunidad académica y científica de Croacia. Su financiamiento es a través del gobierno croata. El proyecto corresponde a la segunda fase de CRO-GRID, ejecutado entre 2004 y 2009. 55 Capítulo II: Estado del Arte Internacional 2.3.5.4.1 Recursos Locales Capacidad de Cómputo 204 cores Almacenamiento 5.1 Tb Software Sun Grid Engine (SGE) / Torque / Maui MPICH Compiladores Intel C y Fortran Intel Math Kernel Library (MKL) Gaussian Librerías matemáticas NAG para Fortran Servicios Redes Otros En la fuente están disponibles los siguientes servicios centrales: * MyProxy - sistema para almacenamiento, rescate y refrescamiento automatic de credenciales de usuarios. * Globus WS MDS - servicios centrales de sistemas de monitoreo WS MDS. 56 Capítulo II: Estado del Arte Internacional Sitio RAM (por nodo) Capaccidad e almaccenammiento (por nodo) SpecInt (por nodo) Nodos Uso Modelo Arquittectura Proccesammientto o cores 3 servidor central HP ProLiant DL385 G2 x86_64 2 Dual-Core AMD Opteron 2.2 GHz 8 GB 70 GB 1 elemento de almacenammiento HP ProLiant DL385 G2 x86_64 2 Dual-Core AMD Opteron 2.2 GHz 8 GB 5.1 TB 1 frontend HP ProLiant DL385 G2 x86_64 2 Dual-Core AMD Opteron 2.2 GHz 8 GB 70 GB 12 nodo de trabajo HP ProLiant BL460c G1 x86_64 8 Intel Xeon 2.3 GHz 16 GB 140 GB 10136 1 elemento de almacenammiento i386 2 Intel Xeon 3.2 GHz (32-bit) 2 GB 1.2 TB 1 frontend HP ProLiant DL385 G2 x86_64 2 Dual-Core AMD Opteron 2.2 GHz 8 GB 70 GB 12 nodo de trabajo HP ProLiant BL460c G1 x86_64 8 Intel Xeon 2.3 GHz 16 GB 140 GB 10136 1 frontend i386 1 Intel Pentium 4 2.4 GHz 1 GB 80 GB 3 nodo de trabajo HP ProLiant BL20p G2 i386 2 Intel Xeon 2.8 GHz (32-bit) 2 GB 36.4 GB 2150 1 frontend i386 1 Intel Pentium 4 2.8 GHz 1 GB 40 GB 3 nodo de trabajo HP ProLiant BL20p G2 i386 2 Intel Xeon 2.8 GHz (32-bit) 2 GB 36.4 GB 2150 Modelo del procesados Srce FESB IRB ETFOS GRADRI 57 Capítulo II: Estado del Arte Internacional 2.3.5.4.2 Recursos Grid Globus 2.4 y Globus 4. Ganglia. Los sistemas están fuertemente influenciados por EGEE, debido a proyectos anteriores. 2.2.5.5 Distributed European Infrastructure for Supercomputing Applications (DEISA) (http://www.deisa.eu/science/) Institución Coordinadora Rechenzentrum Garching (RZG) of the Max Planck Society Países Participantes España, Francia, Reino Unido, Alemania, Italia, Holanda y Finlandia Instituciones participantes Barcelona Supercomputing Center, IDRIS-CNRS, European Centre for Medium-Range Weather Forecast, Edinburgh Parallel Computing Centre, Jülich Forschungcetre, HLRS, LRZ, RZG, CINECA, SARA, CSC Integración Abierto a miembros de instituciones del consorcio, asistentes a talleres y afiliados a comunidades científicas virtuales asociadas a DEISA. Área científica / Aplicaciones Dinámicas moleculares Ciencias de los materials, Nanociencia Biomédica, Ciencia de los Materiales Biofísica Modelamiento de sistemas terrestres Astrofísica computacional Dinámicas de fluidos computacionales, fluidos mecánicos, turbulencia Dinámicas de fluidos computacionales, aeroacústica computacional, descomposición de dominios heterogéneos, computación de ruido directo Química física Investigación de fusión, física de plasma Flujo y control de volatilidad, fluidos dinámicos computacionales Física de partículas teorética, Cromodinámica de Quantum Lattice Investigación en clima computacional Física de plasma, Conceptos de acelerador avanzados Temblores Hazard, Sismología computacional Física de partículas Sitio web www.deisa.eu La Infraestructura Europea Distribuida para Aplicaciones de Supercomputación (Distributed European Infraestructure for Supercomputing Applications - DEISA) 58 Capítulo II: Estado del Arte Internacional es un consorcio de instituciones de investigación europeas que tiene por objetivo reunir los mayores centros de HPC a través de una grid para e-Ciencia. DEISA 1 comienza el año 2002 en el marco del Sexto Programa Marco de la Comisión Europea, FP6, para el financiamiento de proyectos científicos de integración y fortalecimiento de la colaboración entre los países de la Unión Europea. El 2008 se activa DEISA 2, con un aporte del FP7 de 12.237.000 euros para 36 meses (éste se extiende hasta el 2011). 2.3.5.5.1 Recursos Locales Capacidad de Cómputo 895,5 Teraflops/segundo en 134944 cores Almacenamiento 218.1 Terabytes Software Servicios Redes A través de la red paneuropeaGÉANT se conectan las redes nacionales SURFnet, FUNET, DFN, GARR, RedIRIS, RENATER y UKERNA. Otros 59 Capítulo II: Estado del Arte Internacional Beneficiario Arquitectura TeraFlop/s #Cores Tbytes RAM Horas CPU comprometidas BlueGene/ P 27.0 8,192 4.0 3,000,000 IBM Power6 120.0 6,4 20.0 2,400,000 62.3 9,728 39.0 4,000,000 IBM PowerPC 94.2 10240 20.0 3,000,000 IBM Blade Center 26.6 5120 10.0 2.000.000 IBM Power5 3.9 512 1.0 200.000 Cray XT4 dc 10.1 2,024 2.0 750 Cray XT4 qc 70.0 6,736 7.8 2,500,000 BlueGene/ P 223.0 65,536 32.0 23,000,000 8.9 1,312 5.0 460 > 50 n/a n/a n/a 6.7 1800 10 600.000 IBM p690+ successor > 40 n/a n/a n/a IBM Power5+ 14.6 1920 7.7 750 IBM Power6 60.2 3328 15.6 1,250,000 UEdin-EPCC Cray XT4 65.0 11,52 35.0 4,000,000 UStutt-HLRS NEC SX-8 13.0 576 9.0 200 MPG-RZG BAdW-LRZ BSC CINECA CSC SGI-Altix Itanium IBM p690 cluster JUMP FZJ JUMP successor IBM p690+ IDRIS-CNRS SARA Cluster (fuente: http://www.deisa.eu/services/infrastructure ) De acuerdo a http://www.deisa.eu: CINECA (Italia): arquitectura P5-575 incorporando 512 procesadores. El rendimiento máximo es de 3.9 Teraflops. ECMWF (organización internacional): Dos clusters P5-575+ incorporando 2276 procesadores cada uno. El máximo rendimiento agregado es de 33 Teraflops. 60 Capítulo II: Estado del Arte Internacional EPCC/HPCx (Reino Unido): P5-575 (16 nodos de procesamiento) incorporando 2560 procesadores. El rendimiento máximo de desempeño es de 15.36 Teraflops. FZJ (Alemania): arquitectura P690 (32 nodos de procesamiento), incorporando 1312 procesadores. El rendimiento máximo de desempeño es de 8.9 Teraflops. IDRIS-CNRS (Francia): La arquitectura mezcla P690/P690+ (32 nodos de procesamiento) y P655+ (4 nodos de procesamiento), incorporando 1024 procesadores. El rendimiento máximo de desempeño es de 6.7 Teraflops. RZG (Alemania): arquitectura P690 incorporando 896 procesadores. El rendimiento máximo de desempeño es de 4.6 Teraflops. El super cluster AIX (CINECA, ECMWF, EPCC/HPCx, FZJ, IDRIS, RZG). BSC (España): 10240 Power PC 970 con procesador IBM Linux system, 20 TB de espacio en memoria, 370 TB de espacio en disco. El máximo desempeño alcanza los 94.2 Teraflops. CSC (Finlandia): Cray XT4 system, 2024 procesadores centrales, 2.6 TB de espacio en memoria. El máximo rendimiento es de 10.5 Teraflops. La configuración se actualizaba en la segunda mitad del 2008, con 6736 procesadores core y un rendimiento máximo de más de 70 Teraflops. HLRS (Alemania): supercomputador vector NEC SX8, 576 procesadores, 9.2 TB de espacio en memoria, 180 TB de espacio en disco. El máximo rendimiento es de 12.7 Teraflops. LRZ (Alemania): sistema SGI Altix Linux, 9728 procesadores centrales, 39 TB de memoria principal, 660 TB de espacio en disco. El máximo rendimiento es de 62.3 Teraflops. SARA (Holanda): IBM Power 5+ sistema Linux, 1920 procesadores centrales, 7.7 TB de memoria principal. El máximo rendimiento es de 14.6 Teraflops. A mediados de 2008, el sistema debía ser extendido a una capacidad de memoria de más de 15 TB y a un rendimiento máximo de 60 Teraflops. Capital humano con dedicación sólo a gestionar los recursos locales: desarrolladores, científicos, estudiantes. 61 Capítulo II: Estado del Arte Internacional 2.3.5.5.2 Recursos Grid El objetivo desde el punto de vista grid es habilitar un entorno de trabajo que atraviese los centros de HPC de Europa y que permita la ejecución de trabajos y acceso a datos de una forma similar a si se estuviera trabajando en uno sólo de ellos. En particular, la forma de construir la grid se desglosa en las siguientes áreas: Servicio de administración de datos: troncal IBM>s Multicluster General Parallel File System (MC-GPFS), apoyada por la interconexión a través de la red GÉANT. Esto permite un espacio de directorios único, transparente para cada sitio DEISA. Como solución alternativa para casos especiales se utiliza GridFTP de Globus. Servicio de administración de trabajos: están disponibles los middleware UNICORE, DESHL y Globus. Las conexiones entre sitios son principalmente a través de Globus y IBM Multicluster LoadLeveler, mientras que la interfaz de usuario suele ser UNICORE. Servicio de administración de usuarios: se basa en una red distribuida de servidores LDAP que almacena usuarios, grupos y proyectos. También se cuenta con un sistema de contabilidad unificado para monitorear el estado de consumo de recursos a través de toda la grid. Entorno de producción común: DEISA entrega una lista estandarizada de software, compiladores y utilidades instaladas en todos los sitios. Gateway científicos: facilitan el uso de recursos ocultando la complejidad al usuario. Por ejemplo, el Portal Life Science permite ejecutar trabajos desde una interfaz web. 2.3.5.6 Grid 5000 plataforma de investigación en informática (http://www.grid5000.fr) Institución coordinadora: Iniciativa francesa, liderada por CNRS e INRIA además de universidades francesas asociadas. Es posible integrarse sólo a través de las universidades asociadas. – Proyecto semi cerrado. 2.3.5.6.1 Proyecto grid: GRID 5000 está formulado como iniciativa de grid de investigación informática en computación de altas prestaciones. Se constituye como plataforma abierta a múltiples aplicaciones provenientes de laboratorios de investigación en múltiples disciplinas asociadas a las universidades participantes. La idea es soportar un grupo 62 Capítulo II: Estado del Arte Internacional de investigación científica, al servicio de los asociados. El grupo directivo propone realizar llamados de propuestas de investigación, en períodos de seis meses a estos laboratorios de investigación. Las solicitudes debidamente priorizadas recibirán sus tiempos de proceso en uno o varios bloques. 2.3.5.6.2 Aplicaciones que soporta: Plataforma de uso general, las aplicaciones responden al resultado de las propuestas presentadas cada seis meses por los investigadores asociados. 2.3.5.6.3 Recursos locales: Capacidad de cómputo, almacenamiento, software, servicios, redes, etc. La red está formada por diez centros de 500 nodos de proceso cada uno (de ahí el nombre grid 5000). La arquitectura está formada por clusters locales, basados en computadores de bajo costo (2.000 euros) con una red local de alta velocidad y una red de interconexión global de 2Gbps. 2.3.5.6.4 Capital humano: El personal local de manejo del recurso consiste en dos ingenieros de planta. No hay mención al ambiente de investigadores que, como se mencionó, corresponde a un llamado de concurso de proyectos de investigación. 2.3.5.6.5 Recursos grid: Servicios grid, cómputo, datos, software, políticas. En definición e investigación, ya que el proyecto incluye el diseño de middleware. El financiamiento proviene de fondos europeos y los asociados tienen libre acceso a la grid. El proyecto también financia los equipos locales. No están incluidos los costos de tráfico de red global. El proyecto tiene una asignación de 1.500.000 euros en tres años. Un elemento a destacar es que se trata de una plataforma de uso general; se realian llamados para presentar propuestas de trabajo, con lo cual se benefician todos los grupos de investigación asociados. Como el proyecto sólo provee la plataforma, no se hace necesario invertir recursos en buscar aplicaciones específicas. 63 Capítulo II: Estado del Arte Internacional 2.3.5.7 GRID.IT, Proyecto de computación Grid del Instituto Nacional de Investigaciones de Italia (www.grid.it) Institución coordinadora: Instituto Nacional de Investigación de Italia, con la participación de los siguientes centros: •Information Science and Technologies Institute (ISTI-CNR) - Pisa; •Institute for High Performance Computing and Networking (ICAR-CNR) Cosenza y Nápoles; •Institute for Molecular Sciences and Technologies (ISTM-CNR) - Perugia; •Italian Institute for Nuclear Physics; •Italian Space Agency, Center for Space Geodesy - Matera; •Photonic Networks Laboratory, CNIT Consortium, Pisa. 2.3.5.7.1 Proyecto grid: La propuesta es de carácter interdisciplinaria, su objetivo es la definición, implementación y aplicación de soluciones innovadoras, ejecutadas sobre plataformas de red, orientadas a la creación de organizaciones virtuales, basadas en el paradigma de la computación grid. Los tópicos de investigación abarcan desde redes fotónicas de alto rendimiento, nuevos servicios middleware, ambientes de programación de altas prestaciones, etc. La propuesta incluye el desarrollo de algunos pilotos, seleccionados de los campos de aplicación de máximo interés, no sólo por su ganancia científica, sino también por actuar como “testbed” para plataformas de grid de alto rendimiento. 2.3.5.7.2 Aplicaciones que soporta: Los pilotos provienen de algunos de los siguientes campos: •Observación de la Tierra •Geofísica •Astronomía •Biología y Genómica •Química computacional. 64 Capítulo II: Estado del Arte Internacional 2.3.5.7.1 Recursos locales: No especifica los recursos individuales, pero de las organizaciones participantes, como ICAR-CNR, se desprende que disponen de equipamiento de alto poder de cómputo. 2.3.5.7.2 Capital humano: Cada uno de los centros que componen GRID.it corresponde a unidades de investigación y coordinan la participación de investigadores de otras instituciones y otros departamentos universitarios que mantienen los grupos de investigación más calificados en Italia, así como un grupo seleccionado a partir de grupos de investigación internacionales. Este es un proyecto semicerrado, donde el acceso es a través de los institutos participantes. 2.3.5.7.3 Recursos grid: La arquitectura de GRID.it está basada en VOMS (Virtual Organization Membership Service), Grid Policy Box y Data Accounting System. Los servicios se integran en una grid gLite/LCG, y su uso se lleva a cabo mediante el sistema de administración de carga (WMS) operando en EGEE (Enabling Grid for European E-science) 2.3.5.8 GRID-IRELAND (cagraidsvr06.cs.tcd.ie) Institución coordinadora: Autoridad de Educación Superior (Higher Education Authority); en Irlanda, las universidades y otras instituciones de educación superior e investigación están representadas en el gobierno a través de esta Autoridad. Los sistemas informáticos en dichas instituciones están interconectados a travésde HEANet (red de investigación y educación irlandesa). Grid-Ireland es una capa administrada sobre HEAnet que provee servicios grid. 2.3.5.8.1 Proyecto grid: El objetivo es habilitar comunidades de usuarios, por ejemplo astrofísicos, genetistas o lingüistas, para construir organizaciones virtuales sobre Grid-Ireland. El principio rector es que puede haber múltiples organizaciones virtuales, pero sólo se requiere una grid. El beneficio es una plataforma de investigación para científicos y un objeto de investigación para científicos del área de computación, además de la simbiosis natural que se produce entre ellos. 65 Capítulo II: Estado del Arte Internacional 2.2.5.8.2 Aplicaciones que soporta: Las aplicaciones están asociadas a las distintas organizaciones virtuales activas en Grid-Ireland: Cosmogrid: grid para el cómputo de fenómenos físicos. WebCom-G: Cómputo distribuido, transparente para los usuarios. Marine-Grid: minería de datos sobre recursos estratégicos para Irlanda. Genegrid: Grid de bioinformática. SoloVO: Organización virtual no alineada. GITest: Organización virtual de prueba para investigación y desarrollo. EireVO: Organización virtual para un Observatorio Virtual. HESS: Sistema estereoscópico de alta energía. 2.3.5.8.3 Recursos locales: Los recursos de la grid están administrados y localizados en el Centro de Operaciones, que dispone de 17 gateways de conexión a los sitios de los clientes de la grid. La gestión de recursos (brokerage), la administración de Organizaciones Virtuales, la replicación de datos y el repositorio de software son administrados localmente. El poder de cómputo reside sobre un cluster de 96 nodos quad-dual core, totalizando 798 núcleos de cálculo conectado vía Gigabit Ethernet, con capacidad de 130TB de almacenamiento en dispositivos RAID. 2.3.5.8.4 Capital humano: GRID-Ireland funciona en el Centro de Operaciones con un total de 8 funcionarios de tiempo completo, a cargo de la administración e la infraestructura y los pilotos. El personal científico está asociado a las Organizaciones Virtuales y provienen de las instituciones de educación superior e investigación asociadas a Grid-Ireland. 2.3.6 Recursos grid El Centro de Operaciones provee los servicios necesarios para crear y soportar organizaciones virtuales. Esto incluye a LCG como asignador de recursos, y a gLite como sistema de administración de carga de trabajo. 66 Capítulo II: Estado del Arte Internacional 2.3.6.1 METACENTRUM (http://meta.cesnet.cz/cms/opencms/ en/about/meta/index.html) Institución coordinadora: Gobierno de la República Checa. Está disponible sólo para investigadores de esa nacionalidad. 2.3.6.1.1 Proyecto grid: METACENTRUM es una grid que une centros de supercómputo de la República Checa, con el propósito de obtener un ambiente heterogéneo de computación de altas prestaciones, disponible para investigadores del país. El proyecto nace a mediados de la década de los 90, a partir de iniciativas individuales. Se destaca la experiencia de los investigadores checos, quienes en 2002 obtuvieron dos de las tres distinciones en la Conferencia de Supercómputo de aquel año, por la aplicación con mayor distribución geográfica, el mayor ancho de banda sostenido y la distinción a la plataforma grid más heterogénea. 2.3.6.1.2 Aplicaciones que soporta: METACENTRUM es en conjunto una institución de supercómputo multipropósito. Se destacan algunas de las aplicaciones activas: •Química computacional y modelamiento molecular. •Simulación de técnicas y materiales. El proyecto dispone de un gran rango de programas de máximo nivel para el desarrollo de simulaciones de dinámica de fluidos, mecánica de sólidos y disciplinas asociadas. •Modelamiento estadístico y matemático. •Ambientes y herramientas de desarrollo. 2.3.6.1.1 Recursos locales: METACENTRUM tiene una amplia variedad de hardware. Incluye máquinas multiprocesadores con memoria compartida, clusters conformados por muchas unidades de 2 a 4 CPU, comunicados por Gigabit Ethernet, Myrinet e INfiniband (20GB/seg), con el propósito de crear un metacomputador virtual, haciendo uso de clusters ubicados en las ciudades de Brno, Praga y Pilsen. 67 Capítulo II: Estado del Arte Internacional 2.3.6.1.2 Capital humano: METACENTRUM es una grid muy cerrada. Para las reglas de uso se solicita acceder a la página en idioma checo. Su propósito es servir de plataforma y no informa sobre el recurso humano asociado a la red. 2.3.6.1.3 Recursos grid: No proporciona información sobre la estructura interna y middleware utilizado. Cuenta con una unidad de desarrollo de ambientes y herramientas. 2.3.6.2 NW-GRID (North Western Grid) (http://www.nw-grid. ac.uk/) Es una colaboración entre el Laboratorio de Daresbury y las universidades de Lancaster, Liverpool y Manchester de Inglaterra. Esta grid está compuesta por sistemas de cómputo de alto rendimiento acoplados por una red de fibras de alta velocidad entre los sitios. Los servicios que se ofrece son de clase mundial en el despliegue y explotación de tecnologías middleware grid, llevando a cabo aplicaciones de ingeniería y de ciencias de la computación. www.nw-grid.ac.uk. Institución coordinadora: Daresbury Laboratory y las universidades de Lancaster, Liverpool y Manchester. 2.3.6.2.1 Proyecto grid: Es una grid cerrada con fines de lucro para socios comerciales e industriales, proveyendo horas de núcleos de CPU; también se cobra por el uso de sus códigos de programas. Otras instituciones del mundo que deseen aportar a la investigación pueden incorporarse como aplicaciones de proyectos académicos. 2.3.6.2.2 Aplicaciones que soporta: •Biología y Bioinformática •Modelamiento Biológico •Propiedades ópticas de materiales •Geometría computacional •Simulación computacional de materiales •e-Minerales •Modelamiento del océano y de la costa 68 Capítulo II: Estado del Arte Internacional •Sismología •Monitoreo de inundaciones •Nanotecnología •Simulación física de múltiples partículas para el diseño de acelerador de partículas •Simulación cosmológica de N-cuerpos •Modelos de procesos estocásticos eficientes •Minería de texto 2.3.6.2.1 Recursos locales: Los clusters están basados en multi core, nodos multi procesadores AMD Opteron con al menos 8Gb de memoria por nodo y, para nodos más grandes, con 16 y 32Gb. Los nodos en cada sitio son: •Daresbury: 96 nodos 2.4 GHz twin dual-core CPU •Lancaster: 48 nodos 2.6 GHz twin dual-core CPU •Lancaster: 67 nodos 2.3 GHz twin quad-core CPU •Liverpool: 104 nodos, 2.2 GHz twin dual-core y 2.3 GHz twin quad-core CPU •Liverpool: 108 nodos, 2.4 GHz twin dual-core y 2.3 GHz twin quad-core CPU y red InfiniPath •Manchester: 25 nodos 2.4GHz twin dual-core CPU Daresbury, Lancaster y Liverpool tienen 8 TB de almacenamiento accedido por servidores de archivos Panasas. Además, hay arreglos de discos RAID de 2.8 TB en Manchester y 24 TB en Lancaster y Liverpool. Los nodos están conectados por Gigabit Ethernet separando los datos de la comunicación y los 108 nodos en el cluster Liverpool están conectados con InfiniPath. Además de estos núcleos hay otros sistemas de cómputos que están conectados al NW-GRID. •Daresbury: IBM BlueGene-L (2048 cores) •Daresbury: IBM BlueGene-P (4096 cores) •Daresbury: 2560-nodos IBM 1.5 GHz Power5 •Daresbury: 32-nodos Harpertown cluster •Daresbury: 32-nodos Woodcrest cluster con aceleradores ClearSpeed •Lancaster: 124-nodos Streamline/Sun cluster 2.4 GHz twin dual-core (HPCF) 69 Capítulo II: Estado del Arte Internacional •Liverpool: 96 node, 196 core Xeon x86 cluster con 5.7 TB de almacenamiento •Liverpool: 960-nodos Dell cluster, Pentium IV processors •Manchester: 44 nodos dual-processor Opteron cluster, 2.5 TB RAID de almacenamiento basado en 2 GHz Opterons con 2 GB RAM. •Manchester: SGI Prism con 8 Itanium2 processors y 4 ATI FireGL X3 graphics pipes. 2.3.6.2.1 Capital humano: En cada centro existe a lo menos un técnico y un operador de la grid, más un director del proyecto. Existe un directorio a cargo de la organización del NW-GRID en el laboratorio de Daresbury. 2.3.6.2.2 Recursos grid: e-Ciencia y ciencias de cómputo aplicado, son las fortalezas particulares en el North West de Inglaterra. Más abajo se describe el trabajo en el middleware y las tecnologías empleadas para desplegar y administrar infraestructuras computacionales distribuidas (las grid). La infraestructura NW-GRID usa el núcleo middleware adoptado por el programa de e-Ciencia del Reino Unido: Globus, Condor y SRB (Intermediario de Recursos de Almacenamiento); es compatible con el servicio nacional de grid. El trabajo en proyectos NW-GRID se enfoca a dar valor agregado a su infraestructura entregando un middleware amistoso para el usuario. Las salidas de este trabajo, en desarrollo, incluyen lo siguiente. • GROWL: Recursos grid en la librería de estaciones de trabajo • GROWL Scripts: Comandos scripts para acceder y monitorear recursos grid y para la instalación de middleware • Multar: Acceso grid usando el lenguaje R para cómputo estadístico y bioinformático, basado en GROWL. • RMCS: Sistema de tres capas que implementa un flujo e trabajo simple para cargar datos y aplicaciones grid pre-compiladas, ejecutar trabajos grid y descargar la salida. • RCommands: Conjunto de comandos para crear y administrar meta datos a través de aplicaciones grid. • Agentx: Conjunto de herramientas y librerías para la interoperabilidad de datos entre aplicaciones de ciencia computacional. Usa tecnologías semánticas tales como OWL y RDF. 70 Capítulo II: Estado del Arte Internacional • G-R-Toolkit: Nuevo grupo de herramientas que combina GROWL, GROWL Scripts, RMCS y RCommands en un solo paquete. • GridKit: Middleware Grid de nueva generación 2.3.6.3 NorGrid (www.norgrid.no) Iniciativa grid noruega que persigue establecer y mantener una infraestructura de grid nacional en Noruega. El proyecto provee servicios basados en grid que realzan la utilización de los recursos en la infraestructura nacional para la ciencia de la computación y aplicaciones transparentes desarrolladas para compartir datos entre grupos de usuarios. El objetivo de esta grid es hacer de Noruega un socio atractivo para colaboraciones grid internacionales. www.norgrid.no. Institución coordinadora: UNINETT Sigma (operador de la infraestructura de red en Noruega). Los socios del NorGrid son la Universidad de Ciencia y Tecnología de Noruega (NTNU), la Universidad de Bergen (UiB), la Universidad de Oslo (UiO), la Universidad de Tromso (UiT) y UNINETT. 2.3.6.3.1 Proyecto grid: NorGrid es un proyecto abierto a todas las investigaciones en Noruega, tratar de unir los esfuerzos grid operacionales del país y reducir la administración y la sobrecarga organizacional de la cooperación internacional en proyectos de infraestructura grid. 2.3.6.3.2 Recursos locales: Los recursos de hardware están localizados en las distintas universidades del consorcio noruego NOTUR. Entre los sistemas más importante se encuentran: Hexagon: basado en Cray XT4, tipo MPP, con 1388 nodos y 5552 núcleos, basados en la arquitectura Opteron, con un total de 6064 GB en memoria y 288 TB en capacidad de disco; se ubica en la Universidad de Bergen. Njord: sistema de memoria compartida distribuida; consiste de 65 nodos IBM p575+, con 944 núcleos interconectados con una red de switch de baja latencia (HPS), con un total de memoria de 2272 GB y 120 TB de espacio en disco. Se encuentra en la Universidad de Ciencia y Tecnología de Noruega (NTNU). Stallo: cluster de cómputo con 704 servidores blade HP BL 460c, cada uno con dos procesadores Quad CoreXeon de 2,66 Ghz con un total de 5632 núcleos. 384 71 Capítulo II: Estado del Arte Internacional nodos están interconectados con InfiBand. Memoria total de 12064 GB y 128 TB de espacio en disco. Este sistema está localizado en la Universidad de Tromso. Titan: emplazado en la Universidad de Oslo, consiste en un cluster de cómputo Sun X2200, con 304 nodos y 2432 núcleos Sun/Opteron. 2.3.6.3.3 Capital humano: El soporte técnico lo aporta cada institución. Los científicos pueden postular para recibir el soporte de usuarios avanzados, el que los ayuda a mejorar o extender el rendimiento y las capacidades de sus aplicaciones, ya sea incluyendo paralelización del código, portabilidad, optimización, benchmarking, mejora de las interfaces de usuario y desarrollo de software. La postulación se realiza mediante UNINETT Sigma. 2.3.6.3.4 Recursos grid: El recurso de software para grid se fundamenta en los distintos paquetes de software requeridos para dar soporte a las aplicaciones, entre ellas: •BioCiencia: Blast, ClustalW, EMBL data bank, EMBOSS, FAMHAP, Fasta, FSL, GenBank, GROMACS, HT-BLAST, mpiBLAST, MEME, NPMLE, PAUP, etc •Dinámica de fluidos computacional: cfx, COMSOL, FLUENT •Geociencias: BOM, CAM, COMSOL, CWP/SU, ECLIPSE, GrADS, HYCOM, MICOM, MITgcm, ROMS. •Ciencias de Materiales: Abaqus, COMSOL, vasp •Matemáticas e Informática: ACML, AMPL, ATLAS, CPLEX, Diffpack, ESSL, FFTW, GMP, gotoBLAST, GSL, MAGMA, Maple, Math/Sci, MATLAB, Netlib, Newmat, Newran, NTL, Octave, PMDR, R, WSMP, XT-libsci •Física: COMSOL, GOTM •Las áreas que soporta son: •Economía •GeoCiencia •Ciencia de materiales •Matemáticas y Física Informática 72 Capítulo II: Estado del Arte Internacional 2.3.6.4 NGS (Servicio de Grid Nacional para el Reino Unido) (http://www.ngs.ac.uk/) El objetivo del proyecto es proveer a los investigadores del Reino Unido acceso, en forma coherente, a todos los recursos y facilidades computacionales y datos requeridos para llevar a cabo sus investigaciones, independiente de la localización de los recursos o del investigador. www.grid-support.ac.uk. Institución coordinadora: La institución coordinadora está conformada por cuatro instituciones principales o de núcleo del NGS: Consejo de Facilidades de Ciencia y Tecnología (STFC), Universidad de Oxford, Universidad de Leeds, y Universidad de Manchester. También se integran socios y afiliados, los que tienen roles disminuidos en el NGS. 2.3.6.4.1 Proyecto grid: NGS integrará servicios para acceder a un número creciente y diverso de recursos, abarcando espacios completos desde facilidades de tiempo real, como synchrotrones y telescopios a través de complejas queries de datos históricos almacenados en centros de datos nacionales o institucionales. NGS es gratuito para los académicos del Reino Unido, y el uso de los recursos se establece a través de la obtención del certificado de seguridad y del envío de una postulación para una cuenta NGS. 2.3.6.4.2 Recursos locales: Sitio STFC: •48 Dual AMD Opteron 280 (192 Núcleos) con 8GB de memoria •8 Quad AMD Opteron 280 (64 Núcleos) con 32GB de memoria •Red de interconexión Gigabit •Interconexión de paso de mensajes de alta velocidad Myrinets •72 TB SAN, Infortrend, Qlogic 5200 •8 Dual AMD Opteron 280 (32 Núcleos) con 8GB de memoria, Myrinet, Fibre HBA Sitio Oxford: Oxford NGS2: •48 nodos de cómputo dual CPU/dual core con AMD Opteron 285 2.6GHz con 8Gb RAM y 8 nodos quad CPU/dual core con AMD Opteron 885 2.6 GHz con 32Gb RAM. 73 Capítulo II: Estado del Arte Internacional •30TB RAID SAN y 3 nodos de almacenamiento dual. •Un nodo front end con quad CPU/quad core con AMD Opteron 885 2.6GHz con 32Gb RAM. •Red de interconexión Gigabit. •Red de interconexión Myrinet de alta velocidad de paso de mensajes. •Oxford NGS1: •64 nodos de cómputo con dual Intel Xeon 3.06 GHz CPUs, 2 GB RAM. •Un nodo servidor de disco con 2 x 3.06 Ghz procesadores, 2 GB de memoria, 2 x 2TB RAID. •Un nodo front end con 2 x 3.06 Ghz procesadores, 4GB de memoria. •Red de interconexión Gigabit. •Red de interconexión Myrinet de alta velocidad de paso de mensajes. Sitio Leeds: •Nodo maestro/interactivo con 4 dual-core Opteron 64-bit procesadores, 32GB RAM. •48 nodos con 2 dual-core Opteron 64-bit procesadores, 8GB RAM. •8 nodos con 4 dual-core Opteron 64-bit procesadores, 32GB RAM. •3 nodos servidores de archive para proveer directorios home, almacenamiento SRB y espacio de archivo temporal. Sitio Manchester: •Nodo maestro/interactivo con 4 dual-core Opteron 64-bit procesadores, 32GB RAM. •48 nodes con 2 dual-core Opteron 64-bit procesadores, 8GB RAM. •8 nodes con 4 dual-core Opteron 64-bit procesadores, 32GB RAM. •80TB espacio en disco. 2.3.6.4.3 Capital humano: No se menciona el recurso humano en el sitio Web, pero hay diversas facilidades de soporte para los investigadores que deseen unirse al NGS, tales como el curso de inducción, donde se introducen los conceptos de grid, se enseña la e-Infraestructura del Reino Unido, se entrega una orientación al Servicio de Grid Nacional, y se generan experiencias prácticas en el uso de los servicios de cómputo y de administración de datos del NGS. También existen cursos para desarrolladores de aplicaciones, los cuales pueden usar los servicios de datos y de cómputos para crear el software de dominio de la aplicación. 74 Capítulo II: Estado del Arte Internacional Otro beneficio son los servicios de datos grid, los que ayudan a explorar cómo los recursos de datos pueden ser expuestos como servicios para los usuarios del NGS. Finalmente, existen cursos de actualización de tecnologías, que introducen a usuarios establecidos del NGS en nuevos servicios que han sido desplegados. 2.3.6.4.4Recursos grid: Globus es el middleware principal de NGS. No obstante se utilizan otros recursos grid que dan un valor agregado a éste, entre ellos destacan: OpenCA: Autoridad de certificación de e-Ciencia que provee certificados estándares X.509 para la comunidad de e-Ciencia del Reino Unido. GSI-SSH Term Application: Este software le permite al usuario acceder fácilmente a la grid, usando GSISSH. Repositorio de Aplicaciones NGS: Portal de acceso abierto, usado para describir y listar las aplicaciones y sus artefactos asociados, todos disponibles como recursos en NGS. Oracle10G: NGS ofrece el almacenamiento de grandes cantidades de datos, habilitando la realización abierta de consulta. SRB (Intermediario de Recursos de Almacenamiento): Servicio de almacenamiento de datos que permite almacenar datos en localizaciones geográficas distribuidas, y acceder a ellos usando solamente el nombre del archivo lógico. La confiabilidad y la eficiencia son dramáticamente mejorados con SRB. OGSA-DAI: La Arquitectura Abierta de Servicios Grid y La Integración de Acceso a Datos provee un middleware que ayuda a los usuarios accesar e integrar datos a través de fuentes de estructuras de datos separadas tales como XML o bases de datos Oracle. Servidor de Información BDII: Rescata datos desde los sitios NGS, consultando el servicio de información de recursos grid (GRIS) en cada sitio; el que está disponible mediante un servidor LDAP. Servicio de Monitoreo Ganglia. 75 Capítulo II: Estado del Arte Internacional Servicio de Monitoreo Inca NGS: Marco de trabajo flexible para el testeo, benchmark, y monitoreo automatizado de sistemas grid. Incluye mecanismos para asignar la ejecución de los scripts que reúnen información, coleccionan, archivan, publican y despliegan datos. GridSAM: Servicio Web de monitoreo y envío de trabajos, usa una variedad de administradores de recursos distribuidos. Registro de Servicios Nacional: Usa GRIMOIRES. Servicio de registros Web que permite metadatos arbitrarios siempre que estén asociados con entidades UDDI. Servicio VOMS: Es un servicio de membresía para Organizaciones Virtuales; provee herramientas para ayudar a administrar la grid con la autorización de sus usuarios. Soporta diversas aplicaciones dependientes de la disponibilidad de la institución que provee los servicios VOMS. Por ejemplo, en el Sitio STFC, se encuentran las siguientes aplicaciones: Análisis, Análisis de Imágenes, Bioinformática, Química, Biomedicina eIngeniería. 2.3.6.5 NAREGI (Iniciativa Grid de Investigación Nacional de Japón) http://www.naregi.org) Provee un ambiente de cómputo de gran escala para la investigación y educación ampliamente distribuida. Fue creada en el 2003 por el Ministerio de Educación, Cultura, Ciencia y Tecnología del Japón (MEXT). www.naregi.org. Institución coordinadora: Instituto Nacional de Informática (NII) e Instituto de Ciencia molecular (IMS). Participan: - Centro de Investigación de Tecnología GRID - Centro de Información Científica Global y de Cómputo del Instituto de Tecnología de Tokio - Laboratorio Matsuaka - Centro de Cibermedia de la Universidad de Osaka - Centro de Cómputo y Comunicación de la Universidad de Kyushu - Instituto de Tecnología de Kyushu - Universidad Utsunomiya - Universidad de Tsukuba 76 Capítulo II: Estado del Arte Internacional - Fujitsu - NEC - Hitachi 2.3.6.5.1 Proyecto grid: La grid de ciencia tiene el potencial de hacer grandes cambios en el desarrollo de la tecnología científica y generar nuevos productos en áreas como nanotecnología y biotecnología. El objetivo del programa NAREGI de Ciencia Grid es avanzar en el desarrollo del middleware para la grid, el cual es usado para crear el ambiente de Ciencia Grid. Éste permite compartir recursos de cómputo, incluyendo recursos de supercómputo, para que sean usados más eficientemente y, por tanto, construir conexiones de investigación y una comunidad de investigación. Este ambiente permite simulación acoplada de multi-escala/multi-física, muy importante en el campo de ciencia computacional. La asignación de recursos es adaptada a cada aplicación de tal manera que el análisis acoplado pueda ser realizado fácilmente. Las Organizaciones Virtuales (Vos), separadas de las organizaciones reales a las que pertenecen los investigadores y cuerpos de investigación, pueden ser formadas dinámicamente en la grid de acuerdo a las necesidades de la comunidad de investigación, compartiendo datos y recursos. 2.3.6.5.2 Aplicaciones que soporta: BioGRID: Aplicaciones en Biotecnología. JVO: Organización Virtual Japonesa para Telescopios utilizando tecnologías de minería de datos. 2.3.6.5.3 Recursos locales: No hay mención sobre este recurso. 2.3.6.5.4 Capital humano: No hay mención sobre este recurso. 2.3.6.5.5 Recursos grid: Administración de recursos en el ambiente grid: - Super Scheduler 77 Capítulo II: Estado del Arte Internacional - GridVM - Servicio de Información Distribuida Ambiente de programación grid: - Sistema RPC Grid - Sistema MPI Grid Ambiente de aplicación grid: - PSE Grid - Herramienta workflow grid - Sistema de visualización grid Ambiente de datos grid: - Sistema de administración de acceso - Sistema de administración de recursos de datos - Sistema de construcción de metadatos Alto rendimiento y red grid segura: - Infraestructura de comunicación de red - Infraestructura de autenticación de seguridad Aplicaciones nano grid: - Grid compatible con aplicaciones nano paralelas y distribuidas Investigación en la utilización del middleware grid: - Programación de interfaces de aplicaciones - Utilización de la grid heterogénea 78 Capítulo III: Estado del arte en Latinoamérica 3 Capítulo III: Estado del arte en Latinoamérica 3.1 Introducción América Latina no podía ser la excepción en el auge de la tecnología grid. Pero si en los países desarrollados la computación grid está en formación, en los países latinoamericanos apenas está en gestación, por ello se vienen adelantando varios proyectos y alianzas con instituciones que tienen experiencia en la implementación de éstas tecnologías. En la actualidad se cuenta con CLARA (Cooperación Latino Americana de Redes Avanzadas), organización no gubernamental sin fines de lucro, que estimula la cooperación regional en actividades educativas, científicas y culturales, además promueve la integración directa con las comunidades científicas de Europa [CLARA (2006)13], esta organización trata de integrar una red regional de telecomunicaciones de la más avanzada tecnología para interconectar a las redes académicas nacionales de la región; hasta el momento cuenta con los siguientes miembros: •Argentina – Innova|Red •Bolivia – Agencia para el Desarrollo de la Sociedad de la Información en Bolivia- ADSIB •Brasil – Red Nacional de Enseñanza e Investigación – RNP •Colombia – Red Nacional Académica de Tecnología Avanzada – RENATA •Costa Rica – Red Nacional de Investigación – CR2Net •Cuba – RedUniv 13 http://www.redclara.net/ 79 Capítulo III: Estado del arte en Latinoamérica •Chile – Red Universitaria Nacional – REUNA •Ecuador – Consorcio Ecuatoriano para el Desarrollo de Internet Avanzado – CEDIA •El Salvador – Red Avanzada de Investigación, Ciencia y Educación Salvadoreña – RAICES •Guatemala – Red Avanzada Guatemalteca para la Investigación y Educación – RAGIE •Honduras – Universidad Tecnológica Centroamericana – UNITEC •México – Corporación Universitaria para el Desarrollo de Internet – CUDI •Panamá – Red Científica y Tecnológica – RedCyT •Paraguay – Arandu •Perú – Red Académica Peruana – RAAP •Uruguay – Red Académica Uruguaya – RAU •Venezuela – Red Académica de Centros de Investigación y Universidades Nacionales – REACCIUN Otro proyecto importante para el trabajo en grid en la región es EELA-214 (Escience grid facilityfor Europe and Latin America), suscesor de EELA (E-infrastructure Shared between Europe and Latin America). El objetivo de EELA-2 es construir una estructura grid escalable de alta capacidad y calidad de producción, suministrando, día y noche, acceso global a computación distribuida y recursos de red y de almacenamiento, requeridos por un alto espectro de aplicaciones provenientes de la colaboración científica entre Europa y América Latina, con especial atención en: •ofrecer un conjunto completo de servicios versátiles que cumplan con los requerimientos de las aplicaciones; •asegurar la sostenibilidad a largo plazo de la e-Infraestructura aun después de haberse completado el proyecto. La infraestructura está basada en 16 Centros de Recursos (RCs), sumando más de 730 núcleos de CPU y 60 Terabytes de espacio de almacenamiento. En este proyecto participan 10 países latinoamericanos con sus redes académicas y diferentes instituciones entre universidades y centros de investigación; la meta es llevar las e-Infraestructuras de los países latinoamericanos al nivel de explotación de los países Europeos. EELA-2 se beneficia del estado maduro del proyecto ALICE2 (América Latina Interconectada Con Europa) y de la red de la Cooperación Latino Americana de Redes Avanzadas, CLARA, denominada RedCLARA. 14 80 http://applications.eu-eela.eu Capítulo III: Estado del arte en Latinoamérica Ahora bien, ¿por qué es importante para los países de Latinoamérica el tratar de evolucionar en la tecnología de grids computacionales? Está claro que parte de la respuesta a esta pregunta tiene que ver con la obtención de los beneficios que en general se pueden lograr con esta tecnología: 1) Mejorar la relación eficiencia/costo. 2) Explotar convenientemente los recursos sobre-utilizados. 3) Permitir la colaboración. 4) Crear VOs en diferentes dominios. 5) Incrementar la capacidad de procesamiento paralelo. 6) Dar soporte a sistemas heterogéneos. 7) Proveer realidad/disponibilidad. 8) Reducir el tiempo de obtención de resultados. Muchos de estos beneficios tienen mayor relevancia en países en desarrollo como los de América Latina, específicamente en el área académica y científica, ya que: 1) Ofrece poder computacional y otras capacidades relativas a la tecnología de información que suele ser insuficiente en centros de investigación e instituciones académicas. 2) Permite el intercambio de conocimiento entre organizaciones, particularmente con las que se encuentran en los países desarrollados. 3) Es una infraestructura ideal para implementar e-Learning. 4) Es un campo amplio y joven para hacer investigación en esta área. 81 Capítulo III: Estado del arte en Latinoamérica 3.2 Avances en computación grid en Latinoamérica A continuación se presentan los avances de computación grid de algunos países líderes en la materia en la región latinoamericana, con la excepción de Chile, el cual será tratado en el siguiente apartado. 3.2.1 Computación grid en Colombia: La iniciativa Grid Colombia ha logrado generar la articulación y compromiso de varias universidades con un fin común, la conformación de la grid nacional. Para alcanzar esta meta se ha generado una organización con las siguientes características: Visión: lograr que en un año Grid Colombia se constituya en la primera alternativa en computación distribuida en el país, que en dos años todas las universidades conectadas a RENATA que estén desarrollando proyectos de computación distribuida hagan parte de Grid Colombia y que en cuatro años Grid Colombia sea visible, reconocida y certificada como una alternativa de Grid a nivel internacional. Objetivo general: constituir una grid de escala nacional en Colombia que reúna clusters y grids de universidades e instituciones haciendo uso de las redes de tecnología avanzada. Objetivos específicos: fomentar el uso de grids computacionales como herramientas para solucionar problemas que necesiten alto nivel de cómputo; ofrecer servicios de grid y participar en proyectos a nivel nacional e internacional; promover la colaboración de grupos de interés, estudiantes y docentes; desarrollar aplicaciones de alta carga computacional para resolver problemas de alto impacto para el país. Membresía: pueden ser actores de Grid Colombia los grupos y centros de investigación, no sólo los que centran en las áreas de la computación de alto desempeño sino también los que requieren usar este tipo de tecnología; también se espera poder contar con la participación de entidades gubernamentales como RENATA y Colciencias y asociaciones como ACOFI. Los miembros deben estar en disposición de aportar recursos para la conformación del grid nacional. Con el fin de coordinar y aunar las contribuciones y esfuerzos de la comunidad 82 Capítulo III: Estado del arte en Latinoamérica Grid Colombia se ha planteado una organización en cuatro frentes de trabajo: Frente de infraestructura: encargado de preparar, diseñar, implementar y configurar una Grid de Cómputo Nacional que permita agrupar recursos computacionales de las instituciones participantes en el proyecto, la interconexión de los nodos se realizará a través de la Red Nacional de Tecnología Avanzada RENATA. Frente de formación y capacitación: propende por el desarrollo de la formación de estudiantes, docentes y especialistas en computación de alto desempeño, además para la integración de un servicio de cómputo avanzado interdisciplinario en Grid Colombia. Esta formación incluye capacitación en las tecnologías de clusters y grids, programación concurrente y paralela, y desarrollo de aplicaciones. Frente de promoción y divulgación: el objetivo es plantear y realizar estrategias de promoción y divulgación del proyecto Grid Colombia para difundir y ampliar el uso de las tecnologías de grid y obtener un reconocimiento nacional e internacional. Frente de seguridad: su función es proponer y analizar los aspectos concernientes a la seguridad informática para la implantación de una infraestructura de computación grid a nivel nacional, garantizando el cumplimiento de estándares para esta tecnología. Actualmente, Grid Colombia se encuentra en proceso de consolidación; en esta etapa se busca desarrollar las siguientes actividades: - Levantar un censo nacional de plataformas de computación intensiva e identificar las aplicaciones de computación en grid de mayor relevancia en el contexto colombiano. - Probar, configurar y evaluar un middleware operativo para la administración de recursos y la programación de trabajos en la primera grid de alcance nacional. - Realizar pruebas sistemáticas de rendimiento y estabilidad de la red apuntando especialmente a la determinación de sus propiedades en relación con los retos que ofrece la computación en grid en Colombia. - Desarrollar las primeras aplicaciones que permitan simular, evaluar y validar la utilidad de la tecnología grid para la solución de problemas científicos y tecnológicos de interés para el país. 83 Capítulo III: Estado del arte en Latinoamérica - Establecer relaciones institucionales formales propicias para la colaboración en el establecimiento de la grid nacional, generando las bases y recomendaciones para la operación del mismo en el marco de la organización académica Grid Colombia15. 3.2.2 Computación grid en Argentina: Hoy en día, ciertas tareas de investigación, como la prospección sísmica o la simulación de la circulación atmosférica, por ejemplo, requieren de computadoras muy poderosas y costosas. Pero, si las computadoras están en red, el costo se comparte y se potencia la capacidad del conjunto. Precisamente, con este propósito se creó una red informática que conectará a la Universidad de Buenos Aires (UBA) y a la Universidad Nacional de Cuyo (UNCu). Este emprendimiento permitirá que ambas instituciones puedan compartir el poder de procesamiento de sus respectivos clusters (grupos) de computadoras, para ser aplicado a la resolución de problemas científicos complejos. Esta novedosa infraestructura conformará una red de última generación, llamada grid. “Esta red nos permitirá contar con una herramienta de cálculo poderosa para trabajar en temas que están en la frontera del conocimiento, como la simulación numérica en problemas de interconexionado eléctrico por medios electroquímicos y en el tratamiento electroquímico de tumores, mediante el pasaje de corriente eléctrica a través de un tejido vivo”, asegura Guillermo Marshall, profesor de la Facultad de Ciencias Exactas y Naturales (FCEyN) de la UBA16. Marshall, director del Laboratorio de Sistemas Complejos (LSC) en el Departamento de Computación de la FCEyN, y el profesor Carlos García Garino, del Instituto Tecnológico Universitario (ITU) de la UNCu, son los responsables de esta novedosa red que será financiada con un subsidio otorgado por la Agencia Nacional de Promoción Científica y Tecnológica (ANPCyT). La idea es formar un centro de Computación de Alto Rendimiento con dos nodos: uno en Buenos Aires, en el LSC, y otro en Mendoza, en el Laboratorio de Investigación y Desarrollo para la Producción Integrada por Computadora (LAPIC), que dirige García Garino. 15 http://www.unired.edu.co/eventos/unired/2009/noticias/grid%20colombia.pdf 16 http://portal.educ.ar/noticias/educacion-y-sociedad/la-tecnologia-griddesembarca.php 84 Capítulo III: Estado del arte en Latinoamérica Cada universidad en Argentina integrará el Grid con un cluster de computadoras que estará conectado con su par a través de la red pública Internet, pero mediante un enlace seguro llamado túnel IP. “Un túnel consiste en encapsular tráfico privado dentro de otro tipo de tráfico más general como el de una red pública, con el fin de facilitar que se compartan recursos distribuidos en sitios lejanos”, agrega el ingeniero. En principio este Centro de Computación de Alto rendimiento se destinará a usos académicos, tanto en lo que se refiere a enseñanza como a investigación. “De esta manera se podrán potenciar acciones de grado y posgrado tanto en la UBA como en Mendoza, y además nos permitirá avanzar en nuestras investigaciones en dos frentes. Por un lado, podremos profundizar el conocimiento acerca de la tecnología de clusters, investigando en aspectos como el hardware de los nodos, la red que los interconecta, los protocolos de red utilizados y los sistemas de administración de los mismos –se entusiasma García Marino–. Por otra parte nos permitirá trabajar, entre otros temas de interés, en dinámica molecular, prospección sísmica y en simulaciones numéricas de reservorios y trazado de oleoductos en la industria del petróleo”. 3.2.3 Computación grid en Brasil El gobierno del Brasil y la Xunta de Galicia han empezado a establecer las bases de un convenio de colaboración que se prevé que se firme antes de final de año17. El convenio tiene como objetivo que las dos administraciones colaboren en implementar aplicaciones libres mediante grid y cluster a varios ámbitos como la radioterapia, la gestión ambiental o en sistemas de gestión de nóminas en áreas de recursos humanos. La primera parte de contacto lo han hecho mediante videoconferencia el director-gerente del Centro de Supercomputación de Galicia (CESGA), Javier García Tobio, el Secretario Nacional de Tecnología de la Información del Gobierno del Brasil, Rogério Santanna dos Santos, y el Director de Innovación del SLTI Gobierno brasileño, Corinto Meffe. En esta colaboración, Galicia prevé aportar sus conocimientos de supercomputación y la experiencia del Brasil en la implementación a gran escala de varias aplicaciones de código libre. Las dos administraciones, el gobierno del Brasil y el gobierno de Galicia, forman parte de la Red Internacional de Administraciones Públicas por el Software 17 http://georeferencias.wordpress.com/2006/09/11/brasil-y-galicia-empiezan-acolaborar-en-proyectos-de-grid-y-cluster-con-software-libre/ 85 Capítulo III: Estado del arte en Latinoamérica Libre. El coordinador de la Red, Marcelo D’Elia Branco (Fundación Observatori para la Sociedad de la Información en Catalunya) es quien dinamiza las reuniones entre las dos administraciones, desde Barcelona. Eugenio Sper de Almeida, doctorado en Computación Aplicada del Instituto Nacional de Investigaciones Espaciales INPE, Brasil, trabaja en el Centro de Previsión del Tiempo y Estudios Climáticos, donde se intenta mejorar los modelos numéricos de clima y medio ambiente, promoviendo los avances científicos en esa área, a través de programas con supercomputadores que recogen datos satelitales. En este lugar trabajan con la Red IPE de la Red Nacional de Enseñanza e Investigación, RNP, de Brasil, desde donde han logrado generar proyectos grid como GBRAMS, y SAEMC, este último para proveer datos sobre emisiones y cambio climático para América del Sur, la que realiza operaciones sobre la red de Alta Velocidad de América Latina, RedCLARA, que conecta a las redes RNP, REUNA e Innova|Red de Argentina. La idea, según Sper de Almeida, es lograr ampliar el alcance de estos proyectos para incorporar a otras instituciones18. 18 http://apc-clara.reuna.cl/canal1.shtml?http://apc-clara.reuna.cl?AA_SL_Sessi on=1b784166a5d7775d7330766f5ab45a03&x=12432 86 Capítulo IV: Estado del Arte Nacional 4 Capítulo IV: Estado del Arte Nacional 4.1 Iniciativa articulada por REUNA Chile cuenta desde 1992 con REUNA, la red nacional de educación e investigación, que hoy conecta a instituciones nacionales entre sí y, mediante RedCLARA, con Europa y toda América. La Corporación REUNA es una iniciativa de colaboración que posee la única infraestructura tecnológica de red de naturaleza académica, dedicada a la investigación y al desarrollo en Chile. La misión de la Corporación REUNA es proveer a la comunidad de educación superior, innovación e investigación del país, servicios en materias de Tecnologías de Información y Comunicaciones; apoyada por un equipo humano altamente calificado y comprometido, la institución promueve el trabajo colaborativo entre universidades y centros de investigación, mediante el uso de su Red Académica, infraestructura que conecta a los científicos, académicos e investigadores de Chile con sus pares en todo el mundo. REUNA comenzó su trabajo en proyectos de grid –infraestructura tecnológica que opera sobre las redes académicas para posibilitar el desarrollo de la e-Cienciaen el año 2004, y desde el 2006, promueve intensamente el desarrollo de la eCiencia en Chile y la región latinoamericana19. El primer Congreso Nacional de e-Ciencia: «e-Ciencia para el Chile del Bicentenario: Experiencias, Procesos y Políticas», fue realizado el 6 y 7 de septiembre 19 http://www.reuna.cl/index.php/es/e-ciencia/eventos 87 Capítulo IV: Estado del Arte Nacional del 2006. Este evento, que contó con el patrocinio de la Academia Chilena de Ciencias y el apoyo del Programa Bicentenario de Ciencia y Tecnología, fue antecedido por la I Conferencia EELA (4 y 5 de septiembre), y corrió en paralelo con el Tutorial EELA (para uso de grids). El 23 y 24 de mayo de 2007, en la Universidad de Santiago de Chile (USACH), REUNA (Red Universitaria Nacional) llevó a cabo el 1er Taller de Articulación de e-Ciencia: «Cimentando el camino para el desarrollo de la e-Ciencia en Chile». El segundo Congreso Nacional de e-Ciencia: “e-Ciencia para el Chile del Bicentenario” fue organizado en los días 12 y 13 de Septiembre del 2007 y financiado por el programa Bicentenario y Tecnologías del CONICYT. El objetivo de este Congreso era el de contribuir a una discusión nacional sobre la tendencia y desarrollo mundial de la e-Ciencia, que sirviera como una estrategia de apoyo al avance de la investigación científica y académica en Chile, y difundir las primeras iniciativas que, en esta línea, se estaban llevando a cabo en el país. Como contraparte también se llevó a cabo el «II Taller de Articulación para La Vinculación de Ciencia y Empresa: e-Ciencia e Industria: Hacia una Infraestructura de Grid Nacional», el 7 y 8 de mayo del 2008. Mediante la constitución de un foro interdisciplinario públicoprivado, éste persiguió definir y establecer una estrategia para la implementación sustentable de una infraestructura nacional colaborativa de mallas computacionales (grids), a fin de acelerar la adopción de estas tecnologías en el país. Este Taller fue cerrado el 13 y 14 de enero de 2010 con la participación de invitados nacionales e internacionales quienes establecieron las propuestas definidas en el Taller anterior. Se presentaron, en esta última sesión, diversas aplicaciones en grid, entre ellas UCRAV y otras referidas a Clima, Grid y Biociencias. La primera intención de colaborar y compartir recursos a través de una red nacional en Chile se inició con la institución REUNA (Red Universitaria Nacional) en el 2007 a través del proyecto UCRAV20 el que consiste en una grid de instrumental científico que le permite visualizar en línea y en tiempo real, en forma segura y fiable, privada y con dedicación exclusiva de recursos (instrumentales, tecnológicos y humanos). UCRAV es un proyecto pionero de colaboración y creación de una grid nacional de instrumentos científicos -especializados en el análisis de muestras orgánicas e inorgánicas-, conectados de norte a sur del país, a través de la Red Académica, REUNA. La estructura de UCRAV está formada por instrumental científico distribuido en los laboratorios de las universidades que integran la grid, interconectados por la red de Internet Avanzada a un servidor central ubicado en REUNA. Básicamente UCRAV está compuesto por: 20 88 http://www.ucrav.cl/ucrav2/ Capítulo IV: Estado del Arte Nacional •el instrumental científico –Espectrómetro de Resonancia Magnética Nuclear, Difractómetro de Rayos X, Microscopio Analítico, PCR en Tiempo Real y PCR Cuantitativo, y Microscopio Confocal de Barrido Láser- dispuesto por los laboratorios de las universidades integrantes del proyecto; •una plataforma tecnológica que permite la visualización en línea de los análisis de muestras generados por los instrumentos, el acceso a la documentación por ellos emanada durante el proceso de comunicación e interacción entre el usuario o cliente (quién envió la muestra para ser analizada al laboratorio) y el prestador del servicio (quién opera en el laboratorio el instrumento que realiza el estudio de la muestra), y que facilita la logística previa a la realización del análisis; y •una grid nacional, construida por UCRAV para permitir la interacción real y en línea del usuario y el laboratorio mientras se lleva a cabo la visualización de los resultados de los análisis. REUNA es, también, la entidad emisora de certificados de seguridad para visar la entrada segura al mundo de las grid computacionales21. Acreditada por TAGPMA (The Americas Grid Policy Management Authority), REUNA es la única Autoridad Certificadora (CA) para grid en Chile; ella puede emitir certificados -para usuarios y recursos - válidos en la comunidad académica global, y reconocidos por todas las entidades miembros de la IGTF (International Grid Trust Feredaration). La Autoridad Certificadora, REUNA-CA, refuerza el uso de los servicios PKI (Public Key Infraestructures – Infraestructuras de Llave Pública) que permiten el envío de datos en forma segura mediante técnicas de encriptación, garantizando el contenido vía legitimación del emisor. REUNA-CA emite certificados para personas, investigadores, estudiantes (certificado de usuario), computadores (certificado de servidor) y servicios (certificado de aplicaciones); los que permiten a los suscriptores validarse para usar infraestructuras grid. 4.1.1 Iniciativas Centro de Modelamiento Matemático CMM, Universidad de Chile Hoy en día, muchas instituciones en Chile están tratando de participar en iniciativas de computación grid, asociándose y formando comunidades con objetivos comunes: hacer computación grid. Con el pasar del tiempo, estas comunidades han entendido que para lograr una plataforma de e-Ciencia común y operativa, es necesario lograr uniformidad, tanto a nivel de sistemas como de 21 http://www.reuna.cl/index.php/es/servicios/red/certificados-grid 89 Capítulo IV: Estado del Arte Nacional aplicaciones, lo que presenta un desafío no menor al momento de dejar atrás viejas costumbres y superar el miedo al cambio. En este sentido, es que el grupo de HPC del Centro de Modelamiento Matemático, con el apoyo de REUNA, PRAGMA (Pacific Rimm Applications and Grid Middleware), la Universidad de Puerto Rico Mayagüez (UPRM) y el Centro de Predicción del Tiempo y Estudios Climáticos (CPTEC, Brasil) está desarrollando una forma poco acoplada para compartir recursos empleando tecnologías grid encapsuladas a nivel de middleware, acoplándose a los entornos de ejecución, sin requerir grandes cambios a configuraciones ya operativas. Este middleware encapsulado se compone de un software de interconexión de bajo nivel, como Globus GT4 (que implementa estándares OGF WS*), sobre el que se monta un middleware de DataFarm, como GFarm, que utiliza todas las características incluidas por GT4 (como autentificación y ubicación de recursos) y, además, esto se complementa con portlets que permiten la coordinación administrativa entre los clusters. El mismo grupo de HPC del CMM de la Universidad de Chile, a partir del año 2007 lidera CLGRID (Red Nacional Grid en Chile); marcando el inicio de una serie de talleres de computación grid, donde participan universidades de todo el país. El Centro de Modelamiento Matemático de la Universidad de Chile, dependiente de la Facultad de Ciencias Físicas y Matemáticas, se encuentra equipado con 16 servidores HP integrity RX1600; operativo desde el 2005, esta infraestructura le ha permitido integrarse a otros centros a través de una grid computacional de última generación para la realización de proyectos de investigaciones de modelamiento y cálculo distribuido, en colaboración con los principales centros de investigación en el mundo. Esta grid permite que en el Centro de Modelamiento Matemático (CMM) se logren resolver problemas de modelamiento de alta complejidad en áreas y tareas diversas, en aplicaciones que serán importantes para el desarrollo del país en minería, energía, telecomunicaciones y medioambiente. El 7 de Marzo del 2008, la presidenta Bachelet realizó la presentación de ocho Centros Científicos en el país, a través del programa de Financiamiento Basal para Centros Científicos y Tecnológicos de Excelencia, el cual plantea incrementar el capital científico y tecnológico de alto nivel existente en el país. De esta manera las actividades de investigación, formación de capital humano y transferencia tecnológica realizados por los centros seleccionados contribuirán a aumentar decisivamente la competitividad de la economía y el desarrollo social del país. El programa ofrece recursos para la operación básica de estos centros por períodos de cinco años, prorrogables por una vez, hasta por otros cinco, de manera de crear las condiciones para formar masas críticas de científicos de alto nivel, que le permitan a Chile estar en la frontera del conocimiento en áreas específicas. 90 Capítulo IV: Estado del Arte Nacional Este instrumento permite otorgarles a estos Centros Científicos y Tecnológicos de Excelencia un financiamiento basal que garantiza que la investigación –básica y aplicada- de alto nivel nacional e internacional que llevan a cabo, se enfoque directamente a aumentar la competitividad de nuestra economía y, con ello, a mejorar la calidad de vida de los chilenos; porque este instrumento apoya líneas de investigación de mayor envergadura, con mayor financiamiento, por un mayor plazo y con una mayor vinculación con los requerimientos de nuestro sistema productivo. 4.1.2 Iniciativas Universidad Católica del Norte La Universidad Católica del Norte (UCN) ha tenido una participación fundamental en el aspecto de Computación grid en Chile. A través de un grupo de HPC ha fomentado la colaboración grid a través del CLGRID. Hoy cuenta con un laboratorio de alto desempeño que en el futuro será parte del Centro de Informática Aplicada, conformando un cluster HPC de cuatro nodos, integrado a CLGRID. El principal aporte científico de la UCN está potenciado por el Centro de Biotecnología, donde se estudian los procesos asociados a la biominería, con el objetivo de mejorarlos, lo que implica la reducción de costos de operación y/o un aumento en la producción de cobre a partir de un mineral de cobre de baja ley, considerado hasta no hace mucho, como desecho. El trabajo del centro de biotecnología consiste en estudiar la dinámica de las poblaciones de microorganismos asociados a la extracción de cobre, su relación con los datos operacionales de la pila de lixiviación y la identificación de los genes involucrados en cada etapa del proceso de biolixiviación. La generación de modelos que permitan explicar y, eventualmente simular, los procesos que ocurren en una pila de extracción de cobre son metas que están asociadas al centro. La generación de este tipo de resultados, involucra tareas que son costosas desde el punto de vista computacional, en procesos de estudios de expresión de genes se consume gran cantidad de espacio de almacenamiento en datos, se hace necesario una potencia de cálculo importante asociada a la generación y procesamiento de esos datos. La identificación de microorganismos y genes de los mismos, requieren consultar bases de datos de gran tamaño, las cuales deben estar cargadas en la memoria de un equipo computacional de forma de poder realizar una búsqueda exitosa. Se debe considerar, en este punto, que el margen de error “aceptable” en el proceso de identificación es del orden del 1%, una cantidad mayor y los microorganismos identificados pueden no ser realmente los existentes. 91 Capítulo IV: Estado del Arte Nacional Estos problemas son solo algunos de los que se abordan en procesos de biotecnología y requieren el uso de tecnologías HPC para su resolución. Si a lo anterior se agrega el hecho que para lograr un modelo más preciso es necesario considerar los problemas de flujo y transporte que se dan en el interior de la pila, la complejidad asociada a los modelos crece de manera muy significativa. El uso de tecnologías HPC permite minimizar tiempos necesarios para la obtención de resultados, ya sea en el procesamiento de datos de expresión de genes, en la generación de resultados a partir de simulación del comportamiento de la pila y en la identificación de genes y microorganismos, considerando en este último punto que se puede mejorar la precisión de la identificación, pudiendo levantar bases de datos de mayor tamaño (alrededor de 25 Gbytes, cargados directamente en memoria), por nombrar sólo algunas posibilidades. Dentro de los retos que tiene el centro es la generación de modelos que permitan simular el comportamiento de los microorganismos en una pila, el cual es un proceso complejo y costoso, por que se deben aunar esfuerzos multidisciplinarios: matemáticos, biológicos, metalúrgicos, químicos e informáticos, siendo estos últimos los encargados de implementar los modelos generados para que puedan ser ejecutados en la plataforma HPC y además que los demás científicos e ingenieros no deban lidiar con la complejidad inherente a un proceso de paralelización de algoritmos o de administración de una plataforma, estos deben ser transparentes para ellos en todo momento. La selección de los mecanismos, lenguajes y técnicas de programación debe ser cuidadosa, dado que esto influye directamente en el rendimiento y exactitud de los resultados, lo cual requiere un alto nivel de especialización por parte de los informáticos. Otras áreas de interés del uso de computación grid en la UCN se ve en Astronomía, donde se cultiva esta ciencia a través del uso de distintos instrumentos (telescopios) ubicados en Cerro Armazones. La adopción de la grid supondrá la creación de nuevos estándares de interoperación e intercambio de datos de datos astronómicos, la consolidación del concepto de Observatorio Virtual, la integración de modelos astrofísicos y Observatorios Virtuales, la definición de “observación” como servicio de Internet, y la extensión del concepto Internet interplanetario. La grid tendría un gran impacto en las formas de colaboración y de producción científica. Así, permitiría la explotación eficiente de los recursos observacionales existentes, la posibilidad de establecer centros de excelencia en servicios especializados que complementen las funciones y los servicios de los observatorios terrestres y espaciales existentes, coordinados con centros similares en otros países, la definición de líneas de investigación en la “Nueva astronomía”, 92 Capítulo IV: Estado del Arte Nacional basada en el análisis masivo de datos e integración de modelos y datos, y el trabajo en redes de investigación con infraestructura común y nuevas formas de compartir conocimiento. Otra área de alto interés tiene relación con problemas de flujo y transporte que está desarrollando el departamento de Ingeniería Química. Estas investigaciones son realizadas en conjunto con el Ceitsaza y tienen como objetivo determinar la mecánica de la dispersión de las aguas, así como de los contaminantes que eventualmente pueden ser vertidos en ellas. Además, otra línea dentro del mismo tipo de problemas tiene relación con el comportamiento en medios microporosos, esto dice directa relación con los fenómenos hidrodinámicos en conjunto con la mecánica de los gases que se dan al interior de una pila de lixiviación. La simulación de estos fenómenos requiere una gran cantidad de tiempo y recursos computacionales. En algunos casos simulaciones de pequeño tamaño en problemas de flujo y transporte relacionados a superficies microporosas, han demorado hasta seis meses en una estación de trabajo tradicional. El uso de tecnologías HPC apoya directamente la disminución de tiempo en la generación de las simulaciones y aumenta el tamaño de las mismas, pudiendo, en algunos casos, no tan solo ejecutar de manera más veloz, sino que también tener variantes corriendo en forma simultánea 4.1.3 Iniciativas CEAZA, Universidad de La Serena Otro centro de investigación que ha hecho aportes en el uso de Computación grid en Chile es el CEAZA de la Universidad de La Serena, que reúne a cerca de medio centenar de investigadores formados en destacadas instituciones científicas del mundo. Estos especialistas desarrollan sus estudios en todos los ambientes desde la Cordillera de Los Andes hasta el Océano Pacífico, para generar conocimiento acerca de la Región de Coquimbo, Atacama y de otras aledañas. La institución intenta comprender los procesos oceanográficos, atmosféricos e hidrológicos asociados al Cambio Climático Global (CGC) y al fenómeno del Niño – Oscilación del Sur (ENOS), sus efectos sobre los sistemas bióticos naturales o bajo cultivo. A su vez, busca aportar soluciones a los desafíos que imponen estos fenómenos, desarrollando ciencia y tecnología regional, aunando las voluntades del sector público y privado. Su misión es contribuir a la comprensión de los efectos de las oscilaciones climáticas/oceanográficas sobre el ciclo hidrológico y la productividad biológica (natural y bajo cultivo) en las zonas áridas y marinas del centro-norte de Chile. También busca promover el desarrollo científico tecnológico de alto nivel en la Región de Coquimbo, a través de la investigación científica-tecnológica y de la gestión en este ámbito. Además, aspira a colaborar en la formación de capital humano de alto nivel en ciencia y tecnología. Asimismo se pretende aportar al progreso y calidad de vida de los habitantes de la Región de Coquimbo, mediante 93 Capítulo IV: Estado del Arte Nacional la aplicación del conocimiento a la productividad regional, la protección del ambiente y la educación Por un total aproximado a los 65 millones de pesos, el proyecto de equipamiento potenciará el área de teledetección del CEAZA, con un laboratorio computacional de avanzada provisto con clusters o megaprocesadores, los que aumentarán las capacidades de análisis de datos para la generación de modelos matemáticos en diferentes áreas de investigación tanto terrestres como marinas. El método de la teledetección permite el cruce de información científica de diversos tipos con información geográfica obtenida en forma satelital, por medio del Sistema de Información Geográfica (SIG). Con estas nuevas herramientas y su pronta incorporación al grupo de Computación Grid en Chile, se analizará con rapidez los datos que proporciona la Red CEAZA MET para contar con el pronóstico meteorológico en tiempo real, lo cual apoyará gran parte de las actividades productivas de la región. Hoy se tienen los datos para realizar este trabajo, sin embargo, no se cuenta con equipos de análisis suficientemente veloces para tener la información a tiempo. Además, a través de este sistema se estudiarán informaciones relevantes para el riego, la conservación, la climatología, la hidrología, entre muchas otras áreas del saber y la producción. 4.1.4 Iniciativas de la Universidad de La Frontera La Universidad de La Frontera (UFRO) participó del proyecto Fondef D02I1054 Servicios y Aplicaciones de Alto Rendimiento sobre Redes de Tercera Generación, liderado por REUNA, entre los años 2003 y 2005. En dicho proyecto se realizaron pruebas de instalación de Globus 4 para ejecutar trabajos paralelos con mpiexec de Bioinformática entre un nodo en la UFRO y un nodo en REUNA. Luego, ha participado de la comunidad CLGRID en sus cinco versiones, organizando el CLGRID4 en marzo de 2007. Ese mismo año comenzó su trabajo de pruebas de UNICORE. Recientemente se ha acercado a EELA-2 para participar activamente en el proyecto. 4.1.5 Iniciativas de la Universidad Técnica Federico Santa María La Universidad Técnica Federico Santa María ha tenido dos líneas de desarrollo. Por el lado académico, se han efectuado tres tesis de Ingeniería informática en el área grid: 2005 y 2006 en instalaciones de plataformas Globus, y en enero de 2009, en plataforma UNICORE. Por el lado científico, la UTFSM participó en el proyecto 94 Capítulo IV: Estado del Arte Nacional HELEN - High Energy Physics Latinamerican European Network el año 2005. Como parte de la integración al proyecto EELA, el 2006, junto a la Universidad de Concepción, la UTFSM instaló un cluster para luego hospedar el 5° tutorial EELA en tecnologías grid. Esto les permitió capacitar recurso humano y continuar trabajando en EELA-2 en temas de física de altas energías, computación grid y HPC, mecánica de fluidos y neurociencias, reuniendo a más de 20 profesores, postdoctorados y alumnos de postgrado. En la actualidad participa en el proyecto ATLAS del CERN junto a la Pontificia Universidad Católica de Chile (PUC). UTFSM ha desarrollado iniciativas en el proyecto ALMA y AGIS_CERN. Además participa de la comunidad CLGRID y organizó el quinto encuentro, en septiembre 2008. 4.1.6 Iniciativas de la Universidad de Talca La Universidad de Talca ha participado esporádicamente del CLGRID y está participando en el proyecto FONDEF TIC-EDU Sistema de Aprendizaje Colaborativo Basado en Infraestructura Grid: Aplicaciones en Ciencias Biológicas y Biotecnología, aprobado en el 2008 y liderado por la PUC, donde también participa la Fundación Ciencia para la Vida. 4.1.7 Iniciativas de la Universidad del Bío-Bío La Universidad del Bío-Bío participó por primera vez en el año 2005 en el proyecto UCRAV, como usuario de instrumentación en grid. Luego, participó del taller EELA 2006, llevado a cabo en el marco del Primer Congreso Nacional de eCiencia realizado ese año por REUNA, y en el Segundo Congreso, en 2007, también a cargo de la Red Universitaria Nacional. En lo académico, recientemente se ha realizado una tesis en plataformas grid. 4.1.8 Iniciativas de la Universidad Austral La Universidad Austral de Chile integra la comunidad CLGRID, participando en CLGRID2 y CLGRID3 y en experimentos de plataformas grid. Después de una ausencia de un año, se unió al proyecto ATLAS, desarrollado en Chile por la UTFSM por un ex postdoctorado de Física quien fue contratado como investigador en la UACH para realizar una transferencia de la colaboración grid. 95 Capítulo IV: Estado del Arte Nacional 4.1.9 Iniciativas de la Universidad de Valparaíso La Universidad de Valparaíso también participó de CLGRID2 y colabora con la UTFSM en el proyecto EELA-2. 4.1.10Computación grid de apoyo a la Astronomía Como parte de la iniciativa de los talleres de e-Ciencia desarrollados por REUNA a partir del año 2006 y las reuniones KAWAX, se trató la necesidad de usar tecnología grid en Astronomía, como imperante a corto plazo, para facilitar a los astrónomos hacer ciencia más rápida y de modo más confiable22. La conclusión era que con la llegada de nuevos telescopios que generarán masivas cantidades de datos, se demandará un nuevo enfoque para desarrollar ciencia en el área. También está la necesidad de integrar los telescopios creando un Observatorio Virtual, lo que le permite al astrónomo tener en su computadora personal el conjunto de datos astronómicos que él desee investigar. El desarrollo del Observatorio Virtual permitirá hacer uso de una gama de nuevas tecnologías de cómputo distribuido que provienen del mundo del grid computing, como se está haciendo en diferentes centros astronómicos en el mundo. Distintos centros de astronomía en el país, que cuentan con instrumentación idónea (tales como telescopios), ven la necesidad imperiosa de estar al día con la tecnología grid para sostener la docencia y la investigación en esta área de la ciencia, y contribuir al desarrollo de un Observatorio Virtual. 22 96 http://www.reuna.cl/documentos/DOC2008/KawaxAstronomia_nov2008.pdf Clima Capítulo V: Estado del Arte Internacional 5 Capítulo V: Estado del Arte Internacional 5.1 Tendencias de investigación en clima El estudio del clima tiene un gran reto al cual hacer frente durante el siglo XXI y es cómo abordarlo a nivel mundial, tanto hoy como a futuro23. Este reto adquiere una relevancia mayor cuando el amplio consenso alcanzado por científicos de prestigio, tal y como quedó de manifiesto en el cuarto informe de evaluación del Grupo Intergubernamental de Expertos sobre el Cambio Climático, establece que el clima está cambiando y que cambiará significativamente aún más y, para peor, siendo más probable que afecte principalmente a países en vías de desarrollo (los con menor capacidad de adaptación). Para hacer frente a este reto, se están explorando la colaboración entre los distintos países, el establecimiento de ciertos “estándares” de procedimientos científicos y un conjunto de actividades relacionadas con las necesidades de información climática. Trataremos en este capítulo los desafíos aquí descritos, así como también la tendencia en modelación climática. 5.1.1 Desafíos para el registro climático global Según la Organización Meteorológica Mundial (OMM)24 y las evidencias con que se dispone, el clima seguirá cambiando de forma importante, producto de las 23 William Wrigth. Observando el Clima: Desafíos para el siglo XXI. Boletín OMM. Enero de 2008. 24 World Climate Conference-3. 99 Capítulo V: Estado del Arte Internacional actividades humanas de estas últimas décadas; esto hace de la adaptación algo esencial. Un primer paso imprescindible y fundamental, es crear un sistema que se encargue de informar qué está ocurriendo, por qué está sucediendo y qué se espera de forma inmediata. En términos generales, lo que se necesita son observaciones (que satisfagan los principios de observación climática), un sistema de seguimiento del rendimiento, la adquisición, archivo y administración de datos, la gestión integral de dichos datos, y el análisis y re-análisis de las observaciones y de la obtención de productos, incluyendo, en particular, los registros de datos climáticos, la evaluación de lo que sucedió y del porqué (atribución), incluyendo posibles impactos sobre los seres humanos y los ecosistemas, la predicción de cambio climático a corto plazo durante varias décadas y la receptividad de los encargados de la toma de decisiones y de los usuarios25. Lo señalado en el párrafo precedente, implica reunir información relativa a los cambios en el clima, para desde allí llegar, en lo posible, a entender el porqué ha tenido lugar el cambio. Esta mutación se ha producido en muchos ámbitos, no sólo en clima, donde primero se deben recopilar los datos de lo que está por ocurrir, para luego recurrir a la historia y entender la razón del suceso. Con esta metodología podríamos ser capaces de utilizar el conocimiento existente para mejorar el realismo de los modelos y la técnica de predicción, para después traspasar este conocimiento a los usuarios y al público que puede emplear los datos, registros y el proceso de atribución obtenidos de los fenómenos climáticos, para generar nuevos conocimientos. En resumen, según señala Kevin E. Trenberth, este proceso de atribución podría contar con dos fases. La primera consistiría en utilizar los modelos atmosféricos y ver hasta dónde se podrían prever las condiciones recientes, a partir de las distintas variables. En la segunda etapa, se podría afirmar por qué éstas variables son de la forma que son. Es de este modo que los modelos han ido mejorando, ya que muchos fenómenos climáticos que antes no tenían atribución a ninguna causa en el pasado, ahora si pueden ser variables de un modelo26. A pesar de lo anterior, los modelos siguen muy lejos de la perfección y muchas veces no toman en cuenta la importancia del proceso de atribución. Aquí radica la necesidad de tomar en consideración los defectos de los modelos, sobre todo 25 Kevin E. Trenberth. Necesidades de observación para la protección y adaptación climáticas. Boletín OMM. Enero de 2008. 26 100 Kevin E. Trenberth. Obra citada. Enero 2008. Capítulo V: Estado del Arte Internacional cuando las estadísticas pueden resultar más convincentes. A futuro se necesitarán recursos informáticos muy amplios para llevar a cabo simulaciones de conjunto y con resolución suficiente para las áreas a estudiar. ¿Cómo realizar este proceso de forma eficaz? “En el área de las estadísticas, aunque resulte complicado generalizar cuándo un registro de datos es suficiente, la tendencia apunta que se necesitan aproximadamente 30 años de registro en un número suficiente de estaciones para poder representar las principales zonas climáticas y regiones vulnerables de un país. Para corroborar que los extremos estén debidamente registrados, los datos deben ser como mínimo, diarios. Estos datos deben ser homogéneos e ir acompañados de una buena información complementaria, metadatos (datos que describen otros datos)”27. Estas series temporales28 no pueden contener lagunas significativas en el registro, puesto que eso podría desmoronar la información obtenida de los metadatos. La variabilidad del clima y el cambio climático son fenómenos globales, los cuales no respetan fronteras, por lo tanto, es de suma importancia que el registro sea de alcance mundial. Lamentablemente, existen naciones que cuentan con un número reducido o inexistente de observaciones, mermando la capacidad global de comprensión y predicción: esta falta de datos disminuye las posibilidades de predecir correctamente el clima a nivel mundial, lo que aumenta la complejidad al considerar un futuro calentamiento global. Uno de los lugares con difícil acceso y bajo nivel de observaciones es la Antártica, hoy, tema obligado para las instituciones de Servicio Meteorológico (SM) y para aquellas que estudian el cambio climático y cómo éste afecta la Glaciología. En Chile el Centro de estudios Científicos (CECS, www.cecs.cl), ubicado en Valdivia, previendo esta situación, creó el departamento de Glaciología y Cambio Climático, dentro del cual se desarrolló un grupo de nivel mundial que completó exitosamente expediciones Antárticas de gran escala, incluyendo una exploración aérea de los glaciares del Mar de Amundsen, en Antártica Occidental, en 200229. 27 William Wrigth. Obra citada. Enero 2008 28 Una Serie temporal es una secuencia de datos, medidos en determinados momentos del tiempo, espaciados entre sí de manera uniforme y por tanto ordenados cronológicamente. 29 Exploración aérea de los glaciares del Mar de Amundsen y la Península Antártica (http://www.cecs.cl/web/cecs_index.php?area=cecs&dep=glaciologia&idioma= es&pagina=proyecto&id=1), última visita 09-06-09. 101 Capítulo V: Estado del Arte Internacional “Lamentablemente, en el momento en el que las redes de alta calidad destinadas a la observación del clima y a propósitos de previsión son más necesarias, existiendo además un reconocimiento cada vez mayor de este hecho, los factores económicos se están desplazando en el sentido contrario”30. 5.1.2 La observación, base de la investigación climática El clima está cambiando. En términos generales se está experimentando un aumento de las temperaturas como consecuencia de los cambios de la atmósfera inducidos por el ser humano. A pesar de esta generalidad, no existe una uniformidad en el cambio climático, por lo cual los desafíos son a nivel regional. Para el desarrollo de investigaciones y proyecciones climáticas futuras, son necesarias las observaciones, las cuales pueden provenir de distintas fuentes (satélites, redes de observación manuales, estaciones meteorológicas automáticas, etc.). En muchos países los presupuestos destinados al Servicio Meteorológico se ven cada vez más limitados; durante los últimos 10-15 años la tendencia nos indica que las redes de observación manuales (que necesitan gran cantidad de recursos) están siendo desplazadas por estaciones meteorológicas automáticas (EMA) en casi la totalidad de los países. Estas EMA ofrecen muchas características clave que aportan a la conformación de esta tendencia, como son: mayor rentabilidad, mayor frecuencia de datos y mejor capacidad para detectar los extremos -pudiendo utilizarse en lugares remotos, entregan rápido acceso a los datos y garantizan la coherencia y objetividad de la medición-. Sin embargo, a pesar de los beneficios que brindan las EMA, en cualquier sistema de observación, la continuidad y calibración de los registros climáticos representan un proceso crítico, más aún si agregamos que el clima está cambiando y es imprescindible registrar las pequeñas variaciones que ocurren, éstas deben reconocerse en el momento que surgen para, de esta manera, identificar cuáles son las perspectivas para el futuro. Por lo tanto, según el punto de vista de la OMM los desafíos que se deben superar son: No debe existir pérdida de datos, fallos en la comunicación o copia de seguridad de los datos inadecuada, ya que éstos provocan importantes lagunas en la continuidad de los datos. 30 102 William Wrigth, Obra citada, Enero 2008. Capítulo V: Estado del Arte Internacional Los instrumentos se degradan (sobre todo en el caso de los satélites) y, por lo tanto, el registro climático puede corromperse. Debido a una gestión inadecuada del cambio y, otras veces, al deficiente mantenimiento, se ha introducido una heterogeneidad en las series temporales. Las EMA tienden a sobreestimar las temperaturas mínimas y subestimar las temperaturas máximas, según un reciente estudio llevado a cabo en Rumania31. Las precipitaciones pudieran presentar dudas en su exactitud, derivando, nuevamente, en la homogeneidad e influyendo negativamente en importantes decisiones. Los procesos de mantenimiento requieren técnicas especializadas que pueden no estar disponibles en algunos países. Se necesita de equipamiento específico en la utilización de las EMA, de lo contrario suele ocurrir la pérdida de observaciones visuales. Estos desafíos a superar hacen necesaria una sólida puesta en marcha de procesos de gestión del cambio y de un mantenimiento regular. El inconveniente es que estas mejoras comportan y se traducen como incrementos en los costos. Para que el registro climático general no se vea en peligro, es necesario que el valor de los registros sea reconocido y diseñar redes para que las estaciones meteorológicas convencionales actúen de forma complementaria con las EMA. Es de prioridad fundamental crear un sistema basado en estas observaciones con el fin de informar a los responsables de la toma de decisiones sobre qué es lo que está ocurriendo y por qué. 5.1.3 Gestión y administración de datos derivados de la observación Los registros climáticos tienen un gran valor si se quiere lograr cualquier investigación climatológica de calidad, es por esto que, además de contar con las redes adecuadas para la obtención de los mismos, es necesario garantizar que se respalden de forma adecuada y que el sistema de acceso a ellos sea lo más sencillo posible. Si no se cumplen estas condiciones, y sólo se cuenta con los registros en papel y/o se crean sistemas complejos, se hace prácticamente imposible realizar cualquier predicción futura o utilizar los datos en modelos climatológicos. 31 William Wrigth, Obra citada, Enero 2008. 103 Capítulo V: Estado del Arte Internacional Lamentablemente esta situación aun se presenta en muchos países en vías de desarrollo. A continuación se presenta una lista de tareas necesarias -evidenciadas en documentos de la OMM32- para lograr registros de calidad; tienen como sustrato base condicionante el compartir los datos. Recuperar y digitalizar datos En muchos países los datos se encuentran respaldados únicamente en papel, esto restringe el acceso a ellos y, lo que es peor, el peligro de su pérdida es latente, ya sea por robo, incendio, inundación o cualquier tragedia que pudiera ocurrir. Es por ello que debe existir una inversión en los procesos de recuperación como digitalización. Existen proyectos como RECLAIM33 (Recuperación de cuadernos de bitácora y de datos marinos internacionales) que fomentan la recuperación de los diarios abordo de los barcos, como un nuevo elemento de ayuda a la hora de interpretar las condiciones climáticas de los océanos en el mundo. Utilizar la tecnología para el respaldo Una forma de contar con los datos eficazmente respaldados es utilizar los distintos formatos electrónicos, de forma que puedan ser fácilmente introducidos en hojas de cálculo, paquetes de análisis y modelos climáticos. Para estos fines, se desarrolló –bajo el auspicio de la Organización Meteorológica Mundial- el software Climsoft34 que, de carácter abierto, trabaja la gestión de datos y tiene la facilidad de ser adaptable a las necesidades propias de cada país y/o institución. Garantizar calidad a través del control Para asegurar que los datos sean absolutamente fiables, debe existir un control de calidad que detecte los errores y, posteriormente, proceda a corregirlos, eliminarlos o simplemente señalarlos. En el pasado, el control de calidad era realizado manualmente por el personal, dejando frecuentemente ese trabajo a la experiencia subjetiva del operador. Hoy en día las pruebas se realizan en forma automatizada, con controles predeterminados, los cuales deben poseer, por ejemplo, controles frente a los extremos climáticos y controles de coherencia interna (¿el punto de rocío supera la temperatura?, fluctuaciones temporales improbables). Existen muchas variables que influyen a la hora de establecer cuál será el tipo de control de calidad a utilizar, éstas pueden ser el tipo de variable, la frecuencia de los datos, recursos humanos, y los equipos utilizados por el Servicio Meteorológico. 32 Organización Meteorológica Mundial, Directrices sobre la gestión de datos climáticos, Marzo 2007. 33 http://icoads.noaa.gov/reclaim, última visita 08-06-09. 34 http://www.ssc.rdg.ac.uk/climsoft. 104 Capítulo V: Estado del Arte Internacional Un gran beneficio de los controles de calidad es que al garantizar la identificación de los diferentes tipos de errores, se puede, si estos son recurrentes, señalar posibles sensores defectuosos, prácticas de observación pobre, localización inadecuada, incorrecto mantenimiento o un problema de mensajería como ha ocurrido con las EMA. “Esta garantía de calidad de principio a fin, debería ser un objetivo primordial para cada uno de los servicios meteorológicos respectivos: resulta obvio que la mejor forma de garantía de calidad es asegurarse que los datos originales se acercan lo más posible a la perfección”35. 5.1.4 Otras problemáticas Gran cantidad de países en vías de desarrollo tienen que luchar con muchos problemas que las naciones desarrolladas no poseen o aparecen con muy baja severidad. Aquí nos referimos a la restricción de los recursos, movimiento de personal elevado o a la inexistencia de planes de perfeccionamiento para los funcionarios del SM y al hecho que ellos sean llevados únicamente por la iniciativa individual de dichos funcionarios (no tienen al alcance beneficios que ayuden a solventar los gastos de un magíster/doctorado; incluso, cuando obtienen becas, muchos estudiantes no tienen la seguridad de encontrar fuente laboral en su país, porque las estructuras o recursos para su contratación no alcanzan). También están los problemas con lo inadecuado del equipamiento y las instalaciones, las estaciones que frecuentemente son remotas, pueden ser de difícil acceso por lo limitado de las infraestructuras, ofreciendo como resultado comunicaciones de baja calidad. También es una problemática que los recursos humanos no estén a la altura de la infraestructura disponible o viceversa. Esto produce que los recursos disponibles (humanos o tecnológicos) pierdan parte de su capacidad, significando un costo que no se incluye en los libros de finanzas de las instituciones, mas bien pueden traducirse en pérdidas de participaciones en proyectos, capacidad ociosa o en falta de tiempo. Lamentablemente, esta situación es recurrente y su incidencia depende de la cultura de cada organización. El llamado es a que tanto recursos humanos como tecnológicos crezcan a la par, el futuro de una organización depende de ello. Si bien la falta de recursos (tecnológicos o humanos) es un gran problema, también lo es que no existan los canales de comunicación entre universidades 35 William Wrigth. Obra citada. Enero 2008 105 Capítulo V: Estado del Arte Internacional e instituciones encargadas del estudio meteorológico, ya sea para compartir recursos o para emprender iniciativas en conjunto. Esta situación es aún más grave, al considerarse que es un hecho que la meteorología sólo figura en los lugares bajos en el posicionamiento de las prioridades de los gobiernos. El problema está en que sin tener las observaciones necesarias, resulta muy difícil generar prestaciones de nivel para gestionar los servicios climáticos y así tomar medidas para gestionar el riesgo del clima; aparejado a este problema, se presentaría la imposibilidad de esbozar una imagen del clima mundial, de sus variaciones y cambios. La colaboración se vuelve fundamental ya que en muchos lugares se presentan fenómenos que necesitan ser estudiados, conocimiento que nos interesa a todos pues el clima y sus futuros cambios no respetan fronteras. El proyecto ACT-1936 es, en Chile, un ejemplo claro de cómo la unión de distintas instituciones puede rendir buenos dividendos; en él se reunieron la Dirección Meteorológica de Chile, Universidad de Concepción y Universidad de Chile, en la búsqueda de la variabilidad climática (atmósfera/océano) del país, realizando una evaluación e interpretación para, por último, ver las proyecciones. El Proyecto tiene un significativo impacto socioeconómico al interior de las fronteras nacionales, ya que Chile basa fuertemente su desarrollo en una explotación intensiva de sus recursos naturales. Cualquier emprendimiento que quiera regirse por estándares internacionales, debe contar con manuales de procedimientos que muestren en forma básica las distintas actividades que son realizadas en el puesto, lamentablemente las investigaciones tienen pocas diligencias rutinarias, por lo tanto, el investigador se ve envuelto en la disyuntiva de elaborar manuales o seguir con sus investigaciones. ¿Qué motivaría a un investigador a invertir su tiempo en elaborar complejos manuales de procedimiento si su labor no es reconocida? Lamentablemente el no contar con estas “guías”, ni con un plan de reemplazo ante la salida o la ocurrencia de alguna desgracia de algún participante, crea una dependencia muy alta de la institución con el trabajador, provocando que en muchos proyectos los representantes de una universidad y/o institución no sean más de uno, y que si éste deja sus funciones no exista un reemplazo que pueda cubrir las actividades generales. 36 106 http://www.dgf.uchile.cl/ACT19/ Capítulo V: Estado del Arte Internacional ¿Cuál es el punto de dependencia que puede tener una institución de sus trabajadores? 5.1.5 Los modelos matemáticos como aporte al estudio del clima y el tiempo Se debe dejar en claro que “Tiempo y Clima son dos conceptos diferentes. El primero se refiere a condiciones atmosféricas dadas que resultan de la evolución de un conjunto específico de condiciones iniciales (CI). El segundo se apunta a las condiciones características dado un conjunto de forzamientos o condiciones de borde (CB). Los modelos que se usan para esto resuelven ecuaciones similares pero en un caso se pone atención especial a las CI y en el otro a las CB. Los primeros se integran por unos pocos días y los segundos por años, llegando decenas o centenios. En el primer caso, los modelos numéricos y estadísticos se ejecutan en modo operacional de modo de tener el mejor pronóstico. En el otro caso, se hacen simulaciones ocasionalmente para determinar escenarios posibles”37. Es así como los modelos matemáticos son sistemas de ecuaciones que intentan reproducir el comportamiento del mundo real, simulando las interacciones de la atmósfera, océanos, superficie terráquea, y hielo. El uso de modelos es imprescindible para hacer pronósticos meteorológicos y para intentar prever las consecuencias de los posibles cambios climáticos a mediano y largo plazo. Su gran desventaja es que la realidad es tan compleja que aun cuando se desarrollen modelos con gran cantidad de variables, no estará al alcance un supercomputador que sea capaz de soportarlo. Es por esto que se utilizan modelos que sólo describan el medio analizado (atmósfera, aire, mar). En la búsqueda del perfeccionamiento de estos modelos se van agregando nuevas variables que simulen mejor lo que está ocurriendo, es así como se están dando nuevos desafíos en la modelación38, tales como: Pronóstico de conjunto (Ensemble forecast) El pronóstico de conjunto supone la “producción” de muchos pronósticos de manera de reflejar la incertidumbre en el estado inicial de la atmósfera (debido a los errores de la observación y el insuficiente muestreo). Su aporte es que la incertidumbre en el pronóstico puede ser calculada por el rango de diferentes pronósticos producidos. 37 Laura Gallardo Klenner, apunte crítico. 38 Rodrigo Delgado Urzúa. Implementación computacional de modelos atmosféricos. 107 Capítulo V: Estado del Arte Internacional Los pronósticos de conjunto están siendo cada vez más usados para las operaciones del pronóstico del tiempo (ejemplos variados en European Centre for Medium-Range Weather Forecasts (ECMWF), National Centers for Environmental Prediction (NCEP), y el Canadian Forecasting Center). Pronósticos extendidos de alta confiabilidad Se define como pronóstico extendido al período que va entre el tercer y el quinto día a partir del cual se realizó el análisis, aquí se busca desarrollar la más alta precisión. A ésta se agrega una nueva tendencia denominada “Accurate Seasonal Forecast”, en ella se apunta mucho más allá, pretendiéndose entregar pronósticos mucho más precisos en el lapso de semanas y meses. Ciertamente, desarrollar este tipo de pronósticos entregará grandes beneficios a la humanidad, en muchas actividades productivas (por ejemplo en agricultura, silvicultura, pesca, minería, etc.). Hoy en día muchos gobiernos piden informes a sus servicios meteorológicos para ver qué medidas preventivas desarrollar en la búsqueda de mejores rentabilidades. Pronósticos de alta resolución Cada día se desarrollan resoluciones más altas, esto es debido a que: •Existe una mayor cantidad, poder y disminución en el precio de los computadores. •A diario se dispone de mayor precisión y cantidad de datos topográficos y meteorológicos. •Su importancia viene dada porque las acciones que se deben tomar son de carácter regional la gran mayoría de las veces, y, para esto, es necesario tener resoluciones donde se puedan detectar las variables en un punto dado. Todas estas tendencias en la modelación tienen en común un alto requerimiento de capacidad de cómputo, como grandes espacios donde guardar los datos que estos modelos proporcionan. Un punto fundamental con los datos proporcionados aquí, es no sólo almacenar los resultados, sino cómo lograr que esos datos sean compartidos y útiles para otras investigaciones, sin importar el lugar donde se encuentre la persona que los solicite. Modelos Acoplados Además de los modelos que analizan un área en especial (atmósfera, aire, mar), también se están implementando modelos “especiales” que incluyen tanto el mar como el aire, estos son los denominados “modelos acoplados”. 108 Capítulo V: Estado del Arte Internacional Un modelo acoplado considera que los cambios en la atmósfera causan cambios en el océano, a su vez, los cambios en la parte del modelo del océano pueden causar cambios en la parte de la atmósfera. De manera que si se lleva gran cantidad de dióxido de carbono de la atmósfera hacia océano, el océano podría llegar a estar «completamente lleno» de CO2, no contener tanto, o, quizás, estar en una posición intermedia. Si bien los modelos acoplados pueden ser más realistas, lamentablemente poseen una complejidad mayor que los que son de un medio en específico, además, toma trabajo cerciorarse que las respuesta que originan son correctas y tardan mucho en funcionar incluso en las supercomputadoras. Modelos del tiempo químico (Chemical weather forecast) Estos nuevos tipos de modelos buscan pronosticar la calidad del aire y cómo ésta influye en las condiciones climáticas (cantidad gases o material particulado), para generar acciones preventivas. El pronóstico del tiempo químico es una “nueva variable” en los modelos de pronosticación climática (WRF/Chem, CCATT-BRAMS, etc.), la cual aumenta de sobremanera los costos en tiempo y en términos computacionales. ¿Las instituciones dedicadas a la investigación, están reconociendo la importancia que tienen los especialistas en computación en sus trabajos? ¿La búsqueda de modelos con cada vez más variables y precisión, es acompañada de una infraestructura acorde? 5.1.6 Esfuerzos existentes en Chile Hoy en día, en la Dirección Meteorológica de Chile se utiliza un cluster en el cual se incorporan 8 CPU exclusivamente para el pronóstico operacional para el país. No se guardan los pronósticos a largo plazo, salvo en un marco de cinco días, aproximadamente. Para el proyecto ACT-19, llevado a cabo por Universidad de Chile, Universidad de Concepción y la Dirección Meteorológica de Chile, se utilizó un cluster Linux con 16 CPU AMD Optaron. Con este equipo se consiguieron aproximadamente 10 TB (terabytes). Estos datos recrean posibles escenarios del clima en Chile, entre los años 2070 y 2100. 109 Capítulo V: Estado del Arte Internacional ¿En Chile, se está obteniendo un rendimiento óptimo con los resultados de los diferentes proyectos? ¿Se podrían guardar todos los datos obtenidos sin necesidad de eliminar resultados por falta de espacio? ¿Qué tan beneficiosos pueden llegar a ser los datos que son desechados? 5.1.7 Fenómenos climáticos Los fenómenos climáticos siempre han existido e impactado de distintas maneras en los lugares en los cuales se presentan, ya que pueden beneficiar al medio ambiente como devastarlo por exceso. Lo anterior se ve reflejado en los distintos sectores de la actividad económica. Por estas razones y dada la importancia que tiene la ocurrencia de estos fenómenos para el bienestar de la sociedad, es que prácticamente todos los países del mundo poseen su propio Servicio Meteorológico, el que les permite obtener información sobre el comportamiento de tales fenómenos. Lamentablemente estos fenómenos poseen una gran complejidad al momento de estudiarlos, lo que dificulta predecir su comportamiento. Entre los fenómenos climáticos destacados, tenemos: Fenómeno del Niño39: Actualmente se sabe que corresponde a todo un fenómeno natural de interacción océano-atmósfera que ocurre en la región del Pacífico intertropical cada cierta cantidad de años y que se caracteriza por presentar condiciones de la temperatura del mar más cálidas que lo normal, en una extensa área entre las costas sudamericanas y de Oceanía. ¿Qué ocurre en la atmósfera en presencia del Niño? Los vientos alisios, que normalmente soplan en la región intertropical desde América hacia Oceanía, se debilitan y pueden llegar a cambiar de sentido, facilitando así el transporte de aguas calientes, características del sector de Indonesia, hacia las costas intertropicales sudamericanas y, posteriormente, hacia el istmo de Panamá y las costas del norte de Chile. En la atmósfera media y alta del Pacífico ecuatorial, los vientos del este también se debilitan, permitiendo que la nubosidad convectiva del sudeste asiático se desplace hacia Sudamérica, produciendo intensas precipitaciones en Ecuador y Perú. Estas alteraciones atmosféricas, también hacen que la zona de altas 39 110 Información obtenida desde sitio web de la Dirección Meteorológica de Chile. Capítulo V: Estado del Arte Internacional presiones que se ubica sobre el Océano Pacífico, frente a la parte norte y central de Chile (anticiclón del Pacífico), se desplace hacia el oeste, debilitando sus efectos en Chile y permitiendo así que los sistemas frontales que provienen del Pacífico sur, alcancen la zona central y norte chico del país, incrementándose la cantidad e intensidad de las precipitaciones en estos sectores. La Niña: Término empleado para describir un fenómeno natural de interacción océanoatmósfera, que ocurre en la región del Pacífico ecuatorial cada ciertos años y que se caracteriza, principalmente, por presentar condiciones de la temperatura del mar más frías que lo normal en una extensa área, entre las costas de Sudamérica y Oceanía. ¿Qué ocurre en la atmósfera en presencia de La Niña? Los vientos alisios, que en condiciones naturales se encuentran en la región intertropical del océano Pacífico, soplando desde las costas americanas hacia el sector asiático, comienzan a ser más intensos, favoreciendo, de esta manera, el arrastre de aguas superficiales más frías que existen en la región oriental del Pacífico hacia la parte occidental. En la atmósfera media y alta del Pacífico ecuatorial central, bajo estas condiciones frías, aparece una intensificación de la circulación de las masas de aire que descienden desde la alta atmósfera (15 km de altura) hasta la superficie. Esto origina que la zona de altas presiones, ubicada en la parte norte y central de Chile y área oceánica, aumente en intensidad y extensión espacial, impidiendo el ingreso de sistemas frontales y el desarrollo de nubosidad asociada a precipitaciones en la zona central y sur de Chile. El Monzón40: Un monzón se define como un cambio estacional en la dirección del viento. El término se deriva de la palabra árabe «mausim», que significa «estación». Originalmente el término era aplicado por marineros árabes para referirse a los vientos cambiantes estacionalmente en el Océano Índico y regiones circundantes, incluyendo el Mar de Arabia. Estos vientos soplan desde el suroeste, durante una mitad del año, y desde el noreste, durante la otra. Por lo tanto, hay cambios estacionales que se observan claramente como vientos del noreste que prevalecen durante el invierno en el subcontinente de la India y del suroeste, en el verano. Otros monzones ocurren en Australia y África. Debido a una mejor comprensión de los monzones, la definición ahora denota sistemas climáticos dondequiera que la humedad aumente dramáticamente en la 40 http://www.jmarcano.com/varios/desastre/monzon.html. Consultado 24 de Mayo de 2009. 111 Capítulo V: Estado del Arte Internacional estación cálida. El caso mejor conocido es el monzón asiático, que afecta al sureste de Asia y al subcontinente indio, pero también existe un clima monzónico en el norte de Australia, África Occidental y otras partes. La presencia Norte a Sur de los Andes impide la aparición de fenómenos similares tanto en América del Sur como del Norte. El monzón es uno de los fenómenos climáticos más dramático en el planeta. Las grandes superficies envueltas en los monzones y la gran escala del clima dentro de ellos, sugieren que juegan un papel significativo en la modelación del clima global. Cuando ocurren fuertes precipitaciones monzónicas en una región, en las regiones opuestas se presentan sequías. Un cambio monzónico estacional se caracteriza por una diversidad de mecanismos físicos que producen fuertes vientos estacionales, un verano húmedo y un invierno seco. Todos los monzones comparten tres mecanismos físicos básicos: diferencia en el calentamiento entre la tierra y los océanos, las fuerzas de Coriolis, debido a la rotación de la Tierra, y el papel del agua que almacena y libera energía a medida que cambia de líquido a vapor y viceversa (calor latente). El efecto combinado de estos tres mecanismos es el que determina las inversiones monzónicas características de los fuertes vientos y la precipitación. En el caso del Monzón del Océano Índico, el primer y el tercer mecanismo producen efectos más intensos que en cualquier otra parte del mundo. De interés particular es la fase «verano húmedo» de Junio a Septiembre con vientos prevalentes del suroeste y fuertes lluvias. Ciclón Tropical: Es un sistema de tormentas caracterizado por una circulación cerrada alrededor de un centro de baja presión, que produce fuertes vientos y abundante lluvia. Los ciclones tropicales extraen su energía de la condensación de aire húmedo, produciendo fuertes vientos. Se distinguen de otras tormentas ciclónicas, como las bajas polares, por el mecanismo de calor que las alimenta y convierte en sistemas tormentosos de «núcleo cálido». Dependiendo de su fuerza y localización, un ciclón tropical puede llamarse depresión tropical, tormenta tropical, huracán, tifón o simplemente ciclón. Afortunadamente los ciclones que causan destrucción masiva no son frecuentes pero cuando suceden pueden causar daño en un rango de miles de millones de dólares y destrozar o acabar con miles de vidas. El Ciclón Bhola, el más mortífero registrado, golpeó la zona altamente poblada del Delta del Ganges en el Pakistán Oriental (ahora Bangladesh), el 13 de noviembre 112 Capítulo V: Estado del Arte Internacional de 1970, como un ciclón tropical de Categoría 3 (se refiere a vientos entre 178–209 km/h). Se estima que acabó con la vida de más de 300.000 personas41 . En la región atlántica, a lo menos tres tormentas han matado a más de 10.000 personas. En 1998, el Huracán Mitch, durante la Temporada de huracanes en el Atlántico, provocó severas inundaciones y deslizamientos de barro en Honduras, matando a 18.000 personas y cambiando de tal manera el aspecto del terreno, que fue preciso realizar nuevos mapas del país42. El Huracán de Galveston (1900), que hizo entrada en tierra en Galveston (Texas) con una estimación de Categoría 4 (vientos entre 210-249 km/h), acabó con la vida de 8.000 a 12.000 personas, y sigue siendo el desastre natural más mortífero en la historia de Estados Unidos43. La tormenta más letal registrada en el Atlántico fue el Gran Huracán de 1780, que mató a 22 mil personas en las Antillas44. Entre las tormentas destacadas están el Tifón Nancy (1961) que tuvo un registro con vientos de hasta 345 km/h, pero investigaciones recientes indican que las velocidades medidas entre 1940 y 1960 eran más elevadas de lo que en realidad debían ser, y, por tanto, no se considera a ésta comola tormenta con vientos más potentes registrados45. De forma similar, una racha de viento medida a nivel de superficie, causada por el Tifón Paka, en Guam, con una intensidad de 380 km/ h, que había sido confirmada y hubiera sido la racha de viento no tornádica más fuerte registrada en la superficie de la Tierra, tuvo que ser rechazada ya que el anemómetro fue dañado por la tormenta46. Tip es también el ciclón más grande registrado, con una circulación de vientos de fuerza tropical en un campo de 2.170 km. El tamaño medio de un ciclón tropical es de «sólo» 480 km. La tormenta más pequeña registrada fue el Ciclón Tracy, que en 1974 devastó Darwin (Australia), con tan sólo 100 km de tamaño47. 41 Major Hurricanes, Typhoons, Cyclones, and other Storms since 1900. Encarta. Consultado el 24 de Mayo de 2009. 42 Guiney, John L.; Lawrence, Miles B. (28 de enero de 1999). Hurricane Mitch 22 October - 05 November 1998. National Hurricane Center. Consultado el 24 de Mayo de 2009. 43 The Deadliest Atlantic Tropical Cyclones, 1492-1996. National Hurricane Center - National Weather Service. Consultado el 24 de Mayo de 2009. 44 National Hurricane Center - National Weather Service, artículo citado. 45 Landsea, Chris. Which is the most intense tropical cyclone on record?. Atlantic Oceanographic and Meteorological Laboratory, Hurricane 46 Super Typhoon Paka>s (1997) Surface Winds Over Guam. Office of the Federal Coordinator of Meteorological Services (17 de agosto de 1998). Consultado el 24 de Mayo de 2009. 47 Landsea, Chris. Artículo citado. 113 Capítulo V: Estado del Arte Internacional El Huracán Iniki (1992) es la tormenta más poderosa que ha golpeado a Hawái en la historia, entrando en Kauai como huracán de categoría 4, matando a seis personas y causando tres mil millones de dólares en daños48. Otros huracanes destructivos en el Pacífico incluyen al Huracán Pauline49 y al Huracán Kenna50. El 26 de marzo de 2004, el Ciclón Catarina se convirtió en el primer huracán del Atlántico Sur. Otros ciclones anteriores en esa misma región, en 1991 y 2004, alcanzaron sólo fuerza de tormenta tropical. Es posible que antes de 1960 se formasen ciclones tropicales allí, pero no fueron observados hasta el comienzo de la era de los satélites atmosféricos en aquel año. Un ciclón tropical no necesita ser especialmente fuerte para causar un daño difícil de olvidar. La Tormenta Tropical Thelma, en noviembre de 1991, mató a miles de personas en Filipinas y nunca llegó a ser tifón; el daño de Thelma se debió principalmente a las inundaciones y no a los vientos o marejada ciclónica. En 1982, la depresión tropical sin nombre, que posteriormente se convertiría en el Huracán Paul, causó la muerte de unas 1.000 personas en América Central, debido al efecto de sus lluvias torrenciales. El 29 de agosto de 2005, el Huracán Katrina hizo entrada en tierra en Luisiana y Misisipi. El Centro Nacional de Huracanes de EE.UU., en su revisión de agosto de la temporada de tormentas tropicales, aseguró que Katrina era, probablemente, el peor desastre natural en la historia del país51. Actualmente se le asignan 1.604 muertes, principalmente producto de las inundaciones y sus consecuencias en Nueva Orleans, Luisiana. También se estima que causó daños por un valor de 75 mil millones de dólares. Antes de Katrina, el sistema más costoso en términos monetarios fue el Huracán Andrew(1992), que causó unas pérdidas estimadas de 39 mil millones de dólares por los daños ocasionados en Florida52. 48 Hurricane Inikiki Natural Disaster Survey Report. Central Pacific Hurricane Center - National Weather Service. Consultado el 24 de Mayo de 2009. 49 Lawrence, Miles B. (7 de noviembre de 1997). Hurricane Pauline 5 - 10 October 1997. National Hurricane Center - National Weather Service. Consultado el 24 de Mayo de 2009. 50 Hurricane Kenna 22 - 26 October 2002. National Hurricane Center - National Weather Service. Consultado el 24 de Mayo de 2009. 51 Tropical Weather Summary. National Hurricane Centre - National Weather Service. Consultado el 24 de Mayo de 2009. 52 Knabb, Richard D.; Rhome, Jamie R.; Brown, Daniel P. (20 de diciembre de 2005). Tropical Cyclone Report - Hurricane Katrina 23-30 August 2005 (PDF). National Hurricane Center - National Weather Service. Consultado el 24 de Mayo de 2009. 114 Capítulo V: Estado del Arte Internacional 5.2 Iniciativas Internacionales: e-infraestructuras para el desarrollo de la e-ciencia en Clima 5.2.1 Tipos de e-Infraestructura Dependiendo del tipo de proyecto, las necesidades varían, éstas son: capacidad de cómputo, almacenamiento y traspaso de información. Así también lo es el tipo de infraestructura que el proyecto utilizará. A continuación describiremos de qué forma aportan cada uno de estos elementos a los proyectos: e-Ciencia Capacidad de Cómputo La relevancia en la capacidad de cómputo viene dada, dependiendo del tiempo necesario para la obtención de los resultados, del tipo de modelo de tiempo o de clima utilizado. Ciertos proyectos pueden trabajar con simples computadoras de escritorio Dual-Core, clusters y otros, con la más alta tecnología de High-performance computing (HPC, computación de alto rendimiento). Almacenamiento Como todo, también, el tipo de almacenamiento depende del proyecto en cuestión, así dependiendo de la distribución de los recursos (si el proyecto es para entregar datos a la comunidad) se evalúa si los datos almacenados deben quedar a disposición del público vía Internet, o si es necesario ir físicamente al lugar donde éstos se encuentren. Normalmente, un proyecto de importante tamaño y generador de varias publicaciones, crea necesidades de almacenamiento del orden de Terabytes (1 Terabyte = 1024 Gigabytes), agregando que la mayoría de las ocasiones simplemente no se guardan datos de segundo orden (aún importantes) para no tener una base de datos muy amplia. Un ejemplo de esto es el proyecto ACT-1953, que llegó, después de la eliminación de los datos de 2do orden, a una base de datos de más de 5 Terabytes, los cuales son compartidos gracias al software OpenDAP54. 53 http://www.dgf.uchile.cl/ACT19 54 http://opendap.org 115 Capítulo V: Estado del Arte Internacional Redes de alta velocidad para el traspaso de información Normalmente cada país tiene su propia Red de Alta velocidad, en Chile la entidad encargada de esto es la Red Universitaria Nacional (REUNA), que puede entregar hasta 15 Mbps. También existen Redes de Redes, en América Latina está RedCLARA (Cooperación Latino Americana de Redes Avanzadas; REUNA es integrante de ésta). Comunitarias Computación grid (grid computing) La computación grid, es una tecnología innovadora que permite utilizar de forma coordinada todo tipo de recursos (entre ellos cómputo, almacenamiento y aplicaciones específicas) que no están sujetos a un control centralizado. Según Ian Foster y Carl Kesselman“un grid computacional es una infraestructura de hardware y software que provee acceso confiable, constante, omnipresente y barato a sofisticadas capacidades computacionales” 55; “la computación Grid consiste en una infraestructura de hardware y software la cual entrega un acceso confiable y consistente a los recursos computacionales localizados en diferentes lugares geográficos”56. En otras palabras, la computación grid es una aplicación que se encarga de resolver un problema con muchos computadores al mismo tiempo, usualmente de carácter científicos o técnicos, que requieren un gran número de computadores procesando una y otra vez, o acceder a una gran cantidad de datos. La computación grid depende de un software que se encarga de dividir y repartir la tarea en muchas partes, para enviarlas para su ejecución a la cantidad de computadores disponibles, muchas veces varios cientos. Su punto fuerte es que al contar con una gran cantidad de computadores (los cuales tienen una estructura de nodos controlada y jerarquizada en centros científicos), la potencia que pudieran llegar a generar es prácticamente ilimitada, ya que siempre se podrán ir incorporando nuevos equipos a la infraestructura. Además, ofrece una perfecta integración de sistemas y dispositivos heterogéneos, por lo que las conexiones entre diferentes máquinas no generarán ningún problema. Se trata de una solución altamente escalable, potente y flexible, ya que evita problemas de falta de recursos (cuellos de botella), pues al sumarse nuevos 55 Kesselman e Ian Foster (1998). «The Grid: blueprint for a New Computing Infrastructure». 56 I. Foster, C. Kesselman, S. Tuecke (2001). “The Anatomy of the Grid: Enabling Scalable Virtual Organizations” 116 Capítulo V: Estado del Arte Internacional equipos, aumenta la potencia de la infraestructura sin necesidad de reemplazar el equipo antiguo por uno nuevo; vale decir, nunca queda obsoleta, debido a la posibilidad de modificar el número y características de sus componentes. Estos recursos están distribuidos en la red de forma que cualquier usuario los pueda ver, claro que siempre se siguen pautas de seguridad y políticas en la gestión, tanto en el tema técnico como económico. De esta forma, queda como principal objetivo el compartir una serie de recursos (infraestructura, datos, etc.) en la red de manera uniforme, segura, transparente, eficiente y fiable, entregando un único punto de acceso (generalmente un portal web) al conjunto de recursos distribuidos en distintos puntos geográficos de la administración. Podemos concluir que la computación grid facilita la creación de empresas virtuales. Sus principales características: •Capacidad de balanceo de sistemas: no habría necesidad de calcular la capacidad de los sistemas en función de los puntos altos de trabajo, ya que la capacidad se puede reasignar desde la granja de recursos a donde se necesite. •Alta disponibilidad: con la nueva funcionalidad, si un servidor falla, se reasignan los servicios en los servidores restantes. •Reducción de costos: con esta arquitectura los servicios son gestionados por "clusters de recursos". Ya no es necesario disponer de "grandes servidores" y podremos hacer uso de componentes de bajo costo. Cada sistema puede ser configurado siguiendo el mismo patrón. Sobre Data Grid Cabe destacar que existen otros sistemas de infraestructuras que se encargan de desarrollar tareas más específicas, los cuales están dentro de la computación grid. Bajo este concepto tenemos la grid de datos (data grid), que se dedica a trabajar exclusivamente el contenido de la gran cantidad de datos que son compartidos y manejados. A menudo, pero no siempre, éste pasa a ser un sistema que funciona combinado dentro de otro de computación grid. ¿Cuál es la importancia de un data grid? Como se ha dicho, muchos científicos y aplicaciones ingenieriles requieren acceso a grandes cantidades de datos, los cuales se encuentran de forma distribuida, desde terabytes hasta petabytes. El tamaño y número de esta colección de datos ha crecido rápidamente en los últimos años, y lo continuará haciendo, debido a los nuevos experimentos y sensores que funcionan por medio de Internet, a la disminución del costo de cómputo y almacenamiento de datos, al aumento del rendimiento, y al desarrollo de nuevas aplicaciones para la e-Ciencia; el resultado, ya se dijo: cada vez más datos. 117 Capítulo V: Estado del Arte Internacional Principios del diseño del data grid57 El hecho de que las aplicaciones frecuentemente son operadas desde áreas lejanas, multi-institucionales, en ambientes heterogéneos en los cuales normalmente no se pueden asumir los mismos criterios, uniformidad en sus comportamientos o políticas, condiciona el desarrollo de los siguientes principios: • Mecanismo de neutralidad: La arquitectura del data grid es diseñada para ser tan independiente como sea posible de los mecanismos de bajo nivel utilizados para almacenar, transferir datos, metadatos, etc. Este objetivo es conseguido a través de la distinción de los accesos a los datos, movimiento de datos por terceras personas, acceso al catálogo, y otras interfaces que encapsulen peculiaridades de sistemas de almacenamientos específicos, catálogos, transferencia de algoritmo de datos, y cosas por el estilo. • Neutralidad Política: La arquitectura del data grid es estructurada tanto como sea posible, el diseño de decisiones con implicaciones significativas en el desempeño son expuestas a los usuarios, en vez de ser encapsuladas en una implementación de “caja negra”. De este modo, mientras el movimiento de datos y el catalogado de copias son siempre operaciones básicas, las políticas de duplicación son implementadas por medio de procedimientos de alto nivel, los cuales son siempre por defecto, pero pueden ser fácilmente sustituidos con códigos de aplicaciones específicas. - Compatibilidad con la infraestructura grid: se intenta superar las dificultades de un área amplia, multi-institucional, funcionando por la explotación subyacente de la infraestructura grid, que entrega servicios básicos tales como autentificación y gestión de recursos e información. Para el final, se estructuró la arquitectura del data grid, así más herramientas grid especializadas son compatibles con el bajo nivel de los mecanismos grid. Esta propuesta también simplifica la implementación de estrategias que integran, por ejemplo, almacenamiento y cómputo. - Uniformidad de la infraestructura de información: como en la grid subyacente, uniformidad y acceso conveniente para información acerca de estructura de recursos y estado, son destacados como medios que posibilitan la adaptación a los tiempos de ejecución para condiciones del sistema. En la práctica, esto significa que se usa el mismo modelo de datos e interface grid para acceder a los datos, metadatos, copias, y, por ejemplo, catálogos, como son usados en la infraestructura grid de información subyacente. 57 Ann Chervenak, Ian Foster, Carl Kesselman, Charles Salisbury and Steven Tuecke (2000). “The Data Grid: Towards an Architecture for the Distributed Management and Analysis of Large Scientific Data Sets”. Journal of Network and Computer Applications: Special Issue on Network-Based Storage Services, vol. 23, no. 3, p. 187-200. 118 Capítulo V: Estado del Arte Internacional Principales desafíos de la computación grid en la investigación del clima58: •Desarrollar un código computacional capaz de correr eficientemente en la nueva generación de computadores de alto rendimiento. •Diseño y desarrollo de la Web basada en interfaces que asistan eficientemente las simulaciones de tiempo/clima para la mayoría de las necesidades de la comunidad meteorológica. •Localización de datos meteorológicos aconsejables. •El almacenamiento de la enorme cantidad de datos meteorológicos/ climáticos. •Construir, analizar y visualizar herramientas capaces de trabajar con la gran asignación de datos -del orden de Terabyte (1024 Gigabyte) hasta Petabyte (1024 Terabyte)- generados por la simulación de modelos regionales y globales. Impactos en el clima59: •La computación grid es capaz de entregar acceso a recursos computacionales significativos para investigadores de instituciones que no tienen suficiente poder computacional en sus proyectos. •Al adaptar la Web en base a interfaces para los modelos numéricos, se podría incrementar la productividad porque su uso es sencillo. •Estas interfaces Web ayudan a la gente que no está familiarizada con modelos numéricos, a correr sus experimentos de clima y tiempo, para lo cual están familiarizados, logrando incrementar la productividad. •Los portales Web podrían desarrollar vínculos entre los investigadores y las comunidades de modelación operacional, además de fomentar la colaboración entre las comunidades de modelación de clima y tiempo. •Se comporta como un recurso para un marco de desarrollo a largo plazo para aproximaciones sistemáticas de los cambios climáticos, modelos de evaluación climática y del tiempo, y estudio de impactos. “Los Grids no son buenos para el análisis de datos, su fuerte es tomar los datos y correr varios modelos distintos ocupando esos datos. Es por eso que los Grids son tan populares en servicios financieros, porque no tienen muchos datos, pero sí varios tipos de escenarios”60. 58 Eugenio S. Almeida. Entrevista. 59 Eugenio S. Almeida. Entrevista. 60 Rob Batchelder, industry analyst and president of Relevance. 119 Capítulo V: Estado del Arte Internacional Esta última cita hace referencia al buen aporte que pudiera generar una infraestructura grid en el campo de las investigaciones climáticas, tal como ya lo está haciendo en el área de las finanzas. Infraestructura Abierta de Berkeley para la Computación en Red (BOINC, por sus siglas en inglés) Es una infraestructura para la computación distribuida, específicamente va más con el concepto de “volunteer computing”, que es un tipo de computación distribuida en la cual los dueños de computadores donan sus recursos computacionales (tales como poder de procesamiento y almacenaje) para uno o más “proyectos”. Hoy en día este concepto se está utilizando tanto para física, como para medicina nuclear, climatología y otras actividades de investigación científica. Sus Objetivos61: •Reducir las barreras de entrada para los recursos informáticos públicos. Compartir recursos entre proyectos autónomos. •Incluir diversas aplicaciones. •Recompensar a los participantes. •Proyectos del área Clima-Tiempo que estén utilizando BOINC: Climatepredicttion.net El objetivo de este proyecto (basado en la Universidad de Oxford) es cuantificar y reducir la incertidumbre de largo plazo de la predicción climática basada sobre simulaciones computacionales. Climate@home Ésta es una colaboración entre investigadores de NCAR, MIT, UCAR, Rutgers, Lawrence Berkeley Lab, y U.C. Berkeley. Sus objetivos científicos son similares a los de Climateprediction.net, pero utilizan a la Comunidad de Sistemas de Modelación Climática (CCSM, su sigla en inglés) de NCAR. El denominador en común que tienen los proyectos que utilizan BOINC es que necesitan gran capacidad de cálculo, lo cual es la intención de BOINC, obtener una capacidad de computación enorme utilizando ordenadores personales. Es así como todos los cálculos complejos son llevados a cabo por ordenadores que tienen el software de BOINC instalado. 61 David P. Anderson (2004). “BOINC: A System for Public-Resource Computing and Storage”. 5th IEEE/ACM International Workshop on Grid Computing. Pittsburgh, USA. 120 Capítulo V: Estado del Arte Internacional En el caso de la climatología su impacto va en correr distintos modelos climatológicos que modelen los fenómenos que ocurren en esta área, o bien su comportamiento individual o su interrelación con otros medios. 5.2.1 Proyectos Internacionales de e-Infraestructuras para la e-Ciencia en Clima Actualmente se están realizando iniciativas y proyectos que hacen uso de las llamadas e-Infraestructuras, aquí se presenta un listado con su descripción y objetivos. Esquema de ejemplo: Nombre del proyecto Institución Coordinadora, Instituciones y Países Participantes, Abierta o Cerrada (posibilidad de integrarse) Descripción Aplicaciones que soporta o sub-área científica que apoya Recursos Locales: • Capacidad de Cómputo, Almacenamiento, Software, Servicios, Redes, etc. • Capital Humano con dedicación sólo a gestionar los recursos locales, Desarrolladores, Científicos, Estudiantes. Recursos Grid: · Grid Services, Cómputo, Data, Software, Políticas. · Capital Humano dedicado al Grid, gestionar Recursos Físicos, Servicios, Desarrollar Aplicaciones, Científicos, Estudiantes 121 Capítulo V: Estado del Arte Internacional a) Grids Americanas con aplicaciones climáticas Nombre del proyecto: Infraestructura Grid para el Proyecto de Predicción Meteorológica y Alertas Tempranas de Eventos Extraordinarios (Maracaibo, 10 de Agosto 2007) Disponible en: http://www.cmc.org.ve/documentos/GridONE2.pdf Instituciones Participantes: Observatorio Nacional de Eventos Extraordinarios (ONE2), fundado por el Centro de Modelado Científico (CMC, http://www.cmc.org.ve) de La Universidad del Zulia y el Servicio de Meteorología de la Fuerza Armada (Venezuela). Actualmente, el Centro de Modelado Científico (CMC) de La Universidad del Zulia y el Servicio Nacional de Meteorología poseen estrechas relaciones de trabajo con el Centro Internacional para la Investigación del Fenómeno del Niño (CIIFEN), con el Instituto Internacional de Investigaciones Climáticas y Sociales (IRI) y con la Universidad de Guayaquil. Es el parecer de quien escribe que no habría inconveniente en generalizar los acuerdos preexistentes para incluir a todos los nodos e instituciones que deseen colaborar con investigaciones como las aquí planteadas 62. Descripción: Proyecto de estructuración y dotación de los nodos Grid involucrado en el Observatorio Nacional de Eventos Extraordinarios (ONE2), cuyo objetivo principal es el de generar pronósticos fidedignos y alertas tempranas para todo el territorio venezolano, empleando redes avanzadas de tecnologías de información y redes de conocimiento. La dotación consiste de 3 subsistemas intrínsecamente relacionados: cómputo, almacenamiento y visualización científica, todos sobre la correspondiente plataforma para garantizar la ubicuidad necesaria para un proyecto del alcance y envergadura previstos. El middleware necesario y las aplicaciones de cómputo y visualización se consideran aquí de código abierto (particularmente gLite, MM5, WRF, MER-NCEP, PRECIS, etc.). Este proyecto sentará las bases -en términos de infraestructura, recursos humanos, experiencia, etc.de la componente venezolana de lo que podría llamarse el OLE2, Observatorio Latinoamericano de Eventos Extraordinarios. El cronograma establecido se plantea en tres fases, con una duración total de 12 meses. Aplicaciones que soporta o sub-área científica que apoya Defensa nacional, modelamiento científico. 62 122 http://www.cmc.org.ve/documentos/GridONE2.pdf Capítulo V: Estado del Arte Internacional Recursos Locales: Para llevar a cabo lo presentado en las páginas anteriores será necesario, en todos los casos, una conexión que permita la transferencia de datos, intercambio de resultados e interacción entre nodos (videoconferencias, por ejemplo, para discusión de aspectos relacionados con el proyecto) en tiempo real63. Se entiende que tal requerimiento está cubierto de entrada por el marco preexistente de la Red Académica de Centros de Investigación y Universidades Nacionales (REACCIUN2, http://www.reacciun2.edu.ve) 64”. RR.HH. en lo local Tres personas. Un científico (Profesor Ángel Muñoz) y dos estudiantes avanzados. Recursos grid: Un nodo maestro para la grid (el UI, que en este caso corresponde a un PC), al que se le instalará el middleware necesario (gLite, Globus Toolkit, Condor, etc) y estará conectado directamente con REACCIUN2. Éste es el elemento frontal (frontend) de cada nodo de REACCIUN2, que se encarga de la distribución de las faenas en los nodos locales de trabajo (worker nodes) y de almacenamiento (storage nodes), pero también de interactuar con los demás nodos de las otras instituciones participantes en el proyecto. Un nodo de trabajo maestro (master worker node), en este caso un X4100 M2 de 4Gb, que tendrá a su cargo un determinado número de nodos secundarios (esencialmente X2100 M2 con 2 Gb) para llevar a cabo el cómputo necesario. Un subsistema de almacenamiento (storage nodes), controlado en la presente propuesta por un servidor Sun Fire X4500, que funge como SRM. RR.HH. en la grid Las mismas tres personas se encargan tanto de los recursos locales como de la grid. Existe una falta de computistas en este apartado, por lo cual los talleres destinados a grid siguen siendo necesarios para la capacitación de funcionarios en las distintas instituciones donde se instala este sistema. Nombre del proyecto Earth System Grid (http://www.earthsystemgrid.org) 63 http://www.cmc.org.ve/documentos/GridONE2.pdf 64 http://www.cmc.org.ve/documentos/GridONE2.pdf 123 Capítulo V: Estado del Arte Internacional Instituciones participantes: Earth System Grid fue fundado por el Departamento de Energía de Estados Unidos, hoy tiene un número importante de colaboradores, entre los que destacamos: Argonne National Laboratory (1), Lawrence Berkeley National Laboratory, Lawrence Livermore National Laboratory (2), Los Alamos National Laboratory, National Center for Atmospheric Research (3), y Oak Ridge National Laboratory, University of Southern California/Information Sciences Institute. El proyecto ESG también está en cercana colaboración con otras instituciones, “donde sea necesario, desarrollamos herramientas ESG y servicios en colaboración con grupos nacionales e internacionales”. Sus principales investigadores son: Ian T. Foster (1) Dean N. Williams (2) Don E. Middleton, (3) Descripción: Earth System Grid (ESG) es uno de los proyectos más grandes en el manejo de modelos y datos atmosféricos en un ambiente grid. En su resumen señala la importancia de la salida de datos de los distintos modelos climáticos y cómo éstos, para ser útiles, deben ser accesibles para los investigadores de los impactos del cambio climático, ya sean de laboratorios nacionales y universidades, u otro tipo de institución. En una de sus múltiples publicaciones se destaca que: “Los modelos climáticos globales son usados para simular el pasado, presente, y futuro climático, y experimentos son ejecutados continuamente sobre variedad de supercomputadoras distribuidas. El archivo de datos resultante, se esparce en muchos sitios, que actualmente contienen arriba de 100 Terabytes (1 TB = 1024 Gygabytes) de datos de simulación y sigue creciendo rápidamente”. Cita resumen Supporting the Next Generation of Climate Modeling Research. Para entregar estos datos, ESG propone crear un sistema colaborativo virtual, que enlace centros, usuarios y datos de forma distribuida. ESG proveerá a los científicos con un acercamiento virtual a datos distribuidos y recursos que se requieran para el desarrollo de la investigación. El punto de vista de ESG es que con la creación de este sistema/ambiente incrementará la productividad de los investigadores gracias a que compartiría este conjunto de datos climáticos dentro de una comunidad de recursos. Este proyecto ha logrado un número importante de publicaciones, entre las que destacamos: 124 Capítulo V: Estado del Arte Internacional - High-Performance Remote Access to Climate Simulation Data: A Challenge Problem for Data Grid Technologies (2001)65 - Turning Climate Datasets into Community Resources (2002)66 - Supporting the Next Generation of Climate Modeling Research (2005)67 - Enabling worldwide access to climate simulation data (2006)68 - Data management and analysis for the Earth System Grid (2008) - The Earth System Grid: Enabling Access to Multi-Model Climate Simulation Data (2009) Aplicaciones que soporta o sub-área científica que apoya69: Dentro de sus servicios y aplicaciones soportadas están: El Manejo de Recursos Almacenados (SRM, por sus siglas en ingles), por medio de un middleware (software de computador que conecta aplicaciones) es usado para recuperar archivos de profundidad y transferirlos (via GridFTP) hacia el portal de datos NCAR, donde quedan disponibles para las peticiones HTTP. El Servicio de Localización de Replicas (RLS), es un sistema de actualización de las bases de datos que tiene un seguimiento de las copias de los ficheros almacenados en cualquier punto de la grid. El RLS es usado cuando los datos son editados por el sistema. El servidor OpenDaPg es usado cuando se solicitan un subconjunto del conjunto de datos virtuales. Los datos son extraídos desde múltiples ficheros, almacenados dentro de un único archivo, y dejados a disposición para peticiones HTTP. Arquitectura de ESG: A continuación, presentamos una descripción general de la arquitectura ESG, mostrando la mayoría de los componentes involucrados en el sistema ESG, el cual es, desde abajo hacia arriba, el siguiente (Fotografía 1): • Base de datos, almacenamiento, y servidor de aplicaciones: Estos son los recursos básicos sobre los cuales ESG está construido e incluye recursos 65 http://datagrid.ucar.edu/esg/about/docs/ewa.esg_sc01_chervenak_final.pdf 66 http://datagrid.ucar.edu/esg/about/docs/ESGAMS_final.pdf 67 http://arxiv.org/pdf/0712.2262 68 http://www.iop.org/EJ/article/1742-6596/46/1/070/jpconf6_46_070. pdf?request-id=eb75c3ad-2c5e-4e0f-a54a-f601d1ba4716 69 “Acceso y Gestión del conjunto de datos de los modelos climáticos, entregando también servicios de colaboración”.- Paper Supporting the Next Generation of Climate Modeling Research 125 Capítulo V: Estado del Arte Internacional computacionales para la creación de datos virtuales, caché de discos y sistemas de memoria de gran capacidad, usados para mantener el recurso de datos, servidores de base de datos, empleados para almacenar metadatos, y servidores de aplicación, para mantener los servicios del portal ESG. • Globus/Grid infrastructure: Éste provee la componente remota: acceso autentificado para compartir recursos ESG, habilitando acceso para credenciales, datos, y metadatos, localización de servicios replicados (RLSs), y la propuesta y manejo de trabajos computacionales. • Nivel alto y servicios específicos de ESG: Estos servicios abarcan los recursos ESG y proveen habilidades tales como movimiento de datos de sitio a sitio, acceso a metadatos distribuidos y de confianza, y agrupación y filtro de datos. • Aplicaciones ESG: Lo más importante de éstos es el portal ESG, el cual provee una conveniente interface vía navegador para los servicios ESG. Otras aplicaciones incluyen herramientas de nivel usuario para publicación de datos, como también clientes para análisis y visualización de datos. Figura 6. Esquema de la arquitectura de ESG mostrando la mayoría de los CLIENT APPLICATIONS PUBLISHING APPLICATION ANALISIS CLIENTS (CDAT NCL) WEB PORTAL search browse download aggregate subset HIGHER LEVEL/ESG SPECIFIC SE RVICES OPeNDAP-g SRM & DATA MOVER CATALOG SERVICES (THREDDS) DESCRIPTION & ACCESS METADATA DATA AGGREGATION & SUBSETTING GLOBUS/GRID INFRASTRUCTURE GSI GridFTP GRAM MYRPOXY RLS OGSA-DAI DATABASE AND APPLICATION SEVERS REMOTE STORAGE ONLINE STORAGE CPU DB componentes 70 70 Publicación “The Earth System Grid: Supporting the Next Generation of Climate Modeling Research” 126 Capítulo V: Estado del Arte Internacional Nombre del proyecto: Open Science Grid (http://www.opensciencegrid.org) Instituciones Participantes National Science Foundation y el Department of Energy>s Office of Science de EE.UU. Consorcio de miembros y asociados71 Según Open Science Grid (OSG), el número de socios siempre está cambiando y creciendo, todos los miembros contribuyen con esfuerzo y recursos para obtener una infraestructura común. Dentro de este consorcio de miembros se puede encontrar una amplia cantidad de centros de investigación y universidades de EE.UU. También se señala que OSG tiene un grupo de “asociados” con los cuales trabaja activamente. Dentro de éste, se encuentran organizaciones grid y red, de carácter internacional, nacional, regional y de grids universitarias. Los principales asociados son: APAC National Grid Data Intensive Science University Network (DISUN) Enabling Grids for E-SciencE (EGEE) Grid Laboratory of Wisconsin (GLOW) Grid Operations Center at Indiana University New York State Grid Nordic Data Grid Facility (NorduGrid) Northwest Indiana Computational Grid (NWICG) Oxford e-Research Centre (OxGrid) São Paulo Regional Analysis Center (SPRACE) TeraGrid Texas Internet Grid for Research and Education (TIGRE) TWGrid (from Academica Sinica Grid Computing) Worldwide LHC Computing Grid Collaboration (WLCG) Descripción La principal misión de este proyecto apunta a promover el descubrimiento y colaboración en las investigaciones que tengan una alta demanda de datos, entregando las facilidades computacionales y los servicios para que se integren de forma distribuida y fiable, y se compartan recursos para apoyar al cómputo en todas las escalas. 71 http://www.opensciencegrid.org/About/Learn_About_Us/OSG_Organization/ Members_and_Partners 127 Capítulo V: Estado del Arte Internacional Dentro de los alcances destacados de este proyecto encontramos 72: • Un compromiso de ayuda a las comunidades que no estén familiarizadas con la computación grid, para modificar sus aplicaciones de tal forma que puedan implementarlas en los recursos de OSG. • Actividades para las comunidades de grid, las cuales buscan asistir a las universidades y a otros campos de enseñanza o investigación para planear una infraestructura local compartida que satisfaga las necesidades de sus investigadores y departamentos. • Actividades educacionales, organizadas e implementadas en escuelas de grid nacionales e internacionales, entregando material para cursos en línea. • La amplia cantidad de software de OSG están disponibles para ser descargados y usados sin restricciones por los investigadores y proyectos que no sean parte de OSG. • Una actividad interoperable ha trabajado con muchos grupos grid para utilizar servicios comunes que permitan la compatibilidad entre la OSG y las otras grid. • El OSG colabora con otros proyectos por medio de sus socios, destacamos a los investigadores desde la Universidad de Buenos Aires quienes están reutilizando material de la escuela de grid de OSG para actividades de entrenamiento local. Grid y Aplicaciones que soporta Dentro de las investigaciones destacadas se señalan el incremento de la precisión con el uso de múltiples modelos en el área del clima, los cuales pueden ser utilizados gracias al poder que entrega la infraestructura de OSG., en esta investigación participa Brian Etherton juntos a sus colegas, quienes pertenecen al Departamento de Meteorología de la University of North Carolina (UNC) Charlotte. El articulo nos señala que73: “El equipo de Etherton analiza individualmente las pasadas del modelo Weather Research and Forecasting (WRF) y los ‘pronósticos de conjunto’ (ensembles) de las múltiples pasadas, comparando lo generado con los resultados observados de la vida real y, así, variando los parámetros de valores para cada pasada. La precisión de los resultados producidos por los ensembles son comprobados de manera insuperable, si solamente se los compara con los modelos individuales”. 72 http://www.opensciencegrid.org/About/Learn_About_Us/Outreach 73 Stormy weather: grid computing powers fine-scale climate modeling, publicado en http://www.opensciencegrid.org/About/What_We%27re_Doing/Research_Highlights/ Stormy_Weather 128 Capítulo V: Estado del Arte Internacional La forma que se están llevando a cabo: “Los ‘ensembles’ se aplican hasta ahora, consistiendo en 16 pronósticos por día, diferenciados por la hora de comienzo y una variedad de parámetros físicos tales como los cambios aire/superficie de calor y humedad”. Todo esto ayuda a que las probabilidades de determinar un pronóstico usando los 16 ensembles sean bastante más precisas que los de aquellos basados en un único modelo. “El modelo WRF facilita los pronósticos en tiempo real de precipitaciones, temperatura de la superficie, velocidad del viento, señales de huracanes, potenciales tormentas, humedad y más. Todo esto combinado con el pronóstico de conjunto (ensambles) de estos modelos, puede producir incluso mayor precisión en los resultados”. Figura 7. El modelo de investigación y pronostico del tiempo (WRF)74 74 Imagen obtenida de http://wrf-model.org/plots/realtime_hurricane4km.php 129 Capítulo V: Estado del Arte Internacional Nombre del proyecto Portal de Ambientes Enlazados para los Descubrimientos Atmosféricos (Linked Enviroments for Atmospheric Discovery, “LEAD” Portal, https://portal. leadproject.org) Instituciones participantes Este proyecto se encuentra patrocinado por la National Science Foundation de los EE.UU. Dentro de las instituciones destacadas que participan en él están: Colorado State University, Howard University, Indiana University, Millersville University, University of Alabama in Huntsville, University Corporation for Atmospheric Research (UCAR), University of Illinois at Urbana-Champaign, University of Oklahoma y University of North Carolina - Chapel Hill. Descripción “LEAD logra que los datos meteorológicos, modelos de pronósticos, y las herramientas de análisis y visualizaciones estén disponibles para cualquiera que quiera interactivamente explorar tanto el tiempo como su evolución. El Portal LEAD brinda todos los recursos necesarios, en un conveniente punto de acceso, mantenido por un sistema de computación de alto rendimiento (HPC, su sigla en inglés). Con LEAD, meteorólogos, investigadores, profesores, y estudiantes ya no son más espectadores pasivos o que estén limitados por datos estáticos o imágenes pre-generadas, en vez de eso, ellos son participantes activos que pueden adquirir y procesar sus propios datos. El software de LEAD realza los procesos de experimentación automatizando muchas de las tareas asociadas con la ciencia meteorológica, que son complicadas y consumen tiempo. La herramienta de flujo de trabajo conecta las aplicaciones de gestión de datos, asimilación, pronóstico y verificación, dentro de un único experimento. Los resultados del experimento también incluyen descripciones detalladas del producto, también llamadas ‘metadatos’”75. “LEAD es un esfuerzo multidisciplinario que involucra a nueve instituciones y más de 100 científicos, estudiantes y personal técnico. LEAD se dirige al desafío fundamental de las investigaciones en tecnologías de información (IT, su sigla en inglés) y al desarrollo necesario para crear un marco de trabajo integrado y escalable, para identificar, acceder, preparar, asimilar, predecir, manejar, analizar, realizar minería de datos, y visualizar una colección amplia de datos meteorológicos y de los resultados de los modelos independientes del formato y la localización física. En 75 130 https://portal.leadproject.org/gridsphere/gridsphere?cid=intro Capítulo V: Estado del Arte Internacional términos prácticos, este proyecto tendrá un impacto de manera espectacular en la capacidad de proveer alertas oportunas de muchos eventos del tiempo, por medio del desarrollo de computación dinámica y la infraestructura de redes de trabajo requeridas para la detección a petición, simulación y predicción de un fenómeno de alto impacto en el tiempo local tal como una tormenta eléctrica”76. Recursos Grid: “Localizados en seis de las nueve instituciones participantes (Alabama, Illinois, Indiana, North Carolina, Oklahoma, and Unidata), LEAD Grid es un conjunto de sistemas de computación distribuida que representa una ‘habitación limpia’ en un ambiente grid, o una red de trabajo controlada que está libre de ‘contaminación’ externa. La grid es operada por LEAD, para asegurar una estricta compatibilidad de software y servidores, como un banco de pruebas para desarrollar, integrar, y testear todos los componentes de LEAD. Una función principal de LEAD Grid es recibir el conjunto de datos de relevancia para la meteorología de mesoescala”77. Nombre del proyecto: E-science grid facility for Europe and Latin America (http://www.eu-eela.eu) Descripción: EELA-2 apunta a construir una instalación de grid escalable de alta capacidad y con producción de calidad, entregando acceso a través de la red a computación distribuida, almacenamiento y recursos de la red necesarios para el amplio espectro de aplicaciones de las colaboraciones Europeas-Latino Americanas, con principal atención en: Ofrecer un completo set de servicios versátiles, satisfaciendo los requerimientos de las aplicaciones. Asegurar la sustentabilidad a largo plazo de la e-Infraestructura más allá del término del proyecto. Aplicaciones que soporta: EELA-2 soporta una amplia variedad de aplicaciones en el área de la investigación, lamentablemente en lo que respecta a investigación climática existen sólo dos aplicaciones actualmente en funcionamiento, éstas son: 76 https://portal.leadproject.org/gridsphere/gridsphere?cid=purpose 77 https://portal.leadproject.org/gridsphere/gridsphere?cid=lead-grid 131 Capítulo V: Estado del Arte Internacional Global and Regional Climate Simulation78, sus creadores pertenecen a la Universidad de Cantabria, el Servicio Nacional de Meteorología e Hidrológica del Perú y la Universidad de Chile. Nombre Paper: (Climate modelling on the GRID: Experiences in the EU-project EELA) Disponible en http://www.grid.phys.uvic.ca Descripción: Este trabajo es una aplicación grid que consiste en una secuencia de dos modelos climáticos de punta (uno global y otro regional), operable por medio de un portal Web. El objetivo principal de la aplicación es proveer un conjunto de pronósticos basados en predicciones regionales. Este trabajo es aplicable para estudiar el fenómeno de El Niño, ya que simula un año de El Niño con diferentes condiciones forzadas, y analiza la respuesta en precipitaciones sobre los países de Sudamérica sujetos al riesgo de inundaciones. Brazilian Regional Atmospheric Modeling System79, sus creadores pertenecen a la Universidad Federal de Campina Grande, Brasil. Descripción: BRAMS es un modelo desarrollado por INPE, llevado a la grid por SegHidro80, proyecto que fue creado para ayudar en la toma de decisiones para un mejor manejo de los recursos hídricos, pieza de suma importancia en el proyecto dado que en SegHidro los investigadores están geográficamente distribuidos y a veces tienen diferentes horarios para complementar sus experiencias. Esta aplicación es particularmente útil en el Noreste de Brasil, una región semi-árida, donde las irregulares lluvias causan muchos problemas a la población. Nombre del proyecto Climatology studies using BRAMS in a GRID computing enviroment Sitio Web: http://www.cptec.inpe.br/brams/gbrams.shtml 78 CAM-WRF, http://applications.eu-eela.eu/application_details.php?ID=5 79 BRAMS,http://applications.eu-eela.eu/application_details.php?ID=19 80 http://seghidro.lsd.ufcg.edu.br 132 Capítulo V: Estado del Arte Internacional Instituciones participantes BRAMS (Brazilian Regional Atmospheric Modeling System), la organización coordinadora, es producto de la unión de proyectos de ATMET81; IME/USP82; IAG/ USP83 y CPTEC/INPE84, fundado por FINEP85, Brazilian Funding Agency. Su principal objetivo es producir una nueva versión de modelo RAMS86. Descripción CPTEC/INPE está entregando datos de modelos globales para unos diez años de climatología. La climatología regional, por lo tanto, puede obtener un promedio usando un conjunto de pronósticos (ensemble). Llevando BRAMS a la grid, esperan lograr diez años de datos climatológicos para las tres diferentes áreas en que han divido a Brasil (N, NE, SE). Recursos locales (requerimientos de almacenamiento y procesamiento): - Para lograr diez años de integraciones en tres áreas distintas, es necesario una cantidad total de datos en condiciones límites, cercano a 58 Gb. - Cluster con procesador 16 Xeon 3 Ghz. Grid computing: - Además de la máquina descrita arriba, la grid también cuenta con dos GRAY/XD1 cluster con doce procesadores dual-core (Optaron 2.6 GHz). - Como middlewares, tres soluciones fueron estudiadas y elegidas, dependiendo de su usabilidad, para ejecutar simulaciones meteorológicas de meso-escala: Globus, OurGrid y OAR/CIGRI. Cada uno de los grupos de investigación involucrados en este trabajo (LAC/INPE, CPTEC/INPE y II/ UFRGS) brindó un cluster para probar un middleware específico en la grid. Arquitectura de la grid: La interacción entre los meteorólogos y la grid es lograda a través de un portal web, cuyo objetivo es permitir la creación de trabajos y la recuperación de resultados. 81 http://www.atmet.com 82 http://www.ime.usp.br/ 83 http://www.iag.usp.br/ 84 http://www7.cptec.inpe.br 85 http://www.finep.gov.br 86 http://www.atmet.com 133 Capítulo V: Estado del Arte Internacional b) Grids Europeos con aplicaciones climáticas Nombre del proyecto Enabling Grids for E-science (EGEE) Sitio web: http://www.eu-egee.org Instituciones Participantes The European Organization for Nuclear Research La Comisión Europea de Investigación Los proyectos destacados que se encuentran en colaboración directa con EGEE son: - BalticGrid-II - Belief-II - D4Science - DORII - EDGeS - Edutain@Grid - EGI DS - ETICS 2 - EUAsiaGrid - GENESI-DR - GridTalk - Health-e-Child - KnowARC - OGF-Europe - OMII-UK - SEE-GRID-SCI - UK National Grid Service Descripción87 EGEE es un proyecto donde cualquier organización virtual puede ser usuario final o proveedor de infraestructura, aceptando los certificados correspondientes. 87 134 http://project.eu-egee.org/index.php?id=104 Capítulo V: Estado del Arte Internacional Junto a expertos de más de 50 países, EGEE comparte el objetivo común de construir avances sobre la más reciente tecnología en grid y desarrollar un servicio de infraestructura grid, disponible para los científicos la 24 horas del día. El proyecto entrega, a los investigadores en las academias y negocios, acceso para el nivel producción en la infraestructura grid, independiente de su localización geográfica. EGEE también se enfoca en atraer un amplio rango de nuevos usuarios a la grid. El enfoque principal del proyecto es: - Expandir y optimizar la vasta infraestructura grid de Europa, concretamente la de EGEE, por medio de operaciones continuas en la infraestructura, apoyada por comunidades de usuarios, y sumando más recursos computacionales y de datos. - Preparar la migración de la ya existente Grid Europea desde un modelo basado en proyectos hacia una infraestructura sustentable federada, basada en iniciativas de Grid Nacionales para usos multidisciplinarios. Aplicaciones climáticas88 Las aplicaciones de las Ciencia de la Tierra (ES, por si siglas en inglés), están diseminadas en varias organizaciones virtuales. Algunas de las principales son: • Earth Science Research (ESR). • South Eastern Europe GRID (SEEGrid) • Cyber infraestructure for Civil protection – Operative Procedures (Cyclops). • Expanding Geosciences On Demand (EGEODE). Aquí se pueden encontrar muchas aplicaciones que están basadas tanto en la modelación atmosférica como en el transporte de contaminantes en el aire, de largo alcance sobre Europa, El fenómeno del Niño, pronósticos meteorológicos, y el ozono en regiones polares. Recursos Grid89 La infraestructura grid de EGEE consiste en un conjunto de servicios middlewares90 desarrollados, a través de todo el mundo, en una colección de 88 http://technical.eu-egee.org/index.php?id=255 89 http://technical.eu-egee.org/index.php?id=134 90 El Middleware es un software de conectividad que ofrece un conjunto de 135 Capítulo V: Estado del Arte Internacional recursos computacionales y de almacenamiento, además de las estructuras de servicios y de soporte, se dispone tener: - Las infraestructuras de Servicios al Desarrollo91, es una gran infraestructura Grid para múltiples actividades en la ciencia, federando cerca de 250 centros de recursos a lo largo del mundo, entregando aproximadamente unos 40.000 CPUs y muchos Petabytes de almacenamiento. Esta infraestructura es usada de forma diaria por muchos miles de científicos federados en más de 200 Organizaciones Virtuales. Esta es una estructura estable y bien apoyada, utiliza las últimas versiones del middleware gLite. - Los Servicios previos al Desarrollo92, entregan a los usuarios acceso a un servicio grid previo, a fin de testear, evaluar y entregar retroalimentación para cambios y nuevas características para el middleware. Además, previo al desarrollo, extiende una certificación de actividades en el middleware, ayudando a evaluar la puesta en marcha de los procedimientos, la (inter)operabilidad y la funcionalidad básica del software, contra escenarios operacionales que reflejen condiciones reales de trabajo. - El Centro de Redes Operacionales de EGEE93, es el que se encarga de la coordinación operacional entre EGEE y los proveedores de la red (GEANT2/ NRENs). Esto es complementado por la capacitación de infraestructura y la certificación de la plataforma para la experimentación, además del necesario apoyo de estructuras y grupos políticos. Nombre del proyecto Ground European Network for Earth Science Interoperations - Digital Repositories (GENESI-DR) http://www.genesi-dr.eu/ Instituciones Participantes La Comisión Europea (EC) y la Agencia Europea del Espacio (ESA, su sigla en inglés). servicios que hacen posible el funcionamiento de aplicaciones distribuidas sobre plataformas heterogéneas. 91 Traducción para Production Service infrastructure. 92 Traducción para Pre-Production Service (PPS). 93 The EGEE Network Operations Centre (ENOC) 136 Capítulo V: Estado del Arte Internacional Colaboran con proyectos como: - European Commission Joint Research Centre (JRC) - Centre National d>Etudes Spatiales (CNES), Francia - The University of Reading (RUR) - Entre otros. Descripción94 GENESI-DR, tiene como desafío establecer un acceso abierto a un Repositorio digital de las Ciencias de la Tierra para Europa y para los usuarios de la ciencia en el mundo entero. GENESI-DR debería operar, validar y optimizar el acceso integrado, y poner a disposición de los usuarios repositorios de datos digitales para demostrar cómo Europa puede responder de la mejor forma a las necesidades relacionadas a la emergencia climática que se vive a nivel mundial, la cual es una demanda que está muy lejos de ser satisfecha. GENESI-DR ha identificado los siguientes objetivos: - Entregar acceso garantizado, responsable, fácil, efectivo, y operacional a una variedad de recursos de datos, y demostrar cómo el mismo desempeño puede ser extendido para proveer acceso a todo tipo de datos en las Ciencias de la Tierra. - Armonizar las operaciones de datos claves de las Ciencias de la Tierra, limitando y fragmentado la solución. - Demostrar curaciones efectivas y preparar el marco para acercarse a la preservación de los datos de las Ciencias de la Tierra en el largo plazo. - Validar de manera efectiva las aptitudes requeridas para el acceso a los repositorios distribuidos para las nuevas comunidades, incluyendo educación, y calcular los beneficios e impactos. - Integrar nuevos científicos y paradigmas tecnológicos derivados en infraestructuras operacionales, en respuesta a los últimos requerimientos de las Ciencias de la Tierra (CT). GENESI-DR se construye sobre la actual y operativa infraestructura Europea, Observatorio de la Tierra (EO, su sigla en inglés), e involucra centros claves de la CT responsables de la adquisición operacional de datos, de su procesamiento, archivo y distribución. 94 http://www.genesi-dr.eu/ 137 Capítulo V: Estado del Arte Internacional Aplicaciones climáticas95 Algunas de las aplicaciones climáticas que podemos encontrar en este proyecto son: - - - - La cubierta de hielo Ártico más baja de la historia.96 Aspereza y humedad de la Tierra capturado por TerraSAR97. Arena y polvo desde el Desierto de Sahara98. El esplendor sobre las nubes del Océano Pacífico99 Nombre del proyecto EUROGRID http://www.eurogrid.org Instituciones participantes Es un proyecto donde los costos fueron distribuidos entre el proyecto de Investigación y Desarrollo Tecnológico (RTD, su sigla en inglés) y la Comisión Europea. Es parte del Programa de Sociedad de Información Tecnológica (IST, su sigla en inglés). Dentro de los proyectos participantes se encuentran: - Forschungszentrum Jülich, D - Pallas GmbH, D (Proyecto Coordinador) - Parallab - University of Bergen, N - CNRS - IDRIS, F - Warsaw University - ICM, PL - Victoria University of Manchester, UK - Deutscher Wetterdienst, D - GIE EADS CCR, F - CSCS (ETH Zürich), CH 95 http://genesi-dr.terradue.com/news/_images.asp 96 Lowest Arctic ice coverage in history, http://genesi-dr.terradue.com/news/_ images.asp?id=18 97 Earth roughness and humidity captured by TerraSAR, http://genesi-dr.terradue.com/news/_images.asp?id=22 98 Sand and dust from the Sahara Desert, http://genesi-dr.terradue.com/news/_ images.asp?id=16 99 Glory Over Pacific Ocean Clouds, http://genesi-dr.terradue.com/news/_images. asp?id=15 138 Capítulo V: Estado del Arte Internacional Descripción El período en que se llevó a cabo el proyecto, fue entre noviembre de 2000 y enero de 2004. EUROGRID demostró que el uso de grids en las comunidades científicas e industriales seleccionadas, apuntó a los requerimientos de dichas comunidades, y destacó los beneficios del uso de grids. Los objetivos del EUROGRID fueron: - Establecer una red de trabajo grid Europea, liderada por centros de Computación de alto rendimiento (HPC, su sigla en inglés), desde diferentes países de Europa. - Operar y apoyar el software de la infraestructura EUROGRID, el que usó la red de Internet existente y ofreció fluidez y acceso seguro para los usuarios del proyecto. - Desarrollar componentes importantes del software Grid e integrarlos dentro de EUROGRID (transferencia rápida de archivos, agente de recursos, interfaz para un par de aplicaciones y acceso interactivo). - Demostrar códigos de simulación distribuida en diferentes áreas de aplicación (simulaciones biomoleculares, predicción del tiempo, análisis estructural, procesamiento de datos en tiempo real). - Contribuir al desarrollo internacional de la grid y ayudar a las comunicaciones con los proyectos grid líderes a nivel internacional. - Producir los componentes de software EUROGRID. Una vez que el proyecto terminase el software de EUROGRID debía estar disponible como un producto de apoyo. Todos estos objetivos fueron logrados durante el proyecto. Los componentes del software EUROGRID son aprovechados por las comunidades de la computación grid, y por portales específicos de dominio en las áreas científicas de biología, química y meteorología y por computadores agregados a la ingeniería. Aplicaciones que soporta100 La interfaz gráfica que soporta el proyecto permite un control sencillo para echar a andar el modelo LM, en lo que se refiere al dominio del modelo (cualquier parte del globo), tamaño de la malla (usualmente entre 25 a 2 km.), alcance del pronóstico (arriba de 48 horas), datos iniciales y tiempo, y, como salida, los archivos con sus resultados. 100 http://www.eurogrid.org/wp2.html 139 Capítulo V: Estado del Arte Internacional La implementación del modelo de predicción del tiempo fue acompañado por una cuidadosa evaluación de la validez meteorológica del modelo LM en cualquier región del globo, para un rango de tamaño de malla de entre 25 a 2 km. El procedimiento estándar de verificación de los resultados del modelo consiste de una comparación del pronóstico de LM con todas las observaciones disponibles en las regiones. Para este propósito, DWD desarrolló una estación de trabajo basada en aplicaciones meteorológicas interactivas y sistemas de presentación (MAP, su sigla en inglés), los cuales permiten lograr un vistazo general para cualquier región sobre el globo donde estén disponibles observaciones (incluyendo imágenes de satélites) y se encuentre en el campo de pronóstico del LM. MAP requiere una estación de trabajo de tamaño medio para almacenar la gran cantidad de pronósticos y datos de la observación, como también un rápido despliegue de estos datos. El modelo de predicción del tiempo, LM, y su predecesor, GME2LM, fueron instalados en el centro de HPC de CNRS-IDRIS, Universidad de Manchester, y también en el Centro de Investigación Juelich, como en el sistema de HPC del DWD. El LM es codificado en Fortran90 estándar y usa MPI para entregar los mensajes. Esto, en principio, es código sumamente portable. Pero, usualmente hay un número de instalaciones de parámetros dependientes, como el compilado de opciones o las versiones de librería, que tienen que ser adaptadas para optimizar el rendimiento bajo condiciones de tiempo real para el sistema HPC. Para la aplicación en tiempo real del LM, algunos mecanismos son entregados por HPC y EUROGRID para garantizar la su ejecución en la alta prioridad operacional. Esto fue demostrado en un ambiente multi-usuario. La funcionalidad de la interfaz LM, por la definición y lanzamiento del pronóstico LM, fue evaluado por testeadores quienes no tenían experiencia en HPC. Su práctica y sugerencias son la base para más desarrollos de la interfaz LM. Una típica predicción de 48 horas del LM se ejecuta, para cualquier región del globo, tomando no más que dos horas, incluyendo la preparación de los archivos de datos topográficos. Durante todo el proceso del modelo, éste mantiene, a quien lo lleva a cabo, informado acerca del estado actual de la ejecución LM y del tiempo esperado para finalizar la tarea. 140 Capítulo V: Estado del Arte Internacional Nombre del proyecto The DataGrid Project http://eu-datagrid.web.cern.ch Instituciones Participantes Proyecto fundado por la Unión Europea Participan: - European Organization for Nuclear Research (CERN). - Centre National de la Recherche Scientifique (CNRS). - European Space Agency (ESA). - The Nacional Institute of Nuclear Physics (INFN, por su nombre en italiano, Istituto Nazionale di Fisica Nucleare). - Nacional Institute for Subatomic Physics. - Science & Technology Facilities Council. Descripción El objetivo de este proyecto es construir la nueva generación de infraestructura computacional, entregando cálculos intensivos y análisis de base de datos compartidos a gran escala, desde cientos de Terabytes a Petabytes, a través de muchas comunidades científicas distribuidas a nivel mundial. Muchos de los productos (tecnologías, infraestructura, etc.) del proyecto DataGrid serán incluidas en el nuevo proyecto grid de EU – EGEE. 141 Capítulo V: Estado del Arte Internacional c) Grids asiáticas con aplicaciones climáticas Nombre del proyecto EUChinaGRID http://www.euchinagrid.org/index.htm Institución Coordinadora101 El proyecto EUChinaGRID es una iniciativa abierta para contribuir a las organizaciones que estén trabajando en el campo de las grid y donde haya usuarios que empleen o deseen emplear aplicaciones grid dentro de sus trabajos. EUChinaGRID fue co-fundado por la Comisión Europea a través del 6° Programa Marco, las organizaciones actualmente involucradas en el proyecto son: - - - - - - - - - - Beihang University, Beijing (China) CNIC (China) IHEP, Beijing (China) Peking University, Beijing (China) GRnet (Grecia) Consortium GARR (Italia) Department of Biology, Università di Roma3 (Italia) INFN (Italia) Jagiellonian University in Krakow (Polonia) CERN (Suiza) Descripción El proyecto EUChina comenzó el 1ro de Enero de 2006 planificado hasta el 31 de Marzo de 2008, con el objetivo de apoyar las interconexiones de las infraestructuras grids entre Europa y China. El primer objetivo del proyecto fue facilitar la transferencia de datos y procesamiento científico, hacia un primer ejemplo de aplicaciones piloto, donde ya existía una fuerte colaboración entre Europa y China. Estas aplicaciones beneficiaron inmediatamente a la nueva infraestructura, y actuaron como la fuerza motriz para testear y desarrollar una infraestructura grid efectiva entre Europa y China. Durante los 27 meses de duración, el proyecto logró muchos objetivos y creó una red de colaboración entre Europa y China en el área de la computación grid y de las aplicaciones científicas. 101 142 http://www.euchinagrid.org/partners-engl.htm Capítulo V: Estado del Arte Internacional Al final del proyecto, la infraestructura piloto incluyó doce sitios (cinco de los cuales están en China), con todos los servicios grid portados a la red y funcionando. Un hincapié especial fue puesto sobre la designación de una e-Infraestructura que permitiera una completa interoperabilidad entre las europeas y chinas, y una completa conformidad con un ambiente IPv6102. El desempeño de las aplicaciones también logró un impacto significativo en muchos campos de la ciencia. Aplicaciones103 Algunos de los objetivos de este proyecto, en el campo de las aplicaciones, fue la validación de la infraestructura intercontinental, usando las aplicaciones EGEE, y apoyar el traspaso de las nuevas aplicaciones relevantes para la e-Ciencia y la colaboración industrial entre Europa y China. Las principales actividades que se seleccionaron en el cuarto marco de trabajo fueron: - Aplicaciones EGEE - Aplicaciones de Física de Astropartículas. - Aplicaciones de Biología. Por lo tanto, al contar con las aplicaciones EGEE, también contaban con las aplicaciones climáticas desarrolladas en dicho proyecto. Nombre del proyecto EUIndiaGRID http://www.euindiagrid.eu Instituciones participantes104 Italia Metaware SpA Italian National Institute for Nuclear Physics Consortium GARR - the Italian Academic and Research Network Abdus Salam International Centre for Theoretical Physics 102 http://www.euchinagrid.org/IPv6/index.html 103 http://www.euchinagrid.org/work_package.htm 104 http://www.euindiagrid.eu/partner_listing 143 Capítulo V: Estado del Arte Internacional Reino Unido Cambridge University India Indian Tata Institute for Fundamental Research, Mumbai and the National Centre for Biological Indian Education and Research Network - ERNET Department of Physics - University of Pune Saha Institute of Nuclear Physics Calcutta The Centre for Development of Advanced Computing Bangalore Bhabha Atomic Research Centre - Mumbai Variable Energy Cyclotron Centre Descripción EU-IndiaGrid se encuentra creando una red para la comunidad de e-Ciencia entre Europa e India, para desarrollar una infraestructura grid común que apoye el procesamiento de datos en áreas de aplicaciones científicas como: Ciencias de la Tierra y Atmosféricas, Biología, Física de Partículas o Física de Altas Energías, y Ciencia de los Tejidos. Para conseguir esta meta, EU-IndiaGrid apoya la interconectividad entre la infraestructura Grid Europea (EGEE), y la infraestructura Grid India (Garuad India Grid), además de la del Departamento de Grid para la Energía Atómica, entregando una avanzada infraestructura para colaboraciones científicas e industriales a través de Europa e India y movilizando una infraestructura de hardware de aproximadamente 1200 procesadores Core y 50 Terabytes de disco para el beneficio de las aplicaciones EU-India Grid. El proyecto está activamente comprometido en identificar nuevas aplicaciones para la ciencia y los negocios. Este proyecto comenzó el 01 de Octubre de 2006. Objetivos principales - Construir una comunidad de investigación dinámica, académica e industrial, que pudiera beneficiarse del uso de la tecnología grid. - Promover el uso de tecnologías grid avanzadas en aplicaciones piloto en Biología, Ciencias de Altas Energías y Materia, y Ciencias Atmosféricas y de la Tierra. - Promocionar los logros de la tecnología grid europea, EGEE, en India y apalancar estas experiencias y habilidades en la grid india. 144 Capítulo V: Estado del Arte Internacional Aplicaciones climáticas105 El “Monzón”106 de Verano Indio El término “Monzón” significa cambios estacionales en la dirección del viento, causados por la diferencia de temperatura entre la tierra y el océano, lo cual ocurre en muchas partes del mundo pero, principalmente, sobre el subcontinente Indio. El monzón indio es uno de los fenómenos más difíciles de aprender en el mundo, teniendo como obligación mejorar las investigaciones para enfrentar su impacto social y económico. Lo modelos computacionales son la columna vertebral de la predicción e investigación climática, entregando monitoreos mejorados y comprendiendo qué puede ayudar a los meteorólogos a mejorar la predicción evolutiva de este fenómeno atmosférico. Objetivo de la aplicación El Desarrollo de un sistema de modelamiento regional acoplado atmosféricoocéano para predecir el monzón indio durante el verano. Logros - Modelo Climático Regional (RegCM3) y Sistema de Modelamiento Océano Regional (ROMS, su sigla en inglés), ambos aplicables en la Red GARUDA y EGEE Grid, middleware gLite. - Comprobar el concepto con el problema del limitado tamaño. - Un par de sistemas testeados en gLite. Siguientes pasos: Implementar de manera adecuada la gestión de datos, incrementado la cantidad de problemas que pudieran ser resueltos con simulaciones más realistas. Recursos Grid Este proyecto utiliza las infraestructuras grid tanto de EGEE como de GARUDA. 105 http://www.euindiagrid.eu/applications/earth-atmospheric-sciences 106 Viento que sopla en el sureste de Asia. En invierno sopla de la tierra al mar y es seco y frío, mientras que en verano sopla desde el océano a la tierra siendo cálido y húmedo, y trae abundantes lluvias: el monzón ha provocado grandes inundaciones. 145 Capítulo V: Estado del Arte Internacional d) Proyectos Internacionales (Utilización de BOINC) Nombre del proyecto Climateprediction.net Sitio Web: www.climateprediction.net Institución Coordinadora Climateprediction.net Cualquier persona con un ordenador puede aportar a este proyecto. Descripción Este proyecto es una forma de utilizar el “volunteer computing” (computación voluntaria). Los objetivos de Climateprediction.net son producir predicciones del clima de la Tierra pasado el 2080, y testear la precisión de los modelos climáticos. Para lograr estas metas, llaman a los cibernautas a bajar algún modelo climático desde su Web para correrlos en sus computadores personales (durante los tiempos ociosos), los resultados son enviados por medio de Internet a climateprediction. net y el sumario de los mismos puede ser visto en la Web del proyecto. Para lograr lo anterior es necesario bajar el software del proyecto BOINC (Berkeley Open Infrastructure for Network Computing). El cual tiene como intención obtener una capacidad de computación enorme empleando ordenadores personales; este modelo es utilizado en áreas como física, medicina nuclear y climatología. Nombre del proyecto World Community Grid http://www.worldcommunitygrid.org/index.jsp Instituciones “World Community Grid tiene una red de asociados dedicados, donde cada uno aporta su conocimiento y contribución especial. Estos negocios, asociaciones, fundaciones, organismos gubernamentales y universidades, han sido instrumentales en el desarrollo y en la operación del World Community Grid. Ellos también vienen incentivando a sus empleados, miembros, beneficiarios, alumnos 146 Capítulo V: Estado del Arte Internacional y profesores, para contribuir con el tiempo ocioso de sus PCs”107. Al 26 de abril de 2009, se contabilizaban 403 asociados. También cuentan con un consejo asesor integrado por doctores de gran parte de las áreas científicas. Descripción La misión del World Community Grid es crear la red más amplia de computación pública en beneficio de la humanidad. La base de su trabajo es la idea de que la innovación tecnológica combinada con la investigación científica intuitiva y con el voluntariado en gran escala, pueden mejorar nuestro mundo. Sostienen que su éxito depende de individuos que contribuyen colectivamente con su misión, sin fines de lucro, donando el tiempo libre de sus PCs. Investigaciones relacionadas con el clima •AfricanClimate@Home108 Misión: La misión del proyecto AfricanClimate@Home es desarrollar modelos climáticos más precisos de regiones específicas de África. Esto servirá de base para predecir cómo cambiará el clima en el futuro, de modo que sea posible implementar las medidas necesarias para aliviar los efectos adversos del cambio climático. Se utilizará la gran capacidad de computación del World Community Grid para comprender y reducir la incertidumbre con la cual se simulan los procesos climáticos en África. Importancia: El cambio climático global es actualmente uno de los problemas más apremiantes a los que se enfrenta la comunidad mundial. Los impactos negativos del cambio climático global son una gran preocupación en todos los sectores del mundo. Todos coinciden en que el impacto será más intenso en los países subdesarrollados, donde la infraestructura y el acceso a los servicios sociales y de salud, esenciales para aliviar y atender los efectos del cambio climático, son a menudo insuficientes. En este sentido, África, un continente vulnerable a las variaciones climáticas, se enfrenta a retos importantes. Los múltiples efectos del cambio climático en África se demostraron claramente en los años 2000 y 2001, en las graves inundaciones que ocurrieron en Mozambique, que dejaron a más de medio millón de personas sin hogar y provocaron la muerte de otros cientos, o en la sequía que ha afectado 107 http://www.worldcommunitygrid.org/about_us/viewOurPartners.do 108 http://www.worldcommunitygrid.org/projects_showcase/ach/viewAchMain. do?SearchParam=climate 147 Capítulo V: Estado del Arte Internacional al sureste de África los últimos años, que ha contribuido a la escasez generalizada de alimentos. Actualmente, se desconoce con qué frecuencia cambiarán los climas extremos, pero aún así, los problemas sociales que afectan a África en la actualidad podrían agravarse, llegando a una devastación incluso mayor y a la pérdida de vidas humanas. La Fase 1 de este proyecto ha concluido (julio, 2008). Los científicos están analizando los resultados para preparar la Fase 2. Un informe de estado e información detallada sobre este proyecto será publicado en las páginas Web de este sitio y circulado entre los investigadores109. Este proyecto cuenta con su propio foro para preguntas y comentarios110. 109 http://www.csag.uct.ac.za/worldcommunitygrid 110 http://www.worldcommunitygrid.org/forums/wcg/listthreads?forum=281 148 Capítulo V: Estado del Arte Internacional e) Proyectos Internacionales con participación de Chile (Europa y América) Nombre del proyecto South American Emissions, Megacities and Climate (SAEMC), en desarrollo. Dirección Web: http://saemc.cmm.uchile.cl Instituciones Participantes (Principales): Argentina- Comisión Nacional de Energía Atómica (CNEA), Grupo de Monitores Ambiental (GMA), la Unidad de Actividad Química (UAQ). Brasil- Centro de Previsión del Tiempo y Estudios Climáticos (CPTEC), Instituto de Astronomía, Geofísica y Ciencias Atmosféricas de la Universidad de São Paulo. Chile- Centro de Modelamiento Matemático (CMM), Departamento de Ingeniería Mecánica de la Universidad de Chile (DIMEC), Dirección Meteorológica de Chile (DMC), Departamento de Matemáticas y Ciencias de la Computación de la Facultad de Ciencias de la Universidad de Santiago (USACH), Escuela de Ingeniería Ambiental de la Facultad de Ecología y Recursos Naturales de la Universidad Andrés Bello (UNAB). Colombia- Departamento de Ingeniería Civil y Ambiental de la Escuela de Ingeniería de la Universidad de los Andes (UDLA), Universidad Pontificia Bolivariana de Medellín (UPB). EE.UU.- College of Enigneering de la Universidad de California en Riverside UCR. UCR participará a través de su centro de Investigación Ambiental y Tecnológica CE-CERT. Además, la División de Química Atmosférica y el Programa de Estudios Avanzados del National Center for Atmospheric Research NCAR, participarán en la aplicación de modelamiento inverso de CO en superficie, usando modelos 3D de transporte químico, tanto con mediciones in situ, como remotas (del instrumento MOPITT). Perú- Servicio Nacional de Meteorología e Hidrología del Perú (SENAMHI) 149 Capítulo V: Estado del Arte Internacional Descripción: Durante 2004, establecieron, bajo auspicios de IAI, una red multinacional de la investigación que se centraba en la estimación y evaluación de emisiones móviles en las megaciudades de América del Sur (UMESAM, www.cmm.uchile.cl/umesam). Esta red implica a nueve grupos de investigación a partir de seis países. Fue pensado, al inicio, para ser parte de un esfuerzo de consolidación en el desarrollo de las herramientas del sistema de modelamiento terrestre y para proporcionar, más particularmente, una base funcional y validada en la investigación de la química atmosférica y del clima, y el establecimiento de políticas sostenibles a largo plazo. Por lo tanto, ahora les parece lógico que se proponga una actividad realzada en la cual, además del desarrollo de los inventarios de la emisión, adecuados para los estándares de calidad de aire y del clima, proporcione a escala regional, panoramas presentes y futuros del cambio climático, con un énfasis único en la evolución de la calidad del aire en megaciudades de América del Sur, y la puesta en práctica de las herramientas químicas regionales coordinadas del pronóstico meteorológico. Objetivos: • Proporcionar emisiones y panoramas regionales exactos del cambio del clima para Sudamérica, con énfasis sobre los impactos de y sobre megaciudades. • Establecer la base para el pronóstico meteorológico químico operacional para las megaciudades de América del Sur. • Consolidar y ampliar una red activa de investigación y de formación de capacidades locales en las Américas, funcionales para modelar el sistema terrestre. Aplicaciones que soporta o sub-área científica que apoya Uno de los objetivos de este proyecto de colaboración en red, es mostrar que las conexiones inter-países realmente pueden ser utilizadas para el supercómputo (high performance computing), lo cual requiere de amplitud de banda. Algunos ejemplos de esto son: INPE-CPTEC puede mantener las condiciones límite para Sudamérica para que en él los usuarios del proyecto corran pronósticos del tiempo, tiempo químico, usando CCATT-BRAMS u otros modelos. Facilitar un portal que funcione a la demanda, donde científicos puedan montar un modelo que trabaje en la red, entregando el trabajo al cluster y obteniendo los resultados. Pronóstico de Conjunto, el cual requiere bastante poder de cómputo y almacenamiento, para potenciales usuarios ésta es otra aplicación que puede ser usada en red. 150 Capítulo V: Estado del Arte Internacional Una de las aplicaciones grid que este proyecto está desarrollando es “C/CATTBRAMS - Coupled Chemistry Aerosol and Tracer Transport model to BRAMS”111, utiliza las herramientas que proporciona EELA-2. Aplicación en etapa de test. Como su nombre lo dice, esta es una aplicación que utilizando los principios de BRAMS buscar simular el desplazamiento del Material Partículado como Monóxido de Carbono con máxima altura entre 20 a 30 kms. Su objetivo es entregar un portal ejecutable para científicos, donde la aplicación pueda ser utilizada de una forma completamente transparente por el usuario. Recursos locales y grid: CMM aporta con 32 CPU, Itanium2-based cluster. CPTEC, un 24 CPU, x86-64 cluster. Se utiliza un sistema de archivos basado en grid (G-Farm), con una amplitud de banda de 2-4 Mbps que provee RedCLARA. Nombre del proyecto Campus Grid Project. http://www.fzk.de/fzk/idcplg?IdcService=FZK&node=2 450&lang=en Institución Coordinadora Centro de Investigación de Karlsruhe con su Instituto de Computación Cientifica (IWR) Participa: El Grupo de trabajo “Hidrológica y Modelos” (H+M) del centro de Estudios Avanzados en Zonas Áridas. Descripción Este programa se centra en los temas de investigación y desarrollo, para explorar nuevos métodos de grid computing como una herramienta poderosa en el ámbito de las investigaciones de vanguardia. El programa incluye todos los aspectos de grid computing: hardware, middleware y aplicaciones. En todos estos aspectos el trabajo es llevado a cabo en estrecha cooperación internacional, en el marco del espíritu de los proyectos de la Comunidad Europea. 111 http://applications.eu-eela.eu/application_details.php?ID=51 151 Capítulo V: Estado del Arte Internacional Esquematización del IWR-Campus Grid Project112 Aplicaciones, punto de vista CEAZA: El objetivo principal del grupo H+M lo constituye el estudio y modelamiento matemático de las componentes del ciclo hidrológico, bajo el impacto de las oscilaciones climáticas, en las zonas áridas y semi-áridas del norte de Chile. El modelamiento de estos sistemas es altamente complejo y requiere de computadores con gran eficiencia de cálculo. A partir del año 2005 el grupo H+M inicia su acceso al IWR- Campus Grid Project. Hasta la fecha se ha trabajado fundamentalmente en problemas relacionados con la modelación de la componente atmosférica del ciclo hidrológico. En consideración a la topografía compleja del área de estudio, se ha trabajado, en especial, con el modelo atmosférico de mesoescala KAMM, que permite afinar el tamaño del paso espacial hasta 100 m. Gracias a la tecnología del grid computing se ha podido acceder a supercomputadores (p.ej., el computador vectorial NEC SX8 y SX5 del IWR-Campus Grid Project), consiguiendo reducir los tiempos de cálculo al 15% en relación al tiempo requerido por las máquinas locales. 112 152 Esquema facilitado por Melitta Fiebig. Capítulo V: Estado del Arte Internacional Figura 8. Computador vectorial NEC SX8113 Adicionalmente, el año 2007 se llevó a cabo un convenio con el Dr. Frank Schmitz, representante del Instituto de Computación Científica de Karlsruhe (IWR) y la Universidad de La Serena y su rector Dr. Nibaldo Avilés, en el cual se otorga acceso a los recursos computacionales del IWR y del proyecto Campus Grid a proyectos demandantes de alto rendimiento de la Universidad. Recursos grid: Supercomputadores (p.ej., el computador vectorial NEC SX8 y SX5). 113 Imagen entregada por Melitta Fiebig 153 Capítulo V: Estado del Arte Internacional Nombre del proyecto Proyecto ATN/OC-10064-RG BID «Información Climática Aplicada a la Gestión de riesgo agrícola en los países andinos» Disponible en: www.ciifen-int.org/images/stories/file/Proyecto%20BID_CIIFEN.pdf Institución Coordinadora, Instituciones y Países Participantes. Institución Coordinadora: Centro de Investigación Internacional para el Fenómeno del Niño (CIIFEN) Países participantes: Venezuela, Colombia, Meteorológica). Ecuador, Bolivia, Perú y Chile (Dirección Coordinación con otras agencias multilaterales y bilaterales: La operación está alineada con el Programa “Climate Information and Prediction Services” (CLIPS) de la OMM y con el Plan de Acción de Hyogo (2005). Está enmarcada en el mandato otorgado al CIIFEN por la Estrategia Andina para la Prevención y Atención de Desastres, de julio de 2004 y, a nivel operativo, complementa acciones de fortalecimiento institucional del CIIFEN, financiadas por la CAF, y las iniciativas del Banco Mundial y de la Secretaría de la Convención Marco de las Naciones Unidas sobre el Cambio Climático (UNFCCC) en la región. Descripción La operación apoyará al CIIFEN y los SMNs en la implantación de un sistema de información climática aplicada en la región andina para beneficio de las comunidades agrícolas más vulnerables. Este sistema comprende el mejoramiento de la base de datos climatológicos regional, su conexión con modelos de predicción climática y posterior gestión de la información para la aplicación por parte de los usuarios. También se fortalecerá la cooperación regional a través del reforzamiento de los servicios de predicción e información climática, lo cual contribuirá a afianzar la credibilidad de las instituciones especializadas y motivar a los gobiernos y el sector privado a confiar e invertir en los SMNs de la región. El implantar un nuevo horizonte de tiempo en la predicción climática permitirá a los Gobiernos Nacionales y subnacionales trabajar en procesos más ligados a la prevención y la gestión de riesgo que en la respuesta a emergencias, lo que definitivamente refuerza y complementa las prioridades del BID en cuanto al fortalecimiento de los sistemas nacionales de gestión de riesgo emprendidos en la región durante los últimos años. Éste proyecto es parte de la Iniciativa para 154 Capítulo V: Estado del Arte Internacional la Promoción de Bienes Públicos Regionales, aprobada por el Directorio Ejecutivo del BID. Para llevar todo esto a cabo, cada país participante ha elegido una región piloto; e en Chile ésta es la región de Valparaíso. El objetivo de este proyecto es de contribuir en la reducción de los impactos socio económicos derivados de la acción del clima sobre la actividad agrícola en los países de la región andina. En este contexto, esta cooperación técnica busca crear un bien público regional que es la implantación de un sistema de información climática, centrado en las necesidades de los agricultores, que facilite la toma de decisiones y la gestión de riesgo del sector agrícola y, además, la diseminación de la información para beneficio de numerosos agricultores. El Proyecto contempla, a nivel local, el establecimiento de alianzas estratégicas con: • El sector privado • Los medios de comunicación local. • Redes campesinas comunitarias y • La preparación de talleres locales para consolidar las redes de distribución de la información climática. Aplicaciones en Desarrollo Pronóstico climatológico para la Región de Valparaíso Realización del pronóstico Estacional en fase Experimental de Precipitación y Temperatura Extremas para la Región Piloto a escalas de tiempo mensual, bimensual y trimestral. El área piloto seleccionada para la implementación del Proyecto, considera la región de Valparaíso. Mapa de riesgo agroclimático Tomado como base el Pronóstico Estacional en fase Experimental de Precipitación y Temperatura Extremas para la Región Piloto y considerando los factores climáticos de riesgo para los paltos y cítricos, se construirá un mapa de riesgo agroclimático. Recursos locales: Para la Dirección Meteorológica de Chile el proyecto permitió contar con dos nuevos computadores de última generación y una estación de trabajo, incluyendo, además, las licencias de los softwares para cada uno de los equipos adquiridos. El proyecto ha permitido la contratación de dos digitadoras y un consultor agrícola por un período de cinco meses para Chile. 155 Capítulo V: Estado del Arte Internacional Trabajo ejecutado por las dos digitadoras: Para la creación de la Base de Datos Climáticos Regionales, se digitalizó un total de 199 meses de variables agrometeorológicas para la Región de ValparaÍso en los parámetros de temperatura del aire, temperatura a 5cm, temperatura de suelo a 10cm, 20cm, 50cm y 100cm, evaporación y precipitación, visibilidad horizontal, nubosidad y estado de suelo, las que se miden tres veces al día. Trabajo ejecutado por el Consultor Agrícola Asistir al Consultor en Riesgo Agrícola Internacional a establecer una línea de base en el área piloto de Chile, que contenga información de los niveles de pérdidas agrícolas asociadas al clima y al uso y aplicación de información climática, mediante encuestas en el terreno sobre muestras técnicamente diseñadas. 5.3 Visión Futura En las investigaciones climáticas pueden existir muchas dudas y problemáticas sobre cómo compartir y almacenar la gran cantidad de datos producidos, bajo qué infraestructuras montar los modelos climáticos de más altos requerimientos, como, también, los efectos de un futuro cambio climático. Es así como en esta sección hemos querido señalar los puntos de vista de las instituciones líderes en el área de la investigación climatológica, los cuales debieran ser analizados al momento de llevar a cabo cualquier investigación sobre el tema. La Organización Meteorológica Mundial (OMM), en uno de sus boletines114, plantea actividades que debieran ser parte de las investigaciones climáticas, sobre todo en esta época donde el clima está cambiando, en sus conclusiones nos señala: “Se señala como un paso imprescindible crear un sistema de información climática el cual tenga como responsabilidades tomar decisiones acerca de qué cambios están ocurriendo y por qué, como también vislumbrar situaciones inmediatas. Esto se traduce al proceso de cómo las investigaciones básicas aportan sus datos a la investigación aplicada y operativa que a su vez, desarrolla productos y servicios climáticos” (Ver fotografía 2). 114 156 Kevin E. Trenberth. Obra citada. Enero 2008 Capítulo V: Estado del Arte Internacional Usuarios interesados, responsables de la toma de decisiones Evaluaciones Información sobre productos Investigación básica Investigación operativa y aplicada Predicción Atribución Servicios Climáticos Modelización Asimilación Observaciones, datos datos,yyanálisis análisis Figura 9. Esquema del flujo del sistema de información climática115 “Para cumplir de forma satisfactoria los desafíos de la investigación anterior se necesita una financiación adecuada, aunque en teoría se compensa con la obtención de un valioso sistema de información”. La predicción climática como información para la agricultura, silvicultura y pesca Un clima extremo y eventos climáticos tales como una severa sequía, inundación, y temperaturas extremas, a menudo tienen grandes impactos sobre la sostenible actividad agrícola, particularmente en los trópicos y sub-trópicos. La variabilidad climática afecta a cada granjero como a todas las comunidades rurales, y la seguridad de la alimentación mundial116. Es claro que una buena información climática puede ayudar a disminuir los efectos de estos bruscos cambios, logrando que una comunidad rural pueda resguardarse y programarse, sabiendo lo que depara la naturaleza. ¿Hacia qué tipo de investigaciones debería ir la tendencia para evitar estas situaciones? 115 Kevin E. Trenberth. Obra citada. Enero 2008 116 World Climate News OMM. Climate prediction and information for decisiónmaking. Enero de 2009 157 Capítulo V: Estado del Arte Internacional En un Boletín de la OMM se señala: La adaptación imperativa: ¿está preparada la ciencia climática?117 , uno de los puntos que se resalta es la Regionalización de las investigaciones. Regionalización de las investigaciones para la toma de decisiones Cada día las investigaciones climáticas a nivel regional y local toman más importancia, esto es debido a que el clima, el cambio climático y la vulnerabilidad ante el mismo, difieren de una región a otra, por ello, contar con información fiable regional y localmente, ayudará a disminuir la incertidumbre de cara a futuras proyecciones. De esta forma, las decisiones de adaptación al cambio climático podrán ser más eficaces. Por lo tanto, el mantenimiento y mejora de los sistemas de vigilancia climática serán actividades esenciales para apoyar a las ciencias climáticas, lo cual, obteniendo las infraestructuras adecuadas, servirá para un intercambio de información y datos climáticos a nivel internacional, y una creación contínua de capacidad en la comunidad de investigación climática en todas las naciones. El futuro tiene como dirección desarrollar y compartir la ciencia climática con todas las partes interesadas y con los responsables de adoptar decisiones. En un boletín de la OMM, específico sobre la regionalización de la información, podemos encontrar temas como: En el contexto del cambio climático, las principales herramientas que se disponen son los modelos de circulación acoplada atmósfera-océano (MCGAO). Lamentablemente, y a pesar de las plataformas informáticas cada vez más potentes los MCGAO más utilizados siguen teniendo resoluciones horizontales de unos 100300 km, las cuales no se ajustan a las escalas finas como las que se requieren para los estudios de evaluación de impactos del cambio climático. Las infraestructuras en el futuro En el campo de la e-Infraestructura (grid) y su aporte a la comunidad científica, uno de los integrantes del proyecto South American Emissions, Megacities and Climate (SAEMC) señala: “En un futuro, la comunidad meteorológica y sus sub-ramas, tendrán acceso a recursos computacionales capaces de echar a andar modelos para clima y tiempo, almacenar/recuperar datos meteorológicos, gracias a la computación grid. Esto será logrado por medio de una interfaz Web donde estarán las aplicaciones climáticas y será de sencillo uso, mejorando los vínculos entre los investigadores 117 158 Xuebin Zhang, Francis W. Zwiers y Thomas C. Peterson Capítulo V: Estado del Arte Internacional y las comunidades de modelos operacionales, y fomentando nueva colaboración entre las comunidades de clima y tiempo118”. Uno de los proyectos norteamericanos más grandes en lo referente a infraestructura grid en el área de “Ciencias de la Tierra” es Earth System Grid, (fundado por el Departamento de Energía de EE.UU.), en este proyecto encontramos una de las grandes bases de datos y metadatos en esta área. Este proyecto apunta y señala que: “Los actuales modelos climáticos son ejecutados en supercomputadores dentro de los EE.UU., y producen terabytes de datos los cuales son guardados en almacenamientos de archivos locales. Los análisis de esos datos contribuyen para la compresión de nuestro planeta, cómo hemos influenciado el cambio climático, y cómo los políticos reaccionan y responden con la información científica que nosotros, como una comunidad global, producimos. El futuro tiende, en lo referente al modelamiento climático, sólo a incrementar los requerimientos computacionales y de almacenamiento. Los avances científicos requerirán un masivo incremento en capacidades computacionales, como también, el incremento en el volumen y distribución de los datos de los modelos climáticos. Veremos incrementos en la resolución física de los modelos, una elevación del número de conjunto de pronósticos corriendo, aumentada “calidad”, en términos de nubes, aerosoles, ciclos biogeoquímicos, y otros parámetros, y una amplitud de alcance global que se extenderá dentro de la región más alta de la atmósfera. Si nos proyectamos al futuro, es claro que nuestras actividades del sistema de modelación global de la Tierra producirán petabytes (1 petabyte = 1024 terabytes) de datos que serán cada vez más complejos y distribuidos, debido a la naturaleza de nuestros recursos computacionales. “La comunidad de modelación climática ha estado creando organizaciones o proyectos específicos de archivos de datos por un tiempo. Sin embargo, mientras estos archivos ayudan a posibilitar el trabajo de grupos bien definidos y específicos, ellos limitan el acceso a la comunidad, a la larga, y prohíben el análisis y comparación a través de los archivos. Con la actual infraestructura, el análisis de estos grandes y distribuidos conjuntos de datos, los cuales son reducidos para un sistema de almacenamiento separado en centros distribuidos geográficamente, se convertiría en una tarea de enormes proporciones. El objetivo de ESG es mejorar drásticamente esta situación. Surgimos en el desarrollo de la tecnología grid, podemos romper con estas barreras artificiales, creando un entorno de acceso a datos que englobe múltiples dominios, abarcando fronteras organizacionales con el objetivo de entregar un acceso sin límites de diversos datos de la modelación climática para el uso de los usuarios119”. 118 Eugenio Sper De Almeida 119 The Earth System Grid: Supporting the Next Generation of Climate Modeling Research 159 Capítulo VI: Estado del Arte Nacional 6 Capítulo VI: Estado del Arte Nacional Si bien es cierto es muy difícil limitar hasta qué punto llegan las investigaciones climáticas de otras ciencias, es así como muchos proyectos y publicaciones pueden, al mismo tiempo, abarcar temas tanto de ingeniería, astronomía y climatología. A pesar de esta dificultad, se ha querido destacar los centros de investigación que realizan su aporte a la investigación del clima, ya sea recolectando datos y análisis o creando modelos climatológicos. A continuación se ofrece una breve descripción de los principales centros de investigación, considerando sus objetivos, misión y, en algunos casos, proyectos destacados en el área de clima. 6.1 Instituciones y/o grupos de investigación a nivel nacional Dirección Meteorológica de Chile (DMC) http://www.meteochile.cl Descripción: La Dirección Meteorológica de Chile, dependiente de la Dirección General de Aeronáutica Civil, es el organismo responsable del quehacer meteorológico en el país; su propósito es satisfacer las necesidades de información y previsión meteorológica de todas las actividades nacionales. Misión: Proporcionar pronósticos, avisos e información de tiempo y clima para fines aeronáuticos y de otras actividades; realizar estudios e investigación en todas sus 161 Capítulo VI: Estado del Arte Nacional aplicaciones; administrar y preservar toda la información meteorológica nacional; con el objetivo de mitigar daños por fenómenos atmosféricos, contribuyendo a proteger las personas, sus bienes y aportar al desarrollo socio-económico del país, en un marco de eficiencia, eficacia y de acuerdo a estándares de calidad. Funciones específicas: •Suministrar información y previsión meteorológica destinada a dar servicio a la aeronáutica y a las actividades productivas y de planificación nacional. •Realizar actividades de investigación, conducentes al desarrollo y aprovechamiento de la meteorología en todos los campos de la actividad nacional. •Participar, conjuntamente con organismos de gobierno, en el estudio de las aplicaciones de la meteorología en los distintos ámbitos del quehacer nacional. •Establecer y mantener relación con organismos meteorológicos de otros países e instituciones científicas internacionales, con el fin de optimizar la gestión y proyección de la Dirección Meteorológica de Chile en el exterior. •Supervisar técnicamente los Centros Meteorológicos Regionales. •Administrar el Banco Nacional de Datos Meteorológicos. Proyectos destacados en los que actualmente participa: • South American Emissions, Megacities and Climate (SAEMC)120. • Proyecto ATN/OC-10064-RG BID "Información Climática Aplicada a la Gestión de riesgo agrícola en los países andinos121”. •Proyecto ACT-19122 . Proyectos de adquisición de infraestructura: Mejoramiento de la Capacidad de Modelación Numérica de la DMC Entre sus objetivos están: - Simular numéricamente el océano y la atmósfera, utilizando varios modelos para llegar a un pronóstico de conjunto (ensemble). - Adquisición de un equipo de alto rendimiento computacional (HPC, su sigla en inglés). 120 http://saemc.cmm.uchile.cl/ 121 www.ciifen-int.org/images/stories/file/Proyecto%20BID_CIIFEN.pdf 122 http://www.dgf.uchile.cl/ACT19 162 Capítulo VI: Estado del Arte Nacional - Creación de un centro de modelación atmosférica, se abrirán diez puestos de trabajo a tiempo completo. - Talleres de Capacitación. Renovación de la Red Integrada Satelital - Actualizar el sistema de recepción satelital, nuevas instalaciones en la DMC, Antofagasta, Puerto Montt, Punta Arenas, Antártica e Isla de Pascua. - Instalación, en Punta Arenas y Santiago, de receptores de sensor móvil de tierra y agua, permitiendo obtener datos de alta resolución con los cuales se pueden abordar problemas de contaminación (océano o atmósfera). - Talleres de Capacitación. Adquisición de Instrumentos Perfiladores para la cuenca de Santiago - Adquisición de un equipo LIDAR (Light Detection and Ranging); este tipo de equipamiento puede ser fijo o utilizados en campañas. - Aparato perfilador de tiempo y temperatura. - Talleres de Capacitación. Centro de Estudios Avanzados en Zonas Áridas y Universidad de La Serena CEAZA y ULS, http://www.ceaza.cl y http://www.userena.cl/ investigacion, respectivamente. Descripción: La Universidad de La Serena y el CEAZA trabajan en estrecha colaboración, tanto en lo que se refiere a los recursos humanos, como en materia de infraestructura y equipamiento, especialmente en la temática de la investigación del clima. CEAZA junto a ULS son una Unidad de Desarrollo Científico y Tecnológico Regional, es decir, un verdadero consorcio de investigación en el que confluyen las capacidades científicas y las voluntades de los sectores público y privado. Su fundación, en el año 2003, se gestó gracias a un proyecto conjunto de la Universidad de La Serena, la Universidad Católica del Norte (sede Coquimbo) y el Instituto de Investigaciones Agropecuarias, INIA-INTIHUASI. Estas instituciones establecieron el CEAZA, gracias al financiamiento otorgado por CONICYT y el Gobierno Regional de Coquimbo. El Centro se ha constituido con 38 investigadores, diez de los cuales son profesionales contratados especialmente para el proyecto a jornada completa. 163 Capítulo VI: Estado del Arte Nacional Misión y objetivos123: “La institución intenta comprender los procesos oceanográficos, atmosféricos e hidrológicos asociados al Cambio Climático Global (CGC) y a El Niño-Oscilación del Sur (ENOS), sus efectos sobre los sistemas bióticos naturales o bajo cultivo. A su vez, busca aportar soluciones a los desafíos que imponen estos fenómenos, desarrollando ciencia y tecnología regional, aunando las voluntades del sector público y privado. “Su misión es contribuir a la comprensión de los efectos de las oscilaciones climáticas/oceanográficas sobre el ciclo hidrológico y la productividad biológica (natural y bajo cultivo) en las zonas áridas y marinas del centro-norte de Chile”. Áreas de Impacto de CEAZA: Posee cinco áreas en las cuales centra sus proyectos, éstas son: - Agricultura y Clima. - Acuicultura y Oceanografía. - Biología Marina. - Biología Terrestre. - Hidrología y Modelos. “El área de impacto de los proyectos de investigación desarrollados por el CEAZA se distribuyen de acuerdo a las prioridades estratégicas de la región. En términos de los montos de los proyectos adjudicados durante el periodo 20032008, el área con mayor impacto ha sido la Ambiental (44,9%). Esta área incluye un importante número de proyectos en las temáticas hidrológicas, oceanográficas, climáticas, ecológicas y de conservación de la biodiversidad. Con un 43,9%, le siguen en importancia dos áreas de impacto productivo (i.e., acuícola= 22,7% y agrícola=21,2%)”124. Infraestructura: “En el área del clima es importante destacar la infraestructura en monitoreo de variables ambientales que el Centro ha generado en la Región de Coquimbo. “El CEAZA mantiene y administra una red de estaciones meteorológicas instaladas en el Valle del Elqui y el Valle del Huasco, lo que le permite generar una base de datos e información on-line importante de aspectos climáticos y agrometeorológicos. Esta red se extendió hacia la cuenca del Choapa y en la alta 123 Memorias 2008 de CEAZA, disponible en http://www.ceaza.cl/images/ docs/memoria_ceaza_2008.pdf 124 164 Memorias 2008 de CEAZA, obra citada. Capítulo VI: Estado del Arte Nacional montaña (CEAZA CRIO). Además se integró la red SIAR con cobertura en el Valle del Limarí con el apoyo de INIA- INTIHUASI, la Asociación de Canalistas del Canal Palqui Maurat Semita, Junta de Vigilancia del Río Grande y Limarí y sus Afluentes, Asociación de Canalistas del Canal Camarico. “Junto a ello cabe destacar la implementación de la Red CEAZA-MAR la cual está operativa desde el inicio del año 2009”125. Colaboración Internacional en el área clima: El CEAZA posee vínculos con el Instituto de Meteorología y Climatología (IMK) del Centro de Investigación de Karlsruhe (FZK), Alemania. Junto a dicha institución, ha logrado: - Tres proyectos de investigación, centrados en la Región de Coquimbo (financiamiento del Ministerio Federal Alemán de Ciencia y Tecnología, BMBF). - Seis publicaciones ISI conjuntas; una publicación ISI enviada, el Dr. Norbert Kalthoff, jefe del grupo de trabajo “Meteorología y Climatología de la Troposfera Baja”, estableció un documento de compromiso de colaboración con el CEAZA, que compromete participación en campañas de mediciones meteorológicas con equipos de última generación del IMK. Con el Instituto de Computación Científica (IWR), del Centro de Investigación de Karlsruhe (FZK), se trabaja en conjunto desde 2004 hasta la fecha y, hasta ahora, los resultados de dicha colaboración han sido: - Una publicación ISI conjunta. - La integración del CEAZA como usuario del Campus Grid: Trabajando teleconectados en las supercomputadoras del IWR. Con el Centro de Investigación del Medio Ambiente de Leipzig, Alemania (UFZ), desde 2003 a la fecha, los logros son: - Postulación conjunta a proyectos. - Dos publicaciones ISI conjuntas. Proyectos destacados en clima126: Manejo de la Red Meteorológica CEAZA-MET. “Se trata de una Red de 8 estaciones meteorológicas dispuestas por todo 125 Memorias 2008 de CEAZA, obra citada. 126 http://www.ceaza.cl/index.php?option=com_content&task=view&id=381&I temid=84 165 Capítulo VI: Estado del Arte Nacional el Valle de Elqui con el fin de medir variables climáticas como temperatura, humedad relativa, radiación solar, velocidad y dirección del viento, precipitación y temperatura del suelo en dos profundidades (10 y 20 cm). “La información se encuentra en línea y los usuarios la pueden obtener en forma gratuita, diariamente en www.ceaza.cl. “Los datos proporcionados por la Red facilitan la toma de decisiones en el manejo agrícola y la optimización del sistema productivo del sector. Además, genera antecedentes para distintos proyectos de investigación”127. Más información: http://www.ceazamet.cl. Análisis de riesgos ambientales derivados de la contaminación por mercurio en el distrito minero de Almadén y estudio de alternativas de remediación de sus suelos. Stratosphere - Troposphere Exchange processes and their impact on the ozone balance in the subtropics of the Southern Hemisphere: A multi-scale integrated study based at Cerro Tololo (30ºS, 70ºW, 2200 m.a.s.l). Proyecto realizado en conjunto con la Universidad de Chile y la Dirección Meteorológica de Chile. “Los procesos de intercambio entre la estratosfera y la troposfera constituyen factores clave para el estudio del balance de gases traza de importancia radiativa y química. Estos procesos de intercambio también están relacionados con temas de interés práctico para el pronóstico operacional del clima y prevención de desastres provocados por eventos de precipitación catastrófica, especialmente en una zona de topografía compleja como lo es la Región de Coquimbo. “Este proyecto de investigación está orientado al estudio del intercambio de ozono a través de la tropopausa sobre la estación monitora de cambio global en Cerro Tololo (30ºS, 70ºW, 2220 m.s.n.m). Medidas continuas de ozono y variables meteorológicas en la superficie han sido realizadas desde 1996 con el auspicio de la Organización Mundial de Meteorología (WMO) y la Dirección Meteorológica de Chile en cooperación con el Interamerican Southern Astronomical Observatory. La estación regional localizada en el cerro Tololo integra la red de estudio de tendencias de cambio climático del programa de Global Atmospheric Watch (GAW) de la WMO. 127 http://www.ceaza.cl/index.php?option=com_content&task=category§i onid=12&id=97&Itemid=84 166 Capítulo VI: Estado del Arte Nacional “El objetivo del estudio lo constituye la identificación de los mecanismos responsables de la variación de las concentraciones de ozono medidas en Cerro Tololo. Este estudio considera, por una parte, la aplicación de modelos atmosféricos de diferentes escalas y, por otra parte, la medición de perfiles verticales de ozono (ozonosondas) y variables meteorológicas”128. Institutional adaptations to climate change. Proyecto elaborado en conjunto con la Universidad de Regina, Canadá. “El objetivo del proyecto es desarrollar una comprensión sistemática e integral de la capacidad de las instituciones regionales para formular y desarrollar estrategias de adaptación a los riesgos y a los impactos pronosticados del cambio climático en lo referente al suministro y manejo del agua en ambientes de zonas áridas. “Este objetivo se aborda a través de un estudio comparativo de dos regiones en diversas etapas de vulnerabilidad social y ambiental: la cuenca del río Saskatchewan Sur (SSRB) en Canadá Occidental y la cuenca del río Elqui (ERB) en el Norte Chico de Chile. “El clima actual del semiárido de la ERB constituye un análogo espacial del clima futuro de la SSRB según pronósticos de modelos de clima global”129. “Ambas regiones tienen un clima seco contiguo a un sistema importante de montañas y paisajes en riesgo de desertización, así como una economía agrícola dependiente del agua de riego que se deriva de la nieve y de los glaciares de las montañas. Como resultado de condiciones más secas y de una creciente incertidumbre climática, ambas regiones se verán afectadas de manera similar por el cambio climático. “En este proyecto también se elaboran escenarios de impacto local del cambio climático, usando técnicas de downscaling estadístico, para obtener información climatológica regional futura, a partir de los modelos de circulación global (GCM)”130. Energy and water balance studies in the arid area of La Serena (Balance Hidrológico y de Energía en la Zona Árida de La Serena). Proyecto realizado junto al Centro de Investigación de Karlsruhe, Alemania. 128 Información proporcionada por Melitta Fiebig. 129 http://www.ceaza.cl/index.php?option=com_content&task=category§i onid=16&id=79&Itemid=84 130 Información proporcionada por Melitta Fiebig. 167 Capítulo VI: Estado del Arte Nacional “Bajo la perspectiva del impacto local del cambio climático global, este proyecto contribuye al conocimiento del estado actual del clima en el valle del Elqui. “Este valle se encuentra ubicado en el Norte Chico a 30°S de latitud Sur, en una zona de transición de clima árido a semi árido. “Esta región se caracteriza por su topografía compleja y grandes diferencias en las propiedades de las superficies del suelo, debido al hecho que en el fondo del valle se extienden áreas irrigadas e intensamente cultivadas y en los demás sectores existe solo una vegetación muy pobre. “En este proyecto se investiga el balance de energía en algunos sectores del valle de Elqui, con el objetivo de comparar la evapo-transpiración real de las zonas cultivadas con aquella de zonas con vegetación natural; además se estima la deposición del rocío, que resulta ser una importante fuente de agua en zonas áridas. Se estudia también la influencia del embalse Puclaro sobre el clima local. “Se trabaja con monitoreo continuo en terreno, campañas intensivas de radiosondeos y modelación físico-matemática en una poderosa red computacional”131. FONDECYT 2008-2007: Impact of large scale disturbances in the upwelling system off northern Chile (near 30º S). “El presente proyecto propone un estudio exhaustivo del sistema de surgencia de Coquimbo (30 ° S). Se postula que las grandes oscilaciones costeras atrapadas - principalmente intraestacionales - modulan el sistema de surgencia costera frente a Coquimbo. Esta modulación se manifiesta de dos maneras. En primer lugar, el efecto directo de las olas sobre la termoclina profundidad (oxycline y nutricline) modifica las características de las aguas de la surgencia. En segundo lugar, estas oscilaciones tienen una enorme influencia en las corrientes sobre la plataforma continental, condicionando el destino final de las aguas de la surgencia. Esta hipótesis se pondrá a prueba directamente en el océano y en las mediciones la temperatura actual de las mediciones de la plataforma continental y en las bahías adyacentes y los datos complementarios del viento, las costas del nivel del mar, e imágenes de satélite de temperatura superficial del mar y clorofila. Esta hipótesis se pondrá a prueba directamente en el mar. Se efectuaran mediciones de temperatura 131 http://www.ceaza.cl/index.php?option=com_content&task=category§i onid=16&id=77&Itemid=84 168 Capítulo VI: Estado del Arte Nacional de la plataforma continental y en las bahías adyacentes y se tomarán datos complementarios de viento, de niveles del mar en la costa, e imágenes de satélite de temperatura superficial del mar y clorofila. Estas observaciones serán analizadas desde la perspectiva de la teoría de surgencia, de olas costeras, y contrastadas con los resultados del modelo océano-costero”132. Climatic regionalization and physical modeling of the cryosphere over Chile’s Norte Chico Region133. Bajo las condiciones semiáridas de la región del Norte Chico en Chile (27°S-33°S) , los recursos hídricos y energéticos son centrales para el desarrollo sostenido. En esta región Andina, el recurso hídrico es fuertemente dependiente de las extensiones de nieve y hielo. Durante el siglo, un desprendimiento de la “criosfera”134 fue observado como un indicador del cambio climático en el área. Sin embargo, el déficit de observaciones continuas en las altas altitudes ha limitado nuestra habilidad para comprender el origen físico de este desprendimiento. Esto es particularmente cierto en la escala regional, donde la carencia de observaciones dificulta el modelamiento físico de la acumulación, y al proceso de ablación, que son requeridos para crear escenarios precisos de la evolución de la criosfera. Las posibilidades de la modelación del proceso de ablación en una escala regional están fuertemente vinculadas con la resolución y limitaciones de los modelos climáticos, además del re-análisis. Un modelo de ablación físico está basado en la computación del balance de la energía de la superficie y requiere información meteorológica en una resolución comparable con el tamaño de los objetos estudiados (campos de nieve y glaciares). En el pasado y futuro de los estudios climáticos, la resolución de Modelos de Circulación Global (GCM, su sigla en inglés), re-análisis (pronóstico de conjunto) y Modelos de Circulación Regional (RCM), es aún demasiado extenso para el estudio detallado de la criosfera en las áreas montañosas, y en un paso más lejano, en la regionalización, es una necesidad. Este proyecto producirá información climática en una resolución requerida para introducir en un sofisticado modelo de nieve/hielo, la cual sucesivamente será usada para simular y predecir la variabilidad de la extensión de nieve y hielo en la región del Norte Chico dentro del periodo 1950-2100. Dos herramientas serán aplicadas para obtener campos meteorológicos detallados desde modelos de escala más extensos. Primero, un modelo físico que 132 http://www.ceaza.cl/index.php?option=com_content&task=category§i onid=13&id=309&Itemid=84 133 Información proporcionada por Melitta Fiebig. 134 Porción de la superficie de la tierra donde el agua esta en forma solida. 169 Capítulo VI: Estado del Arte Nacional obtenga una escala regional, éste será aplicado para capturar la naturaleza de la región con respecto a su elevado terreno bajo la influencia de las precipitaciones. Segundo, una herramienta para el modelo que obtendrá una escala regional será desarrollada para interpolar los incidentes de cambios de estado de la energía. Los resultados del modelo serán validados por comparaciones con mediciones meteorológicas de la superficie, con salidas de simulaciones RCM y con datos satelitales. Estas herramientas usarán datos re-analizados (1950 a 2005) y la salida de datos de simulaciones GCM (hasta 2100), a fin de producir una resolución (500m) de la base de datos climática sobre el periodo 1950-2100. A objeto de obtener una base de datos para un control de calidad, las herramientas serán introducidas con la base de datos del clima regional de la Universidad de Chile, que fue procesada con WRF para el período 1960-1990 y para 2060-2100. Una vez que la información del clima en alta resolución ha sido generada, ellos serán usados para manejar el avanzado modelo de cambio de nieve/hielo CROCUS (Meteo-Francia). La calidad de las simulaciones de la acumulación de nieve y ablación será verificada sobre los últimos 50 años, con un equilibrio de masa de datos desde el Glaciar Echaurren del Norte (Dirección General de Agua, Chile), mediciones de acumulación de nieve y el cumplimiento con altas medidas de altitud. Los procesos de ablación serán estudiados y el impacto de las precipitaciones y variaciones de temperatura sobre la nieve y evolución del hielo, serán destacados. Los escenarios de la evolución del clima en la mesoescala permitirán verificar que la precipitación decrecerá en el área durante el siglo 21, como han sugerido otros estudios basados en simulaciones GCM. Finalmente, el impacto de las variaciones climáticas sobre las extensiones de nieve y hielo serán calculados. Este conocimiento será crucial para el modelamiento del ciclo hidrológico y para una evaluación del futuro de las variaciones de los recursos hídricos en esta área. 170 Capítulo VI: Estado del Arte Nacional Centro de Estudios Científicos http://www.cecs.cl Descripción: Una de las áreas de estudio es “Glaciología y Cambio Climático”, donde se analizan las variaciones de los glaciares y las dinámicas del flujo del hielo y su relación con los cambios climáticos. Las zonas de estudio comprenden los Andes de Chile Central, la Región de Los Lagos, los Campos de Hielo Patagónico Norte y Sur, la Península Antártica y el sector Occidental del casquete Antártico (WAIS). Sus métodos incluyen mediciones y monitoreos sistemáticos de la superficie de los glaciares en terreno (sistemas GPS, radio eco-sondaje, balance de masa y energía), exploraciones aéreas y prospección con sensores activos (GPS, radar, altimetría láser) y análisis digital de imágenes satelitales (espectro visible, infrarrojo y radar). Proyectos destacados: •Expedición Científica al Lago Ellsworth-Antártica, 2006. •Exploración aérea de los glaciares del Mar de Amundsen y la Península Antártica. •Interacciones entre volcanes y glaciares de la Región de Los Lagos. •Estudio de testigos de hielo someros en los Andes de Chile Central y Patagonia. •Desarrollo de métodos geofísicos y geodésicos para el estudio de los glaciares. FONDECYT 2008-2006: •Past climate changes in Patagonia obtained from three high-altitude ice cores (Incentivo a la cooperación internacional). •Past climate changes in Patagonia obtained from three high-altitude ice cores. 171 Capítulo VI: Estado del Arte Nacional Departamento de Geofísica de la Universidad de Chile http://www.dgf.uchile.cl Descripción: El Departamento de Geofísica de la Facultad de Ciencias Físicas y Matemáticas, de la Universidad de Chile, realiza investigación avanzada y docencia de Pregrado y Postgrado en Ciencias Atmosféricas, a través de su Grupo de Meteorología. El Grupo de Meteorología realiza, también, labores de extensión y divulgación científica, así como consultorías especializadas y de relevancia nacional. Con una tradición de 40 años, el Grupo de Meteorología está formado por siete académicos de jornada completa, de los cuales seis tienen una formación a nivel de doctorado, y uno se encuentra en proceso de obtenerla en el MIT. El grupo cuenta, además, con dos profesores de jornada parcial, y un número comparable de asistentes de investigación y estudiantes de Postgrado. A través de su trayectoria, el grupo ha sido pionero en la introducción de herramientas modernas de observación y análisis de información atmosférica en el medio nacional. En la década de los sesenta, introdujo el uso de imágenes captadas desde plataformas espaciales; en la última década ha aplicado y difundido metodologías de pronóstico climático, y, en los últimos años, ha fomentado la aplicación de modelos numéricos de la atmósfera. En concordancia con el buen nivel alcanzado, el Grupo de Meteorología participa activamente en programas internacionales de investigación cuyas temáticas tienen un impacto en la región. Áreas de Investigación: La investigación que se realiza en el Grupo de Meteorología se ha orientado tradicionalmente a la comprensión de fenómenos atmosféricos en Chile, América del Sur y los océanos adyacentes. Esta investigación comprende tres áreas principales: meteorología sinóptica y de mesoescala, climatología dinámica y procesos radiativos. El área de meteorología sinóptica y de mesoescala involucra el análisis observacional, teórico y numérico de fenómenos asociados a los cambios de tiempo atmosférico, incluyendo sistemas frontales, depresiones costeras, convección sobre el Altiplano y circulaciones locales forzadas por la cordillera de Los Andes. El desarrollo de estas dos áreas se ha visto fuertemente incrementado por la posibilidad de realizar simulaciones numéricas de la atmósfera con creciente fidelidad y rapidez, y la disponibilidad de sistemas de observación de resolución local y cobertura global. Los procesos físicos responsables de la mantención de las condiciones medias de la atmósfera en la región Sud Americana, así como sus variaciones de largo plazo 172 Capítulo VI: Estado del Arte Nacional (meses, años, décadas y tendencias seculares), son el objeto de estudio en el área de climatología dinámica. Sustanciales aportes se han realizado, por ejemplo, en la comprensión de la extrema aridez del desierto de Atacama, el origen y variabilidad de la precipitación altiplánica, el diagnóstico y predictibilidad de las variaciones interanuales de las precipitaciones en la zona central y sur de Chile, y la detección de tendencias y saltos climáticos en el cono sur de América durante el siglo XX. Recursos e infraestructura: El Departamento de Geofísica cuenta con una biblioteca especializada y actualizada en Ciencias Atmosféricas, adecuada para las necesidades de investigación y docencia, y una masiva base de datos atmosféricos y oceánicos en formato digital. Adicionalmente, una moderna red de estaciones de trabajo y computadores de multiproceso, programas especializados de computación científica y equipos de soporte informático, permiten desarrollar actividades de investigación y docencia computacionalmente complejas, como modelamiento numérico, visualización científica, y manejo de grandes bases de datos. El grupo cuenta, además, con acceso a información meteorológica en tiempo real mediante recepción directa de imágenes satelitales de alta resolución y conexión a Internet por medio de fibra óptica. Sistemas de observación meteorológica en superficie (estaciones automáticas, equipo de medición de balance de energía) y altura (equipo para radiosondeos cautivos y libres), instrumentos de calibración y una vasta experiencia en su uso, están disponibles para la docencia y los trabajos de investigación que requieren mediciones en terreno. FONDECYT 2008-2005: •Extratropical source of interannual rainfall variability in Chile. •Field Study of armospheric dust devils in the northern Chile. •Intraseasonal rainfall variability in south-central Chile (35º-45ºS). •Modeled and Empirical regional paleoclimate variability in western Patagonia: Glacial versus interglacial conditions. 173 Capítulo VI: Estado del Arte Nacional Centro de Modelamiento Matemático,CMM (Área Medio Ambiente), Universidad de Chile www.cmm.uchile.cl Misión y visión: La misión del CMM es crear nuevas matemáticas y usarlas para resolver problemas de otras ciencias, la industria y las políticas públicas. Su finalidad es desarrollar ciencia con los más altos estándares, los que guían asimismo sus actividades en investigación industrial y educación. Visualizamos al CMM como un centro de excelencia de clase mundial en investigación y formación avanzada en matemáticas aplicadas, reconocido internacionalmente como una plataforma para el modelamiento matemático industrial con alto impacto en innovación. Proyectos: • El CMM es una de las principales entidades que participan en el proyecto SAEMC. Centro de Investigación Oceanográfica en el Pacifico Sur-Oriental COPAS http://copas.udec.cl/ Descripción: “Su objetivo es comprender la variabilidad climática y oceanográfica presente y pasada en la región, sus impactos sobre los ecosistemas y la productividad regional. Esta investigación se realiza en forma multi e interdisciplinaria. Abarca diversas escalas espaciales y temporales. Se basa en observaciones directas, análisis retrospectivos, trabajo experimental, y enfoques de modelamiento, y se lleva a cabo a través de seis programas de investigación”. Entidades participantes: Universidad de Concepción y Universidad Austral de Chile (asociada). Temas de Investigación: • Variabilidad oceanográfica tropical y subtropical a gran escala (El Niño Oscilación del Sur ENSO, decadal/interdecadal) y su interacción con procesos oceanográficos locales (surgencia, estructuras de mesoescala): consecuencias en la biogeoquímica, circulación y ecología presente y pasada del Pacífico Sur-Oriental. • Estructura, funcionamiento y dinámica de la Zona de Mínimo Oxígeno 174 Capítulo VI: Estado del Arte Nacional OMZ en el Pacífico Sur-Oriental: su rol en el sistema climático y los efectos del cambio climático global sobre ella. • Oceanografía del sur de Chile, incluyendo el sistema de fiordos y canales: circulación, masas de agua, Deriva del Oeste, variabilidad presente y pasada de la productividad biológica y los ciclos biogeoquímicos. FONDECYT 2008-2005: •Autotrophic processes and greenhouse gases cycling on the continental shelf off central Chile (32-38º S). •N2O consumption at the oxygen minimum zone and its boundaries of the eastern South Pacific. Departamento Geofísica (DGEO, Universidad de Concepción www.dgeo.udec.cl/index.htm Descripción “Crear las condiciones adecuadas para el desarrollo y fortalecimiento de las ciencias geofísicas a través de la investigación científica, la docencia y la extensión hacia los estudiantes, profesionales y la sociedad en su conjunto. De esta forma el Departamento de Geofísica contribuye al desarrollo económico y social del país y a la preservación de la vida y el medio ambiente de nuestro planeta”. Integrantes Actualmente lo conforman once académicos en jornada completa y uno en jornada parcial. FONDECYT 2008-2004 •The dynamic of waters on the inner shelf in a upwelling region: The role of winds, river discharges and coastline. •Theoretical study of the atmospheric dust devil. •Interaction of low frequency waves, mesoscale eddies and phytoplankton biomass in the Peru-Chile Current System Otros Proyectos: •Variabilidad climática en Chile: evaluación, interpretación y proyecciones en Chile: evaluación, interpretación y proyecciones. •Sistema Integrado de Registro de Corrientes y Olas (SIRCO) aplicado al monitoreo, la modelación y el diagnóstico de bahías, fiordos y zonas costeras. 175 Capítulo VI: Estado del Arte Nacional Centro de Investigación y Transferencia en Riego y Agroclimatologia (CITRA, Universidad de Talca) www.citrautalca.cl Descripción Ciertamente la prioridad de este Centro no es la variabilidad del clima, pero sí lo es la relación con las consecuencias que para la agricultura podría tener el cambio climático en las necesidades de agua de los cultivos, descenso pluviométrico, aumento de las temperaturas, déficit de horas-frío y pérdidas de la estacionalidad de las variables agrometeorológicas. Misión Realizar investigación científica y aplicada en el ámbito del riego, modelamiento biomatemático y agricultura de precisión; transferir sus resultados al sector productivo y apoyar la docencia de pre-grado y post-grado en la Facultad de Ciencias Agrarias de la Universidad de Talca. Visión Posicionarse como un Centro de referencia Nacional e Internacional, que contribuya a la optimización del uso del agua a nivel predial a través de la incorporación de técnicas de manejo con alto nivel tecnológico, no solo para la obtención de altos rendimientos y calidad de los productos agrícolas sino también para minimizar sus costos y preservar el medio ambiente. Investigadores dedicados al estudio del clima Tres investigadores de catorce que participan en el centro. Proyectos: •Sistema de Alerta Temprana sobre la base de una red de Estaciones Meteorológicas automáticas en Tiempo Real. 176 Capítulo VI: Estado del Arte Nacional Laboratorio de Climatología (Universidad de Magallanes) www.umag.cl/climatologia/schythe.htm Descripción: Consciente de la importancia del conocimiento del clima regional como base para la planificación y desarrollo de todas las actividades humanas, en 1971 el Instituto de la Patagonia inició un Programa de Información y Documentación Climática con el objetivo de avanzar en el conocimiento del clima de Magallanes. Para lograr este avance en el conocimiento del clima regional se inició, en 1971, una labor que incluye: •La observación y registro de datos meteorológicos, a través de la creación e instalación de la estación climática Jorge C. Schythe , la que , al paso de un corto tiempo, comenzó a operar en convenio de colaboración científica con la Dirección General de Aguas (DGA) dependiente del Ministerio de Obras Públicas, la Dirección Meteorológica de Chile (DMC) y la Empresa Nacional de Petróleo (ENAP). •La recopilación de antecedentes climáticos históricos y actuales de la región, creándose con esto un archivo de datos climáticos. Infraestructura: •Estación tradicional (requiere de un observador) •Estación automática. •Estación satélite. Proyectos: El personal de este laboratorio fue invitado a participar en el proyecto CEQUA (www.cequa.cl) para integrar un grupo de Climatología. Paralelamente, un proyecto para instalar estaciones meteorológicas automáticas en el canal Beagle se gestionaba con la Patagonia Research Fundation (PRF), con base en Puerto Williams, a través de su representante legal, Charles Porter. 177 Capítulo VI: Estado del Arte Nacional Centro de Estudios del Cuaternario Fuego-Patagonia y Antártica www.cequa.cl Antecedentes y objetivos A principios del año 2002, el Gobierno Regional de Magallanes y Antártica Chilena, en conjunto con la Universidad de Magallanes, el Instituto Antártico Chileno y el Instituto de Fomento Pesquero, se unieron en torno a una iniciativa que se consolidó cuando el Consejo Nacional de Ciencia y Tecnología aprobó la creación del “Centro de Estudios del Cuaternario de Fuego-Patagonia y Antártica Chilena”, CEQUA. El costo total del proyecto CEQUA, que tiene una duración de cinco años, asciende a un total de 2000 millones de pesos, los que son aportados en partes iguales por CONICYT y el Gobierno Regional de Magallanes y Antártica Chilena. El objetivo es crear un centro de investigación científica multidisciplinario y de nivel internacional, enfocado a estudios de la evolución Cuaternaria del medio ambiente natural en el extremo sur de Sudamérica y Antártica, particularmente el establecimiento de las grandes masas de hielo, su retiro y posterior colonización biótica y humana. Se pretende formar una masa crítica de investigadores jóvenes en Punta Arenas, capaces de caracterizar el medio ambiente pasado, actual y la evolución futura de la región, en un medio ambiente cuyas características son únicas en el mundo, puesto que Fuego-Patagonia es un laboratorio natural considerado clave para entender los procesos de glaciación y desglaciación ocurridos desde 1.8 millones de años hasta el presente. La hipótesis de trabajo fundamental plantea que las fluctuaciones climáticas y glaciales durante las últimas glaciaciones y presente interglacial en Fuego-Patagonia y Antártica, han afectado profundamente la geomorfología, la hidrogeología y la evolución del medio ambiente en general, incluyendo colonización biótica y poblamiento humano. Grupo de Climatología Sus objetivos: •Mediante la instalación de estaciones automáticas, cubrir con registros de variables meteorológicas, la zona sur de Magallanes (Canal Beagle y zonas adyacentes) que carece de información. •Análisis de la información y comparación con otras estaciones de registro más largo. 178 Capítulo VI: Estado del Arte Nacional •Entregar un estado del escenario de la influencia antártica en el extremo sur del continente americano y, particularmente, de esta sensible zona como contribución a los estudios del cambio global. Integrantes: El Laboratorio de Climatología de la Universidad de Magallanes. •Ariel Santana Aguila •Nicolás Butorovic Alvarado, candidato a Doctor en Ciencias Atmosféricas en la Universidad Complutense de Madrid. •Carlos Olave FONDECYT 2008: •Late –Holocene glacier fluctuations in the Andes of southern Chile: MultiCriteria dating approach integrating high-resolution dendroglaciologic methods with lichenometry, tephrochronology and stratigraphic analysis. Con este simple catastro se puede apreciar cómo la gran mayoría de los proyectos vienen de cuatro grupos, a saber: Universidad de Chile, Universidad de Concepción, Centro de Estudios Avanzados en Zonas Áridas y Centro de Estudios Científicos. Lo cual se confirma al constatarse que son ellos quienes se han adjudicado la gran mayoría de los recursos Fondecyt de cada año. Otro dato importante es el número de publicaciones ISI que han generado los proyectos llevados a cabo en Chile. Se puede afirmar que desde el año 2005 hasta la fecha, la cantidad de publicaciones ISI exclusivas del área de meteorología y ciencias atmosféricas llega, aproximadamente, a 80. Esto supera con creces lo logrado en el período 2000-2005, donde se sumaron 56 publicaciones135. 135 Documento “Análisis de Proyecciones de la ciencia chilena 2005”. 179 Capítulo VI: Estado del Arte Nacional 6.2 Proyectos a nivel nacional Nombre del Proyecto: Proyecto ACT-19 (http://www.dgf.uchile.cl/ACT19) Instituciones: Universidad de Chile136, Meteorológica de Chile138. Universidad de Concepción137, Dirección “El proyecto incluye además la participación de un investigador del IMK-IFU (Alemania) y un estrecha vinculación con centros de investigación tales como el Centro de Investigaciones del Mar de la Atmósfera (CIMA) de la U. de Buenos Aires, el Byrd Polar Research Center (BPRC) de la Universidad de Ohio, el Departamento de Geofísica de la U. de Copenhagen, el Laboratoire d’Etudes em Geophysique et Oceanographie Spatiales (LEGOS) en Toulouse, el Centro de Previsao de Tempo e Etudos Climaticos (CPTEC) en Brasil, así como vinculación con programas internacional de investigacion tales como CLARIS, CLIVAR-VAMOS y CLIVARPacific”139. Descripción: “La variabilidad del sistema climático (atmósfera/océano) en todas sus escalas temporales (intraestacional, interanual, interdecadal y secular) tiene un significativo impacto socioeconómico en un país como Chile, que basa fuertemente su desarrollo en una explotación intensiva de sus recursos naturales. Del mismo modo, existe un creciente interés a nivel mundial por mejorar la comprensión de la variabilidad climática global y prever los eventuales impactos antropogénicos sobre el clima futuro. De hecho, el Panel Intergubernamental sobre Cambio Climático Global (IPCC) publicará en 2007 un nuevo informe en el cual se incluirán los avances alcanzados por la comunidad científica hasta el presente año. En este contexto, este proyecto está dirigido a la realización de un trabajo complementario y único a nivel regional, tendiente a mejorar la comprensión de la variabilidad del sistema climático relevante para Chile, en sus componentes atmosférica y oceánica, y evaluar los posibles impactos del calentamiento global de origen antropogénico en el clima regional”. 136 http://www.uchile.cl 137 http://www.udec.cl 138 http://www.meteochile.cl 139 http://www.dgf.uchile.cl/ACT19 180 Capítulo VI: Estado del Arte Nacional “El proyecto está estructurado en tres etapas. El objetivo principal de la primera de ellas es evaluar la variabilidad del sistema climático regional durante las décadas más recientes en las distintas escalas temporales, comparándolo con las fluctuaciones climáticas a nivel global. Para alcanzar este objetivo se analizaron con apoyo de técnicas estadísticas convencionales series de variables meteorológicas y oceanográficas registradas durante periodos de varias décadas. “El segundo objetivo general del proyecto es la identificación de mecanismos físicos que explican aspectos no conocidos de la variabilidad del sistema climático regional, mediante la realización de estudios de diagnóstico. Para esto se buscan relaciones entre variaciones locales de las condiciones atmosféricas y oceánicas y procesos o fenómenos de gran escala, mediante un uso cuidadoso de técnicas de análisis multivariados (EOF, SVD, CCA, etc.). La síntesis e interpretación de los modos de co-variabilidad entre los patrones de anomalías de circulación de gran escala y variables de clima local obtenidas con técnicas estadísticas da lugar a modelos conceptuales que deben respetar las leyes físicas que rigen a la circulación de la atmósfera y el océano. “El tercer objetivo general del proyecto es evaluar las condiciones más probables del sistema climático regional en un escenario futuro caracterizado por un efecto invernadero intensificado. Este es el aspecto más innovador del proyecto, puesto que incluye el desarrollo de una capacidad nueva a nivel nacional para analizar la variabilidad climática regional y su proyección en el futuro mediante la aplicación de modelos climáticos regionales, tanto atmosféricos como oceánicos, que requieren un gran capacidad computacional”. Recursos del proyecto Hardware: •1 cluster Linux (16 CPUs AMD Opteron). •12 servidores Linux, 8 CPUs cada uno. •16 estaciones de trabajo Linux/Windows, apoyando las actividades enseñanza. •15 Terabytes de capacidad de almacenamiento. Software: •Modelos: MM5, single column MM5, WRF, WRF-Chem, ROMS, CALMET, RCA, MATCH, PRECIS. •Software Especializado: GrADS, HYSPLIT, GEMPAK, IDV, Grace, NCL, NCO, CDAT •Software General: Matlab, ENVI, ARCGis, IDL, GMT, •Software en Desarrollo: PGI's full suite, Intel's compilers, MPICH 181 Capítulo VI: Estado del Arte Nacional Sistemas de observación: •GOES High resolution Ground Station (GTI Electronics) •10 estaciones de tiempo automáticas full equipo (Campbell Sci.); con sensores de repuesto para la temperatura del aire y la humedad, viento, presión atmosférica, radiación solar, temperatura de la tierra, economizador de energía y equipo de calibración. •1 AIR radiosonde and tethered balloon station. •1 Pilot balloon system. •1 Laser ceilometer. Humanos: En la realización de esta tarea multidisciplinaria participa un grupo de trece científicos, especialistas en ciencias atmosféricas y oceanográficas, pertenecientes al Departamento de Geofísica de la Universidad de Chile (DGF), al Departamento de Física de la Atmósfera y del Océano (DEFAO) y al Programa Regional de Oceanografía Física y Clima (PROFC), ambos de la Universidad de Concepción, y a la Dirección Meteorológica de Chile (DMC). Además de los vínculos con las instituciones anteriormente nombradas. Relación con el ámbito docente: El proyecto tiene una fuerte componente de formación de especialistas de alto nivel en ciencias atmosféricas y en oceanografía física, mediante el financiamiento de tesis de postgrado y puestos de investigadores postdoctorales. A nivel institucional, el proyecto favorece y fomenta el desarrollo de una vinculación de carácter permanente entre los dos grupos de investigación más activos a nivel nacional en estudios de aspectos físicos del cambio climático regional. Desde el punto de vista de innovación tecnológica, este proyecto abre la posibilidad de desarrollar una capacidad de nivel internacional en estudios de modelamiento oceánico y atmosférico, lo que aumenta el atractivo de los programas de postgrado asociados a la iniciativa, y favorece la visita de científicos de la región. Impacto en los sectores público y privado: “A nivel nacional el proyecto, y en particular las actividades de difusión asociadas al mismo, contribuirán a posicionar el tema de la variabilidad climática y sus impactos socioeconómicos en la agenda científica nacional, y en los sectores productivos y de servicios afectados por ella, y dar respuesta objetiva sobre los posibles impactos del calentamiento global de origen antropogénico en Chile”140. Áreas: Agricultura, Minería, Pesca. 140 182 http://www.dgf.uchile.cl/ACT19 Biociencia Capítulo VII: Estado del Arte Internacional 7 Capítulo VII: Estado del Arte Internacional 7.1 Introducción La Biología Molecular ha utilizado Computación de Alto Desempeño desde los trabajos de M. Dayhoff en 1947 en su tesis doctoral y los siguientes estudios acerca de la estructura molecular de las proteínas, que junto a la Química Computacional, han sentando las bases de la Bioinformática. Por otro lado la Medicina ha ido acumulando información de pacientes la cual ha permitido desarrollar tratamientos y medicamentos más precisos. Los mayores requerimientos de memoria y capacidad de análisis, así como las nuevas tecnologías para secuenciar el genoma y obtener imágenes de alta resolución han hecho que diferentes grupos de investigación compartan información generando redes de investigación a niveles nacionales y continentales. Estos grupos han generado nuevas instituciones que son verdaderas bibliotecas de información como el NCBI, el EMBL y el DBBJ, además de ir construyendo motores de búsquedas, como blast, que puedan filtrar y analizar la información almacenada. Como ejemplo, el banco de genoma internacional GenBank ha mostrado un crecimiento exponencial en los últimos años, duplicándose alrededor de cada siete meses, lo que hace sospechar que para fines del 2010 se obtengan 10 veces más información que la del 2009. 185 Capítulo VII: Estado del Arte Internacional Growth of GenBank (1982-2008) 100 100 90 90 80 80 70 70 60 60 50 50 40 40 30 30 20 20 Base Pairs Secuences 10 10 0 0 1982 1985 1990 1994 1998 2002 2006 Figura 10. Gráfico del crecimiento del GenBank (fuente: Genbank) Solamente este ejemplo muestra que la red de colaboración tendrá también que aumentar considerablemente para generar y analizar esta información (Figura 10). Por otro lado la Química Computacional ha trabajado en el desarrollo de equipamiento (Figura 11) y programas computacionales. Estos permiten el análisis molecular de estructuras orgánicas e inorgánicas potenciando el desarrollo de productos biotecnológicos de alto rendimiento como biofilms y medicamentos. 186 Capítulo VII: Estado del Arte Internacional Figura 11. Máquina MMS para gráfica molecular, Universidad de Washington. Hoy en día tanto el equipamiento como el software se han especializado requiriendo capacidades mayores de recursos computacionales, transformándose así en una necesidad en la investigación y el desarrollo de productos farmacéuticos. Por otro lado, también se ha potenciado su uso en Biomedicina accediendo a apoyar el desarrollo de investigación en una nueva área. En particular, las grids han permitido compartir información valiosa y escasa (como exámenes médicos y sus diagnósticos) permitiendo mejoras en la interpretación de exámenes ayudando a realizar tratamientos preventivos tempranos en beneficio del bienestar de la población. Para nuestro país, contar con dichos recursos de manera compartida potenciará el desarrollo científico y tecnológico al permitir a los investigadores compartir equipamiento de alto desempeño, nuevas bases de datos, herramientas de análisis, además de integrarse a la comunidad internacional. Los numerosos proyectos grids internacionales muestran que esta área ha sido muy beneficiada con estas tecnologías y que Chile tiene el potencial de integrarse. 187 Capítulo VII: Estado del Arte Internacional 7.2 Tendencias de investigación en Biociencias El uso de recursos computacionales para almacenar y analizar información genética y médica ha llevado al desarrollo de numerosas páginas web de servicios creadas por diferentes instituciones. La gran cantidad de información y de interés en analizar grandes cantidades de datos, ha permitido que muchos proyectos grids se hayan desarrollado en el ámbito de las Biociencias. El uso de herramientas bioinformáticas de manera masiva, como blast, permiten el desarrollo de aplicaciones grid distribuidas. Problemas de búsquedas de homólogos de genes y proteínas se han atacado en diversos proyectos grids. Por otro lado, simulaciones moleculares permiten desarrollar nuevos medicamentos donde los recursos computacionales de alto rendimiento son fundamentales. Por último la generación de grandes cantidades de datos genómicos requieren una constante revisión de los resultados obtenidos. Así, los investigadores en Biología Molecular están constantemente apoyando sus investigaciones con consultas a bases de datos y uso de recursos distribuidos. En el caso de problemas más específicos, ellos se han organizado para crear grids de dedicación exclusiva donde tanto las herramientas de análisis como las bases de datos se comparten de manera segura. Otra fuente de aplicaciones en grid han sido los proyectos de información médica de pacientes con el objetivo de mejorar y acelerar pronósticos de enfermedades. Junto con ello, por medio de nuevas aplicaciones grids, se han creado nuevas capacidades de análisis de imágenes que han permitido apoyar la toma de decisiones en la formulación de diagnósticos. Las necesidades de conectar diferentes hospitales han llevado a que las tecnologías grid ofrezcan una solución segura de acceso remoto a la información privada y de una fácil interacción por medio de interfaces amigables. Esta colaboración no sólo ha potenciado la investigación médica, sino que además se ha mejorado la calidad de vida de los usuarios. Todas estas aplicaciones también han motivado el desarrollo de nuevos middlewares y herramientas que poseen características propias de los problemas a resolver, por ejemplo, interfaces amigables para el análisis de imágenes y muestra de resultados o también estándares de almacenamiento y uso. De esta manera tanto la Biociencia como la Computación Grid se han beneficiado mutuamente en su colaboración. Esta evolución conjunta justifica la continua creación e implementación de nuevos proyectos grids facilitando la integración de investigadores nacionales a las grids internacionales de probado éxito. Debido al creciente número de iniciativas, Chile está invitado a ser un nuevo usuario de la Computación Grid. Cabe destacarse que ha sido tal el número de proyectos 188 Capítulo VII: Estado del Arte Internacional y su importancia que en mayo 2009 ha publicado Handbook of Research on Computational Grid Technologies for Life Science, Biomedicine, and Healthcare, editado por Mario Cannataro de la University Magna Gracia de Catanzaro, Italia, de la editorial IGI-Global, 1050 páginas en dos volúmenes. En esta obra se resumen tanto las iniciativas como las tecnologías utilizadas en la Computación Grid para Biociencias. 7.3 Iniciativas Internacionales: e-Infraestructuras para el desarrollo de la e-Ciencia Estas iniciativas se pueden separar en proyectos de desarrollo de aplicaciones grid experimentales en apoyo a las Biociencias y proyectos grids de desarrollo de middleware específico y de aplicaciones científicas desarrolladas sobre estas plataformas. Las diferentes iniciativas centradas en universidades y laboratorios han sido desarrolladas para resolver un problema específico, pero al no contar con una mayor colaboración no han podido potenciar la investigación de dichos grupos. Mencionaremos algunos casos en la sección 2.4, por ejemplo Squid. Por otro lado, los proyectos de colaboración nacional, como eDiamond sobre cáncer mamario tratados en hospitales públicos, han tenido un financiamiento gubernamental que les ha permitido capacitar recurso humano, instalar infraestructura grid y reunir a los potenciales beneficiarios de la investigación. Sus resultados son exitosos en todo sentido, en particular en el bienestar de las mujeres extendiendo su esperanza de vida. Finalmente los proyectos europeos han tenido aún mayor impacto. El proyecto EGEEE financiado por el Programa Marco FP6 ha generado 16 aplicaciones grids en Biomedicina. Por otro lado, el proyecto EELA-2 del FP7 (Figura 12) ha generado 60 proyectos de desarrollo de aplicaciones grid en diferentes áreas de investigación y desarrollo, de ellas 25 iniciativas corresponden a las áreas de Biociencias (Bioinformática, Medicina, Biomedicina, Química Computacional y Ciencias de la Vida). Esta es la iniciativa que ha mostrado ser exitosa en su diseño por lo que ha permitido la fácil integración de equipos de trabajos sin requerir muchos recursos computacionales, realizando escuelas de capacitación y financiando reuniones de colaboración. Además, los resultados de investigación de estos proyectos ha sido 189 Capítulo VII: Estado del Arte Internacional muy significativa y se espera que continúen en aumento con la continuación, el proyecto Gisela. GISELA tiene por objetivo garantizar la sostenibilidad a largo plazo de la UE-e-Infraestructura, y así garantizar la continuidad y el fortalecimiento de la Investigación de las Comunidades Virtuales Unión Europea - América Latina, para este fin, el proyecto se centrará en dos objetivos interrelacionados: implementar un modelo de sostenibilidad de las iniciativas grid en LatinoAmerica y proporcionar VRCs (Centro de Recursos Virtuales) con la E-Infraestructura adecuada y que permitan dar servicios a las aplicación desarrolladas. PROYECTO EUROPA LATINOAMÉRICA E- infraestructure shared between Europe and Latin America 1.7 M€ / ~ 2.5. M€ E-science grid facility for Europe and latin America ~ 2.1. M€ / ~ 4.4. M € Grid Initiatives for e-Science virtual communitie s in Europe and Latin America (GISELA) 2006 2007 2008 EELA JAN 2009 2010 EELA-2 DEC APR 2013 GISELA MAR Figura 12. Iniciativa EELA, EELA2 y Gisela. 7.3.1 Descripción tecnológica de la e-infraestructura La mayoría de los sitios de desarrollo de aplicaciones no entregan información acerca de la infraestructura presente (computadores, servidores, bases de datos) y solamente se remiten a entregar información de las aplicaciones desarrolladas, su uso y área de aplicación y opcionalmente el middleware utilizado para el desarrollo, donde Globus posee la mayor cantidad de citas. 190 Capítulo VII: Estado del Arte Internacional En el caso de proyectos grids, EELA tuvo una primera fase donde se desarrolló una infraestructura de 730 cpus y 60 TB de almacenamiento. Hoy en día se han alcanzado 3000 cores y 600 TB en 41 centros de Europa y América Latina. En cambio EGEE posee aproximadamente 150.000 cores, 28 PB de disco y 41 PB de cinta de almacenamiento, reuniendo a 250 centros de investigación de Europa. Acerca del middleware, ambos proyectos se basan en gLite (glite.web.cern.ch/glite/). Para los proyectos nacionales, podemos comentar que eDiamond fue un proyecto de tres años con 4.1 millones de libras que permitió crear la infraestructura necesaria para desarrollar el proyecto grid. EELA tuvo un presupuesto de 2,5 millones de euros para dos años. Finalmente EGEE también tuvo una duración de dos años y un financiamiento de 32 millones de euros solamente de la Comisión Europea con un total estimado de 100 millones de euros con casi 10 mil personas involucradas de un total de 250 organizaciones de 55 países. 7.3.2 Descripción de Iniciativas Debido al gran número de iniciativas, estas serán separadas geográficamente en tres: latinoamericanas, europeas y otras aplicaciones. Esta división tiene el propósito de ver cómo los proyectos latinoamericanos han sido casos de grid en Biociencias más cercanos a la realidad chilena. En el caso de los proyectos europeos, en general han contado con apoyo de la Comunidad Europea buscando integrar a sus países miembros y han contado con gran financiamiento. Finalmente, otros casos que han sido ejemplos de grids colaborativas en torno al tema de iniciativa local más que gubernamental. 7.3.2.1 Latinoamérica 7.3.2.1.1 BioMD (EELA 2, UFRJ, Brasil) http://applications.eu-eela.eu/application_details.php?l=20&ID=50 La dinámica molecular es una herramienta poderosa para investigar la estabilidad, cambios conformacionales y estructurales a nivel atómico de biocomplejos moleculares. En los últimos años, el enfoque de diseño racional de drogas, se basa en explorar el concepto complementario estructural para generar antagonistas específicos para las moléculas objetivo. Conocer en detalle la estructura espacial de las enzimas por medio de herramientas computacionales y la ayuda 191 Capítulo VII: Estado del Arte Internacional de un banco de datos estructurales, permite identificar las moléculas cuya especificidad puede coincidir con el sitio activo de la enzima. El análisis dinámico de una enzima es necesario para comprender su función y la interacción con sus inhibidores a escala atómica. Así, los modelos teóricos de simulaciones se valen de la Dinámica Molecular (MD) con el fin de extraer información valiosa. La computación en Grid ayuda a minimizar el tiempo de cálculo de la simulación. 7.3.2.1.2 BioSys (EELA 2, UCI y CIM, Cuba) http://applications.eu-eela.eu/application_details.php?l=20&ID=68 La Biología de Sistemas consiste en entender los diferentes procesos biológicos que ocurren de manera simultánea (reacciones químicas, formación de proteínas, concentraciones de iones, etc.) El entendimiento de estos sistemas necesita de altos recursos computacionales de simulación que integre algoritmos de estimación de parámetros, data mining, análisis de sistemas, entre otros. La aplicación grid utiliza varios algoritmos que simulan las partes del sistema y las integra por medio de herramientas grids. 7.3.2.1.3 CardioGrid Portal (EELA 2, UBA, Argentina) http://applications. eu-eela.eu/application_ details.php?l=20&ID=15 El proyecto consiste en la construcción de un portal, permitiendo a los médicos e investigadores el acceso a una base de datos médica para el manejo de la información del paciente y de sus respectivos archivos médicos, especialmente, electrocardiogramas. 192 Capítulo VII: Estado del Arte Internacional CardioGrid tiene la capacidad de analizar electrocardiogramas a través de un conjunto de algoritmos de procesamiento de señal, almacenando y visualizando los resultados en línea. El electrocardiograma, no consume gasto excesivo de computación. Sin embargo, cuando existe una gran cantidad de pacientes y cada estudio toma mucho tiempo, el tiempo de cálculo toma un papel preponderante en el buen funcionamiento del portal web. Por esta razón se propone una solución basada en la tecnología Grid que permita la escalabilidad requerida por el proyecto. Una vez conectado a CardioGrid, los investigadores pueden acceder y compartir datos experimentales, herramientas para el análisis de datos y modelos computacionales relacionados con el funcionamiento de los individuos. 7.3.2.1.4 DicomGrid (EELA 2, InCor-USP, Brasil) http://applications.eu-eela.eu/application_details.php?l=20&ID=9 La disponibilidad de conjuntos de datos de imágenes médicas de gran envergadura y la enorme capacidad de procesamiento puede permitir el desarrollo de nuevas técnicas de visualización, nuevos algoritmos de detección (detección del cáncer, diagnóstico de Alzheimer precoz) y nuevas técnicas de procesamiento (segmentación de imágenes, reconocimiento de patrones y fusión de imágenes). Hoy en día las imágenes se utilizan en los hospitales sólo como parte de los procedimientos de rutina, mientras se ignora su valor intrínseco para la investigación. Esto se debe a las dificultades para almacenar enormes cantidades de datos, las limitaciones de computación para procesar grandes cantidades de datos y razones legales. DicomGrid propone crear un almacenamiento distribuido de imágenes médicas, los cuales pueden ser utilizados por los investigadores para probar nuevas técnicas de procesamiento utilizando la potencia de cálculo que ofrece la tecnología Grid. La idea es también poder contar con grandes cantidades de datos que pueden ofrecer una distribución estadística significativa de una enfermedad en particular. 7.3.2.1.5 Dist-SOM-PORTRAIT (EELA 2, UnB, Brasil) http://applications.eu-eela.eu/application_details.php?l=20&ID=63 Hoy en día, los experimentos han demostrado que algunos tipos especiales de ARN pueden controlar la expresión de genes y el fenotipo, además de su papel tradicional de permitir la síntesis de proteínas. El ARN se puede dividir en dos clases: los ARN mensajeros (ARNm), que se traducen en proteínas y ARN no codificantes (ncRNAs), que desempeñan varias funciones celulares importantes. En los últimos 193 Capítulo VII: Estado del Arte Internacional años, varios métodos de cálculo se han propuestos para distinguir los ARNm de los ncRNAs, utilizando diferentes teorías y modelos. Un modelo de red neuronal, es un modelo eficiente para esto: Self-Organizing Maps (SOM). Se propone un método para identificar ARN no codificantes utilizando SOM, llamado SOM-PORTRAIT. Con el fin de acelerar el uso de SOM-PORTRAIT, se propone Dist-SOM-PORTRAIT. Básicamente éste funciona de la siguiente manera: en primer lugar, el archivo de entrada FASTA se dividirá en tantas partes como al usuario defina y cada una de estas porciones se almacenará en un archivo separado, entonces un trabajo se creará para todos estos archivos separados, y finalmente se ejecutará en una infraestructura GRID. 7.3.2.1.6 DistBLAST (EELA 2, UnB, Brasil) http://applications.eu-eela.eu/application_details.php?l=20&ID=49 BLAST es un software ampliamente utilizado para la aproximación de la comparación de secuencias biológicas. Incorpora los conocimientos biológicos en su método, y es extremadamente eficiente en el tiempo, pero usa bases de datos muy grandes. A fin de acelerar su proceso, se propone DistBLAST. Esta aplicación es usada para la genómica comparativa, ya que muchos de los métodos de cálculo utilizados en este ámbito usan BLAST como una herramienta básica. 7.3.2.1.7 G-HHMER (EELA 2, UNIANDES, Colombia) http://applications.eu-eela.eu/application_details.php?l=20&ID=57 HMMER es una implementación de Modelos de Markov Ocultos (Hidden Markov Model), para búsquedas en bases de datos mediante alineamientos múltiples de secuencias. En otras palabras, es un conjunto de programas que permiten analizar múltiples alineaciones utilizando métodos probabilísticos. El objetivo es exportar HMMER a la grid, llamada Grid-enabled HMMER (GHMMER), por el desarrollo del Bioinformatic Grid Wrapper (BGW), basado en PHP y Command Line Interface (CLI) usado para crear, presentar y solicitar trabajos en múltiples redes a través de la web. 7.3.2.1.8 G-InterProScan (EELA-2, UNIANDES, Colombia) http://applications.eu-eela.eu/app_list.php?l=20 Es una herramienta que gridifica la aplicación InterProScan e integra información de familias de proteínas, sus dominios y sitios, usando diferentes metodologías para derivar firmas de proteínas (identificadores únicos). 194 Capítulo VII: Estado del Arte Internacional 7.3.2.1.9 GrEMBOSS (EELA-2, UNAM, México) http://applications.eu-eela.eu/application_details.php?l=20&ID=11 Nuevamente la idea es gridificar la aplicación EMBOSS de análisis de secuencias genómicas, la cual reúne una amplia información para realizar los análisis. EMBOSS (European Molecular Biology Open Software Suite) de EMBnet (European Molecular Biology Network) es un paquete de software gratuito Open Source desarrollado para el análisis de la bioinformática. Con EMBOSS se puede hacer: Alineamiento de secuencias; búsqueda rápida de base de datos con los patrones de secuencia; identificación de proteínas, incluyendo el análisis de dominio, análisis de patrones de secuencias de nucleótidos, y análisis de uso de codones para genomas pequeños. 7.3.2.1.10 GRIP (EELA-2, UFRO, Chile) http://cmcc.ufro.cl/doku.php?id=Tratamiento_De_Imagenes El proyecto Grid Image Processing (GRIP) busca gridificar el análisis de las imágenes biomédicas utilizando diferentes algoritmos de procesamiento de imágenes que permite ayudar a la toma de decisiones en la detección de patrones correspondientes a enfermedades y acelerar los tiempos de diagnósticos. El objetivo del análisis, consiste en la identificación y el conteo de células cancerígenas en una imagen de tejido mamario, donde los núcleos son teñidos mediante la utilización de técnica inmunohistoquímica. 7.3.2.1.11 Heart Simulator (EELA 2, UFJF, Brasil) http://applications.eu-eela.eu/application_details.php?l=20&ID=12 Esta aplicación simula la actividad eléctrica en el tejido cardíaco. Las ecuaciones de bidomain se utilizan para este fin, ya que son especialmente importantes para modelar con precisión la estimulación extracelular. Sin embargo, la solución de las ecuaciones es computacionalmente costosa debido a la discretización espacial y temporal, y esto limita el tamaño y la duración del problema que puede ser modelado. Independientemente de la forma específica en la que han sido emitidos, el cuello de botella del cálculo se convierte en la solución reiterada de un sistema 195 Capítulo VII: Estado del Arte Internacional grande y lineal. Así que la simulación sólo sería posible hoy en día en un entorno Grid. 7.3.2.1.12 HeMolab (EELA 2, LNCC, Brasil) http://www.lncc.br/prjhemo/main.htm La principal preocupación de este proyecto es el desarrollo de modelos, técnicas y herramientas computacionales para la simulación del sistema cardiovascular humano. Al transferir las innovaciones científicas a la comunidad médica, se espera tener una gran contribución en la comprensión del funcionamiento de este sistema, la asistencia en la prevención, diagnóstico, terapia y rehabilitación cardiovascular de las patologías más diversas. 7.3.2.1.13 HPC Structure (EELA 2, CIP, Perú) Structure es un software desarrollado por J.K. Pritchard. Utiliza datos de múltiples genotipos para investigar la estructura de la población. Sus usos incluyen inferir la presencia de distintas poblaciones, la asignación de los individuos a la población, el estudio de zonas híbridas, entre otros. Structure utiliza MCMC (Markov Chain Monte Carlo) para sus cálculos., donde estos obtiene mejores resultados cuando se realizan más iteraciones del análisis, resultando tareas muy intensivas en la CPU, la cual puede correr durante horas en los computadores actuales. HPC Structure es un conjunto de herramientas que permiten al investigador a realizar análisis de estructura en paralelo disminuyendo el tiempo de análisis. 7.3.2.1.14 Integra-EPI (EELA 2, Mackenzie, Brasil) http://telemedicina.unifesp.br/set/projetos/integraepi/entrada.php El servicio de integración de datos de INTEGRA-GISE fue desarrollado para obtener datos de múltiples fuentes a través de un único punto de acceso. 196 Capítulo VII: Estado del Arte Internacional En particular, este servicio proporciona una gestión eficiente de los recursos computacionales disponibles. También hace uso de la infraestructura de seguridad de la red y la estructura de inicio de sesión único para acceder a múltiples fuentes de datos. Del mismo modo como se presenta en la arquitectura IntegraEPI general, la arquitectura de Integra-GISE se divide en capas compuesta por los servicios de la red y los recursos. En la simulación y módulos de análisis, el sistema de IntegraEPI necesita el acceso a diferentes tipos de datos como mapas, datos epidemiológicos, información geográfica y social de la economía de datos. Los datos requeridos son distribuidos geográficamente en DBMS, (PostgreSQL, SQLServer y Oracle). El servicio GISE proporciona los datos necesarios para los otros módulos IntegraEPI de forma transparente, mediante la aplicación de un conjunto de servicios de datos de la red. Para Integra-GISE se utiliza la OGSA-DAI (Open Grid Service Architecture Data Access Integration). La OGSA-DAI proporcionar servicios de almacenamiento para acceder a datos de diferentes fuentes. 7.3.2.1.15 InvCell (EELA 2, UFJF, Brasil) http://applications.eu-eela.eu/application_details.php?l=20&ID=61 Esta aplicación basada en Algoritmos Genéticos, tiene por objeto ajustar automáticamente los modelos existentes de electrofisiología celular a los datos experimentales obtenidos a partir de una célula o un conjunto de células cardíacas. La metodología propuesta es aplicada y evaluada a través de diferentes experimentos numéricos. Los modelos ajustados por Algoritmos Genéticos fueron capaces de reproducir la actividad eléctrica medida por varios experimentos in vitro. Además, estos modelos fueron validados a través de nuevos experimentos in vitro utilizando conocidos efectos de drogas. Los resultados preliminares sugieren que la metodología propuesta es una herramienta prometedora para apoyar el desarrollo y el uso de modelos celulares. Para las simulaciones complejas se requiere una gran cantidad de recursos 197 Capítulo VII: Estado del Arte Internacional informáticos, y para aumentar su rendimiento, se ha adaptado a la infraestructura de Grid EELA. 7.3.2.1.16 INVTissue (EELA 2, UFJF, Brasil) http://applications.eu-eela.eu/application_details.php?l=20&ID=62 InvCell se centra principalmente a niceles celulares. El enfoque INVTissue es a nivel de los tejidos: el objetivo de esta aplicación es resolver un problema inverso asociado a la simulación de modelos de tejido cardíaco. La aplicación calcula los valores de la conductividad eléctrica del tejido cardíaco, teniendo como base información sobre la actividad eléctrica del corazón. Este es un problema de gran interés, ya que en muchas patologías cardíacas estos valores presentan alteraciones significativas. La investigación, desarrollo y validación de la metodología propuesta son necesarios para hacer frente a problemas inversos de interés científica y clínicamente más elevado. INVTissue es una implementación de un Algoritmo Genético paralelizado con MPI. 7.3.2.1.17 MetaDock (EELA 2, UNAM, México) http://applications.eu-eela.eu/application_details.php?l=20&ID=55 El propósito de Meta-Dock es dar un método de tamizaje basado en Grid para la selección de estudios farmacéuticos. Cuando una proteína que causa una enfermedad se conoce, el siguiente paso es identificar una molécula (un ligando) que pueda impedir la acción de esta proteína a través de un mecanismo vinculante. El método tradicional de laboratorio es identificar el ligando, y reducir el espectro de análisis, pero el costo es elevado. Un método alternativo es utilizar una simulación in silico: utilizando un programa de acoplamiento. Los estudios in silico permiten la realización de un acoplamiento masivo en un amplio espectro de ligandos, que se denomina comúnmente tamizaje virtual (virtual screening). 7.3.2.1.18 MHOLline (EELA-2, UFRJ, Brasil) http://applications.eu-eela.eu/application_details.php?l=20&ID=25 Es un proyecto descrito como workflow bioinformática de genómica estructural por medio de la comparación estructural. Integra programas de búsqueda de proteínas en PDB, comparación por blast, alineamiento por Modeller y evaluación de modelos de proteínas por Procheck. Un paso de refinamiento se realiza con la etapa BATS, la cual accede a una nueva batería de algoritmos de análisis. 198 Capítulo VII: Estado del Arte Internacional 7.3.2.1.19 Squid - a simple bioinformatics grid (BMC Bioinformatics 2005, 6, 197) http://www.dbbm.fiocruz.br/labwim/bioinfoteam/templates/ archives/squid/squid.html En lugar de utilizar middleware estándar, se propone simplificar el problema desarrollando un protocolo TCP/IP para ejecutar BLAST en plataformas Windows transportando un binario en cualquier computador. Se basa en dos programas Perl, donde cada nodo posee una copia de BLAST e idealmente de la base de datos. Se fragmenta la base de datos y se envían los trabajos, los cuales son removidos del archivo maestro una vez que regrese el resultado, evitando problemas de falla de nodos. 7.3.2.2 Europa 7.3.2.2.1 BIG, BLAST en Grid (EELA 2, UPV, España) http://sacmis.itaca.upv.es:8080/PortalBiG/Inicio/index.jsp Uno de los esfuerzos más importantes en el análisis del genoma es el estudio de la funcionalidad de los distintos genes y sus regiones. El alineamiento de secuencias proporciona una manera eficaz para comparar las secuencias con genes previamente caracterizados. El programa compara las secuencias de nucleótidos o proteínas en bases de datos de secuencias y calcula la significación estadística de éstas. El servicio BiG es versátil y la interfaz de usuario se puede acceder desde un portal de Internet. En todos los casos, el comportamiento interno es el mismo: la estructuración, la creación, el lanzamiento de los trabajos en la Grid y el uso de los servicios generales para los usuarios autentificados. Big está siendo modificado para hacer frente a los kernels de computación en paralelo y secuencial. La elección del kernel más adecuado depende de las necesidades del usuario y el tamaño del trabajo. Big provee el ingreso de trabajos en masa, la gestión de múltiples bases de datos y diferentes formatos de salida. La seguridad y tolerancia a fallos son proporcionadas a nivel del portal o a través de los componentes adicionales disponibles. 199 Capítulo VII: Estado del Arte Internacional 7.3.2.3 bioNMF (EELA-2, UCM, España) http://bionmfeela.dacya.ucm.es Es un portal web que implementa la metodología de Factorización de Matriz No-negativa para detectar clusters de genes altamente correlacionados en un conjunto de datos. Se implementan diferentes métodos que permiten realizar un análisis más completo. Se pueden desarrollar scripts y workflows. 7.3.2.3.1 BGBLAST (Italia) geneva2007.healthgrid.org Se desarrolla una aplicación Grid para exportar BLAST a una plataforma Grid y realizar ejecuciones a gran escala de BLAST en la Grid EGEE, característica diferenciadora de los otros proyectos bioinformáticos Grids consiste en la administración eficiente de las bases de datos, que se actualizan constantemente pero manteniendo las versiones anteriores, y administra réplicas de éstas con un algoritmo adaptativo que balancea los costos de almacenamiento y paralelismo de ejecución. 7.3.2.3.2 Biomedical Research Informatics Delivered by Grid Enables Services BRIDGES (Glasgow, Edimburgo) http://www.brc.dcs.gla.ac.uk/projects/bridges/index.html Para comprender mejor el funcionamiento cardiovascular, como los problemas genéticos de hipertensión, se buscan los responsables del aumento en la presión sanguínea. Para ello, la búsqueda de similitudes entre secuencias es fundamental y se utiliza BLAST. Basados en Globus Tollkit 3, se desarrolla una herramienta que consta de scheduler, segmentación de la base de datos, uso del mpiBLAST para ejecución paralela de BLAST. La ScotGRID provee 250 cpus para ejecutar trabajos en cola por OpenPBS y el uso de Condor en 25 máquinas. 7.3.2.3.3 DRI/mammogrid (EELA 2, MAAT, CETA.CEIMAT, España) http://applications.eu-eela.eu/application_details.php?l=20&ID=32 gLibrary / DRI es una plataforma que alberga y apoya repositorios basados en grid, el objetivo principal de la plataforma es reducir el costo en términos de tiempo y esfuerzo. Esto se consigue gracias a una infraestructura común y un conjunto de mecanismos (API) que los proveedores de repositorio usan para definir el modelo de datos, el acceso a los contenidos (por árboles de navegación y filtros) y el modelo de almacenamiento. gLibrary/DRI posee una forma genérica para ofrecer toda esta funcionalidad, sin embargo, los proveedores pueden agregar comportamientos específicos de las funciones para sus repositorios. 200 Capítulo VII: Estado del Arte Internacional Mammogrid + (MG +) es una aplicación que hace uso de esta plataforma como un sistema de apoyo de diagnóstico y despliegue de datos para la colaboración en la investigación del cáncer de mama. 7.3.2.3.4 DYNADRUG (DEISA, National Research Council (CNR), Istituto di Chimica del Riconoscimento Molecolare, Italy) http://www.deisa.eu/science/deci/projects2009-2010/DYNADRUG El principal objetivo de esta propuesta es desarrollar una plataforma computacional biológica, altamente integrada y robusta; desarrollo de simulaciones MD y nuevos enfoques y herramientas para (a) la exploración de mecanismos moleculares de la función de la Hsp90, y (b) el desarrollo en diseño de nuevos inhibidores de la Hsp90 clínicamente relevantes, orientados a fármacos para el tratamiento del cáncer. Este es un proyecto asociado a DEISA (Distributed European Infrastructure for Supercomputing Applications) en el período 2009-2010. 7.3.2.3.5 eIMRT (EELA 2, CESGA, España) http://eimrt.cesga.es eIMRT es un sistema basado en nuevas herramientas de control remoto de cómputo que permite ayudar a radioterapeutas para planificar y aplicar los tratamientos. Esta iniciativa tiene tres componentes principales: •Un marco de optimización, que analiza las necesidades de tratamiento de radioterapia y ofrece soluciones optimizadas para la entrega de éste. •Una herramienta de verificación, que calcula utilizando técnicas de Monte Carlo las dosis producidas por un tratamiento planificado y compara las dosis producidas por ambos métodos. •Una herramienta de manejo, que calcula los parámetros que necesitan los dos módulos anteriores. 201 Capítulo VII: Estado del Arte Internacional 7.3.2.3.6 ESSM (BalticaGrid, República de Latvia) http://www.balticgrid.eu Algoritmo que permite la comparación de estructuras de proteínas, utilizando estructuras de Secuencia Evolutiva (ESSM). ESSM puede identificar automáticamente diferentes mutaciones de la estructura de proteínas entre pares. La infraestructura Grid da la posibilidad de procesar la gran cantidad de datos perteneciente a la base de datos de proteínas como CATH. Esta aplicación está asociada a BalticaGrid cuyo propósito es establecer una infraestructura de GRID que permita apoyar a científicos bálticos y bielorrusos a través del consorcio BG-II, iniciativa financiada por la EU FP7 con un período de ejecución a partir de mayo 2008 a abril 2010. 7.3.2.3.7 fMRI (EELA 2, UA, Portugal) http://applications.eu-eela.eu/application_details.php?l=20&ID=10 La resonancia magnética funcional (fMRI) puede ser usada para caracterizar la actividad fisiológica del cerebro, generalmente ésta se presenta como volúmenes 3D en función del tiempo. El enfoque tradicional de analizar fMRI se basa en la cartografía estadística paramétrica (SPM). En SPM, se supone que a través de paradigmas estructurados es posible inferir las áreas del cerebro relacionadas con los cambios. El objetivo de esta iniciativa es diseñar e implementar en el marco GRID el cálculo para fMRI no paramétrico, los que serán utilizados por los investigadores. 7.3.2.3.8 eDiamond www.ediamond.ox.ac.uk Las mejoras en la tecnología de redes de información, la digitalización y estandarización de la información médica de imágenes y señales, y la implementación de sistemas de información dentro de los hospitales generan un ambiente propicio para el desarrollo de infraestructuras Grid en Medicina. Junto con ello el uso de PCs 202 Capítulo VII: Estado del Arte Internacional por médicos y especialistas ayudan a la introducción de nuevas TICs. El disponer de mayor información permite mejorar la toma de decisiones. Incluso el desarrollo de nuevas técnicas de monitoreo del cuerpo, así como el desarrollo de sistemas mecatrónicos menos invasivos ayudan a monitorear más cautelosamente una enfermedad, reducir el tiempo de recuperación y disminuir los costos de salud. En el caso del Reino Unido ha implementado sistemas nacionales de información de la salud como el Plan Nacional del Cáncer NCP. Desde el descubrimiento de los rayos X por Röntgen en el siglo XIX, las imágenes han permitido un monitoreo no invasivo del cuerpo y el desarrollo de diagnósticos más precisos con tratamientos eficientes, en particular en la Traumatología. Controlando la energía de los rayos, ha sido posible desarrollar otros métodos de radiación por ondas que han permitido revelar diferentes texturas de tejidos más blandos como la detección de tumores no palpables como en las mamografías. Además, otros tipos de ondas han permitido generar nuevas imágenes por radiofrecuencia (ecotomografías), ultrasonido, resonancia magnética y resonancia nuclear. Por otro lado, combinando diferentes imágenes se puede tener hoy en día una visualización 3D del cuerpo, siendo la Tomografía Computacional una de las herramientas más ampliamente usada en Medicina. El cáncer de mamas representa el 19% de los cánceres en mujeres con casi 350000 casos por año en EEUU y Europa. Los tumores palpables son superiores a 1cm de diámetro desarrollado en un período de 6 a 8 años, pero para tener un diagnóstico 99% más favorable, es necesario detectar tumores de no más de 0,5 cm. Para el caso de mamografías, la detección temprana de microcalcificaciones es clave en la detección de tumores no palpables para el pronóstico del cáncer de mamas. Para poder detectar estas microcalcificaciones se necesitan cuatro imágenes de tamaño oficio de 4000x4000 pixeles generando 128MB por paciente. Debido a la importancia de la información, no se utilizan métodos de compresión con pérdidas. Además, estas imágenes cuentan con problemas de distorsión, ruido de alta frecuencia y ruido del equipamiento de resonancia magnética utilizado. Son necesarios métodos de tratamientos de imágenes para mejorar la calidad de la información basados en detección de formas, movimiento, análisis cruzado de pacientes. La acumulación de estas imágenes junto con más información del paciente proveniente de diferentes análisis hace necesario fusionar la información de manera de entregar real información más que solamente una gran cantidad de datos. Junto con el Reino Unido varios países se han integrado al Programa de Screening Nacional para mamografías de rayos X. El BSP (Breast screening Programme) invita a mujeres entre 50 y 64 años a realizarse un screening cada tres años, logrando la participación de 1,3 millones de mujeres en 92 centros con 230 203 Capítulo VII: Estado del Arte Internacional radiólogos analizando entre 5000 y 20000 exámenes. Este programa ha permitido extender un promedio de 20 años de vida a más de 1000 mujeres por año. Con la creciente necesidad de radiólogos una base de datos mayor ayudaría a capacitar mejor a los especialistas y realizar diagnósticos más rápidos y precisos. El proyecto eDIAMOND busca estandarizar la base de datos de imágenes, revisar la calidad de la imagen según ciertos estándares, tener una fuente de entrenamiento y enseñanza, servir para determinar los casos complejos que enfrentan los radiólogos, y finalmente ser una fuente de información para tratamientos hormonales y riesgo de cáncer de mamas. Los beneficios con claros: •Almacenamiento seguro de la información de los pacientes •Opiniones de diversos especialistas que acceden a la información •Diagnósticos más rápidos por similitud con diagnósticos previamente realizados •disminuir los exámenes por biopsias •Uso del manejo del hospital más eficiente Para ello es necesario generar un middleware adecuado a las necesidades del problema, como descripción ontológica, bases de datos compartidas, compresión y transferencia, seguridad de acceso, técnicas de minería de datos y adecuada a los ambientes clínicos. El Middleware debe tener las siguientes características: •Realizar una transferencia y acceso de datos segura •Desarrollar algoritmos de Minería de Datos que permita obtener casos similares •Crear ontologías para la clasificación adecuada de la información •Realizar pruebas y validaciones “en terreno” La estructura del proyecto consiste en IBM como proveedor de la parte técnica (determinación de escenarios, arquitectura y diseño, uso de productos, seguridad y optimización de la eficiencia (performance), acceso a documentación y capacitación. La red sería una WAN de alta velocidad con servidores de archivos via SAN Storage Area Network con discos y cintas, y un servidor de seguridad y otro de web. Las ubicaciones satélites serán los hospitales, centros de enseñanza donde los datos se recolectan y se cargan en el sistema, cada uno con un servidor principal conectado a 100 Mbps Ethernet con el resto. 204 Capítulo VII: Estado del Arte Internacional Existen otros proyectos Grid en mamografías: como el US NDMA con IBM, de similares características pero con mayor flujo de información. Para datos de rayos X digitalizados, la Universidad de Pennsylvania con IBM están desarrollando un prototipo de acceso rápido y de alta capacidad, “universal database”. MammoGrid con Oxford y CERN, Cambridge, UDINE, Mirada solutions que se concentra en el control de calidad de las imágenes, entrenamiento y pruebas de los sistemas, y avanzar hacia los estudios epidemiológicos. El proyecto Grid Enabled Knowledge Services: Collaborative Problem Solving Enviroments in Medical Informatics busca la resolución de problemas médicos por colaboración centrados en el análisis de tres tipos de información: imágenes, señales y datos del paciente, de manera de determinar rápidamente el tratamiento a seguir. 7.3.2.3.9 GAMOS (EELA-2, CIEMAT, España) http://applications.eu-eela.eu/application_details.php?l=20&ID=33 Esta iniciativa desarrolla herramientas de simulación de Monte Carlo para diseñar sistemas de verificación de imágenes basadas en terapias de radiación. GAMOS es un framework basado en GEANT4. 7.3.2.3.10 GBIO (Laboratory of Bioinformatics and nmR for Structure Lyon, Francia) gbio.ibcp.fr/ws Grid bioinformática dedicada a resolver diferentes problemas relacionados con las bases de datos de gran tamaño. Han participado en proyectos Grid Europeos de los cuales se destacan: •EMBRACE: estandarización de información biológica •EGEE: desarrollo de tecnologías Grid europeas y desarrollo de servicios Grid •GPSA: desarrollo de un portal Grid para análisis de secuencias de proteínas •GriPPS: aplicación Grid de búsqueda de patrones y perfiles de proteínas •RUGBI: Grid bioinformática para apoyar la construcción del genoma humano •Gedeon: administración de datos en Grids •fr-Grid: Grid francesa •DIET: desarrollo de herramientas para construir servidores •Grid5000: construir una Grid con 5000 cpus •RagTimes: Grid para el tratamiento de informaciones médicas 205 Capítulo VII: Estado del Arte Internacional Además de participación en redes científicas de Bioinformática y en un programa de magíster en Bioinformática Molecular y Modelación. 7.3.2.3.11 Grid Bio Portal (EELA-2, UPV, España) Es un portal grid donde se pueden procesar diferentes aplicaciones bioinformáticas corriendo en grid vía una GUI, lo que permite un mejor uso de recursos. 7.3.2.3.12 Grid Enable BLAST (Proyecto de magíster en Francia) www-sop.inria.fr Las anotaciones de secuencias genómicas siguen mostrando un crecimiento exponencial, por lo cual cualquier búsqueda de secuencias se torna cada vez más lenta. Por ello disponer de una versión Grid de BLAST es una interesante alternativa a desarrollar una herramienta que permita prepararse para disminuir el tiempo de cada búsqueda. Las dos maneras de distribuir el trabajo consisten en segmentar la base de datos o bien segmentar la secuencia objetivo. Este proyecto consiste en segmentar ambos, la base de datos y la secuencia objetivo, y utilizar las herramientas de Proactive como middleware de Grid. Esta plataforma está desarrollada en Java y permite realizar computación paralela, distribuida y concurrente. 7.3.2.3.13 Grid – BLAST (Royal Institute of Technology, Suecia) http://kthgridproxy.biotech.kth.se/grid_blast/index.html Los algoritmos de búsqueda de similitudes entre proteínas demandan altos recursos computacionales y las bases de datos siguen creciendo, siendo necesario reprocesar y actualizar la información. El proyecto busca utilizar herramientas Grid para determinar puntajes de identidad de fragmentos comparados con el proteoma humano. El algoritmo de comparación es BLASTp con parámetros por omisión salvo el filtro de baja complejidad, junto con un algoritmo de ventana deslizante de la proteína objetivo. Para el uso por Grid, se utiliza la organización virtual NorduGrid basado en Globus. La implementación del algoritmo se hace con dos scripts Perl: uno como broker y el segundo para el trabajo. 206 Capítulo VII: Estado del Arte Internacional 7.3.2.3.14 GriPPS Grid Protein Pattern Scanning (Proyecto francés) gripps.ibcp.fr Es un proyecto de investigación de interfaz entre la Biología y la Informática en Genómica y arquitecturas distribuidas. La Genómica debe enfrentarse al problema creciente de adquisición de datos. Por otro lado, la Computación Grid permite ayudar a resolver este problema y eso se manifiesta en diferentes proyectos Grid en ejecución. El objetivo del proyecto es adaptar y desarrollar algoritmos bioinformáticos de investigación de lugares u sitios funcionales de proteínas para comprender al genoma y realizar anotaciones en los bancos de datos biológicos internacionales. 7.3.2.3.15 Grid Protein Sequence @nalysis (PBIL NPS, Lyon) gpsa-pbil.ibcp.fr Utilizando la infraestructura de la Grid europea EGEE, se propone desarrollar el portal web Grid Protein Sequence Analysis para proveer una interfaz amigable para el uso de recursos genómicos Grid del proyecto EGEE. Se propone portar un experimento del servicio NPSA. 7.3.2.3.16 HA-HELIX (DEISA, Università degli Studi di Torino, Italy) http://www.deisa.eu/science/deci/projects2009-2010/HA-HELIX Proyecto asociado al proyecto GRID Distributed European Infrastructure for Supercomputing Applications (DEISA) orientado a la simulación del plegamiento de péptidos inducida por materiales inorgánicos. El objetivo del trabajo es analizar los procesos de plegado, tales como la conformación del péptido después de la adsorción o la superficie de sitios de unión del péptido. 7.3.2.3.17 MEGASIM (Cambridge University, UK) http://www.deisa.eu/science/deci/projects2009-2010/MEGASIM El objetivo es analizar la dinámica RMN con métodos de muestreo y MD para obtener un marco de base experimental para el estudio a gran escala de las transiciones conformacionales de biomoléculas. Este utiliza las infraestructuras de cómputo proporcionado por DEISA para estudiar el efecto de las mutaciones en la interacción natural de la dinámica de activación de las quinasas, plegamiento y agregación de proteínas, con el fin de mejorar la comprensión del cáncer y otras patologías 207 Capítulo VII: Estado del Arte Internacional Molecular Modelling and Grid Computing (BIo-ICT, Italia) www.cnr-bioinformatics.it Se busca comprender las propiedades funcionales y físico-químicas de las proteínas participantes de los procesos patológicos y sus variantes. Se desarrollarán herramientas basadas en HPC y Computación Grid para revisar las librerías de interferencias metabólicas con actividad farmacológica potencial. Se focalizará el trabajo en la modelación de variantes naturales de la proteína C relacionada con la inflamación celular y apoptosis, la predicción de la interacción entre receptores hormonales esteroidales y simulaciones de docking molecular endocrino para conocer el impacto de sustancias exógenas. 7.3.2.3.18 TotalEnz (University of Bristol, School of Chemistry, Bristol, UK) http://www.deisa.eu/science/deci/projects2009-2010/TotEnz2 El proyecto de TotalEnz DEISA tiene el propósito de investigar la catálisis enzimática y su dinámica para calcular los “mapas de la catálisis”, a partir de organismos adaptados a diferentes condiciones físicas. Las enzimas son eficientes catalizadores naturales, y la comprensión de los mecanismos por los que logran estas propiedades catalíticas son importantes al momento de estudiar nuevos fármacos; análisis de los efectos de la variación genética y mutación, y en el diseño de nuevos catalizadores. Por esta razón, existe un gran interés en el desarrollo de catalizadores de proteínas para las aplicaciones en las industrias farmacéutica, química y biotecnología. La combinación de algoritmos y programas informáticos modernos con los recursos de cómputo de DEISA dan un potencial para calcular cientos de perfiles de catalizador que permitirán la creación de completos mapas de la catálisis enzimática. 7.3.2.3.19 GenocodisGrid (EELA 2, UCM, España) http://genecodis.dacya.ucm.es GeneCodis es una herramienta basada en grid que integra diferentes fuentes de información biológica para la búsqueda de características biológicas (anotaciones), que a menudo co-ocurren en un conjunto de genes y que son clasificadas según su importancia estadística. Puede ser utilizado para determinar las anotaciones biológicas o combinaciones de anotaciones que se asocian significativamente a una lista de los genes en estudio con respecto a una lista de referencia. 208 Capítulo VII: Estado del Arte Internacional 7.3.2.3.20 Phylogenetics (EELA-2, UPV, España) http://applications.eu-eela.eu/application_details.php?l=20&ID=39 La necesidad de contar con filogenias utilizando diferentes algoritmos permite a la aplicación grid correr trabajos de manera independiente y distribuida. 7.3.2.3.21 Phylogrid (EELA-2, CEIMAT, España) http://applications.eu-eela.eu/application_details.php?l=20&ID=43 Se desarrolla un workflow para calcular filogenias utilizando MrBayes tool. Se puede definir parámetros y determinar el modelo evolutivo. 7.3.2.3.22 Proyectos EGEE Una serie de proyectos EGEE involucran aplicaciones biomédicas. Entre ellos se destacan: •WISDOM descubrimiento de fármacos acelerando el proceso de búsqueda por medio de herramientas grids. Se realiza docking computacional sobre un conjunto de compuestos químicos para anclarse (dock) a una proteína. •GATE aplicación de tomografía médica y planificación de radioterapias. •CDSS (Clinical Decisions Support System): aplicación de ayuda a la toma de decisiones médicas en base a condiciones del paciente. • Docking Platform for Tropical Diseases aplicación para el descubrimiento de fármacos acelerando la búsqueda. •gPTM3D método grid para recolectar, producir y analizar imágenes 3D de órganos humanos para ayudar a los cirujanos en el diagnóstico de enfermedades tipo cáncer. •SiMRI3D simulador paralelo de imágenes de resonancia magnética produciendo imágenes 3D de los escáners médicos. •Xmipp_MLrefine es una herramienta de limpieza de imágenes de estructuras moleculares provenientes de microscopios electrónicos. •GridGRAMM permite análisis de docking molecular por medio de un portal grid, lo que permite desarrollar otras aplicaciones. •GROCK (Grid Dock) permite el análisis de interacciones moleculares. •SPLATCHE (SPatiaL And Temporal Coalescences in Heterogeneous Environment): analiza el movimiento humano en un área geográfica para reconstruir datos demográficos basados en el desarrollo genético •Xmipp_assign_multiple_CTFs (Micrographia Contrast Transfer Function calculation) es otra aplicación para limpiar imágenes de microscopio 209 Capítulo VII: Estado del Arte Internacional electrónico por medio de la ‘Contrast Transfer Function’ (CTF). •Pharmacokinetics es una aplicación para el estudio de la difusión de agentes en registros de resonancia magnética abdominal. 7.3.2.4 Otras Iniciativas 7.3.2.4.1 1. CEPAR y CEPort (Grid Computing; F. Berman, G. Fox & A. Hey, Wiley, 2003, 1002 pg.) La base de los estudios realizados tanto por bioquímicos como biólogos moleculares consiste en comprender los procesos biológicos regulados por proteínas. Sus estructuras 3D se obtienen por costosos y extensos experimentos, por lo cual no es posible contar con la información estructural de todas las proteínas secuenciadas a la fecha. Es por ello que se recurre a la comparación por homología, donde se busca una proteína con estructura tridimensional de similar secuencia de aminoácidos y se infiere que su estructura será similar. Los algoritmos utilizados para dicha comparación consisten generalmente en aproximaciones heurísticas que buscan soluciones aproximadas. Para este caso se propone un método exacto de comparación que requiere de altas capacidades computacionales. Utilizando el Blue Horizon 1.7 Teraflop en el SDSC, se han realizado entre 5 a 10.000 comparaciones mensuales, publicados en más de 80 publicaciones. CEPAR es un algoritmo escalable en redes que realiza distribuidamente el algoritmo utilizado en Blue Horizon. Para poder optimizar el algoritmo en redes se procedió a las siguientes mejoras: • • • • La asignación de paquetes de datos se almacenaron con anterioridad El procesador maestro prioriza los mensajes de petición de trabajo Los procesadores se detienen si la comparación detecta que no será exitosa Optimizaciones de un procesador se aplican al procesador maestro En estas mejoras consiste CEPAR, el cual fue paralelizado con MPI que permite una fácil gridificación. Por esta razón se han creado portales Grid para ejecutar este programa de manera eficiente en el SDSC a través de http;//Gridport. npaci.edu/CE/ cuando los recursos están disponibles y con middleware Grid desarrollado por ellos, el GridPort Toolkit. Este middleware permite acceso seguro y encriptado, separación entre el cliente y el servidos, acceso a diferentes recursos computacionales, disponibilidad de monitoreo en tiempo real y se pueden agregar nuevas componentes. Esto requiere implementar y administrar un buen sistema 210 Capítulo VII: Estado del Arte Internacional de archivos distribuido, archivos de entrada de usuarios, trabajos en cola y envío de resultados. Además, se actualiza frecuentemente la base de datos de proteínas en cada máquina y se asegura la transparencia al usuario. Se recomienda utilizar un Storage Resource Broker, SRB, para realizar una administración de archivos compartida y centralizada. En el caso de modelación de estructuras y estudio de la dinámica molecular, el GridPort se ha utilizado para crear un portal para este problema. GAMESS (General Atomic Molecular Electronic Structure System) además éste contiene un SRB y a Globus como distribuidor y monitor de trabajos. Los desarrolladores de middleware deben tener en consideración los siguientes desafíos: •Desarrollar un mejor manejo de datos •Entregar servicios de portabilidad •Visualizar los futuros cambios en tecnologías Grid •Trabajar en conjunto con investigadores para desarrollar mejores aplicaciones 7.3.2.4.2 The Virtual Laboratory Project (WEHI and Monash U., Melbourne) www.buyya.com/vlab Buscan desarrollar tecnologías Grid para resolver problemas de gran escala e intensivos en datos del Chemical Data Bank. Las herramientas de software son: •Herramientas DOCK para modelación molecular •Herramientas Nimrod/enFusion para modelación de parámetros •Broker Grid Nimrod-G •Herramientas de acceso y administración del Chemical Data Bank como creación de índice, catálogo, servidor, broker, clientes. •Middleware Globus 7.3.2.4.3 Comb-e-chem (Reino Unido) www.combechem.org Uno de los problemas más complejos de la Química Computacional es probar nuevas combinaciones de unidades moleculares conocidas y de manera rápida. 211 Capítulo VII: Estado del Arte Internacional La Química Combinatorial se encarga de atacar este problema y ha mostrado resultados en la industria de los semiconductores y la industria farmacéutica. La idea inicial es crear una reacción que une dos componentes, cada una con dos áreas reactivas, lo cual puede producir cadenas de componentes. El proceso se repite obteniendo una gran cantidad de compuestos. Combinando de cierta manera también se pueden producir films. El desarrollo de moléculas inorgánicas ha permitido que la base de datos del Cambridge Crystallographic Data Center de estructuras cristalográficas por rayos X vaya en aumento en comparación al caso de moléculas orgánicas. El proyecto Comb-e-Chem empezó por definir un mecanismo de intercambio de información: cML Chemical Markup Language (www.xml-xml.org). Las necesidades de visualización de resultados, el manejo por mouse de aplicaciones hace que el desarrollo de aplicaciones deba mantener estas características de fácil uso para los químicos. Para evaluar las propiedades moleculares, se utiliza un software de Mecánica Cuántica que recibe este archivo (junto con información de parámetros) y entrega propiedades como energía, RMSV variación cuadrática media de las coordenadas, concentración, presión, etc. Para acelerar la evaluación de las combinaciones, se propone utilizar un diseño de experimentos que comience con un número menor pero representativo de las combinaciones. La Grid permite trabajar con esta librería y extender el laboratorio a trabajo de simulación y obtención de materiales sintéticos, comunicación en tiempo real para desarrollar experimentos de manera segura en ambientes colaborativos. 7.3.2.4.4 BioCoRe (University of Illinois, EE.UU) www.ks.uiuc.edu/Research/biocore BioCoRE es un entorno de trabajo colaborativo para la investigación biomédica, la gestión de la investigación y la formación. BioCoRE ofrece a los científicos una interfaz para una amplia gama de tecnologías locales y remotas, herramientas específicas y generales, datos y soluciones de visualización. Para aprovechar y perfeccionar las capacidades de colaboración a través de límites temporales y materiales en la investigación y la formación, BioCoRE se basa en el uso transparente y la comunicación entre los recursos tecnológicos (hardware y software) y bases de datos. 212 Capítulo VII: Estado del Arte Internacional 7.4 Apoyo de la e-infraestructura en la investigación La principal atracción de los proyectos grids ha sido potenciar la investigación por medio de la colaboración. En la mayoría de los casos de iniciativas grids universitarias (grupos de investigadores desarrollando aplicaciones para resolver un problema enmarcado en una aplicación) solamente se ha podido publicar el artículo de la iniciativa o bien preprints y conferencias de difusión en escasa cantidad. Por ejemplo, el proyecto Squid solamente realizó una publicación en BMC Bioinformatics 2005, 6, 197. En el caso de las iniciativas europeas EGEE y EELA-2, ambos proyectos han sido más exitosos en su desarrollo científico. Para EGEE, el informe BioGrid White Paper muestra que se publicaron 23 artículos en revistas y se desarrollaron 19 presentaciones en conferencias. En el caso de EELA-2, su página web muestra que han editado proceedings con un total de 75 publicaciones entre artículos y presentaciones en conferencias. Para las grid nacionales como Comb-e-chem, los resultados de investigación son alentadores y se han reportado 63 publicaciones. Otro caso de grid nacional es el del proyecto eDiamond de prevención de cáncer mamario con 28 publicaciones. 7.5 Visión Futura Las iniciativas grid internacionales son numerosas y resuelven diversos problemas en el área de las Biociencias. Su experiencia resulta muy valiosa para realizar experimentos de instalación y uso, así como motivar la creación de nuevas aplicaciones grids. Por otro lado, el aporte a la investigación que han realizado las iniciativas de colaboración en grids nacionales o continentales (europeas, realmente) muestra que el trabajo en equipo potencia la investigación y se puede constatar el las numerosas publicaciones desarrolladas en este tipo de iniciativas. Además, el recurso humano generado así como la infraestructuras grids instaladas permiten el desarrollo de otras redes colaborativas que pueden potenciar aún más la investigación. 213 Capítulo VII: Estado del Arte Internacional Es claro que el apoyo coordinado de gobiernos e instituciones internacionales de investigación (como el FP6 de la Unión Europea) son necesarios para contar con un financiamiento base para la creación de la red el cual queda completamente justificado con compromisos de desarrollo de investigaciones. Dadas las necesidades nacionales de investigación y desarrollo en Biociencias junto con los generosos aportes actuales al financiamiento de iniciativas colaborativas, como los Núcleo Milenio y Financiamiento Basal, muestran que es posible desarrollar en Chile iniciativas de desarrollo de aplicaciones grids en diferentes áreas de la investigación nacional. La participación de universidades chilenas en proyectos internacionales muestra una ventaja comparativa para el desarrollo de una grid nacional, potenciando el trabajo colaborativo y posicionándonos internacionalmente para poder integrar un mayor número de iniciativas grids internacionales exitosas, las cuales generalmente requieren de capacidades instaladas. Una grid nacional permitirá que tengamos infraestructura de primer nivel para fortalecer las colaboraciones que en sinergia permitan aumentar las capacidades de I+D nacionales, así como generar mayor recurso humano capacitado. De los costos de generar una gris nacional, si proyectamos los costos de las grids europeas como EGEE, un proyecto de 24 meses para 10 instituciones con 6.000 cores y 1PB de disco debería costar alrededor de un millón de euros de financiamiento estatal y un millón de euros en aportes de las instituciones considerando aproximadamente 400 personas involucradas. 214 Capítulo VIII: Estado del Arte Nacional 8 Capítulo VIII: Estado del Arte Nacional 8.1 Investigación y Colaboración Los proyectos grid en Biociencias llevan pocos años en Chile y se han caracterizado en dos fases: una primera fase de colaboración internacional accediendo a proyectos europeos y una segunda fase en el desarrollo de proyectos nacionales de colaboración grid. A pesar de esto, no ha habido un gran desarrollo en el área de Biociencias debido que para acceder a grupos internacionales es necesario contar con capacidades de desarrollo de grid (recurso humano capacitado para la instalación y mantenimiento de middleware, desarrollo de aplicaciones, etc.) y recursos computacionales ociosos para compartir. Por otro lado, además de los problemas clásicos de coordinación entre las instituciones de investigación quienes prefieren fomentar la colaboración internacional v.s. la colaboración nacional. Cabe mencionarse que la investigación nacional se concentre alrededor de la Región Metropolitana y la competencia histórica entre las universidades con mayor investigación, U. de Chile y la P.U.Católica, dificulta el desarrollo de colaboración con el resto de las universidades. En general, son las universidades con menor investigación y localizadas fuera de la influencia de la Región Metropolitana quienes se muestran más interesadas en desarrollar colaboraciones que apoyen los pequeños grupos de investigación como lo muestra el proyecto CLGrid. A modo de 215 Capítulo VIII: Estado del Arte Nacional ejemplo, el año 2005 en el proyecto Fondef D02I1054 Servicios y Aplicaciones de Alto Rendimiento Sobre Redes de Tercera Generación se desarrolló el primer piloto grid basados en Globus 3.0 entre la Universidad de La Frontera y REUNA, donde fue posible el envío de trabajos en torno a una aplicación bioinformática entre dos nodos de dos servidores. Para potenciar el desarrollo de grid en el área de Biociencias es necesario: •Difundir experiencias internacionales exitosas de grids en Biociencias que motiven la cooperación entre instituciones de investigación. •Contactar expertos internacionales que permitan una rápida implementación de aplicaciones grids exitosas en la investigación. •Capacitar recurso humano que permita generar nodos grids en las diferentes instituciones y crear nuevas aplicaciones, así como poder disponer de equipamiento no exclusivo para poder generar la grid computacional (laboratorios docentes en fines de semana o durante la noche). •Crear redes de cooperación entre universidades regionales que potencien su investigación, pues son estas universidades las que necesitan aumentar su trabajo, lo que les permitirá estar mejor posicionada para competir por los recursos públicos. •Asociarse con la Universidad de Chile o la P. Universidad Católica de Santiago para potenciar las redes de investigación. En algunos casos ex-alumnos de estas universidades están trabajando en universidades regionales lo que facilitaría una asociación, pues estas universidades privilegian las redes internacionales. •Concursar a fondos públicos para la creación de proyectos grids en diferentes áreas de investigación Estas ideas nos permiten visualizar un gran potencial de desarrollo de grids para las Biociencias. 216 Capítulo VIII: Estado del Arte Nacional 8.2 Instituciones y/o grupos de investigación a nivel nacional En el área de Bioinformática, en Chile se generó una pequeña red con cuatro instituciones principales: •Centro de Bioinformática y Simulación Molecular, U. de Talca •Centro de Bioinformática, P. Universidad Católica de Santiago •Centro de Bioinformática y Biología Genómica, U. Andrés Bello y Fundación Ciencia para la Vida •Laboratorio de Bioinformática y Matemática del Genoma, U. de Chile Éstas lograron realizar talleres científicos y desarrollar altas capacidades computacionales para la investigación. Sin embargo, solamente las tres primeras han podido avanzar en el desarrollo de una grid colaborativa en el tema de educación de biología por medio del proyecto Fondef TIC-EDU TE08I1021 Sistema de Aprendizaje Colaborativo basado en Infraestructura Grid (SACGRID). En el área de Modelación y Simulación Molecular, la investigación de primer nivel la ha liderado el CBSM de la U. de Talca, quienes han promovido esta técnica en el país. Por el lado de la Química Computacional, existen diferentes grupos pero se alejan del área de Biociencias acercándose más a los Nanomateriales y Química Orgánica. En el área de Biomedicina, existe una gran cantidad de investigación basada en laboratorios de tratamiento de muestras donde la componente computacional no tiene cabida. Considerando que en proyectos internacionales se comparten datos (exámenes, análisis, etc.) como equipamiento, ésta es un área potencial de desarrollo de grids en la cual se puede potenciar a los grupos de investigación, en particular cuando los datos son escasos, por ejemplo en tratamiento de cánceres. En el caso de colaboración internacional, el CBSM de la U. de Talca participa de un ambicioso proyecto europeo de grid, Action-Grid www.action-grid.eu cuyos objetivos son la Nanoinformática, Nanomedicina, Informática Biomédica, Tecnologías Grid y Nanotecnología. Su objetivo principal es reutilizar y transferir tecnologías grid para la Informática Biomédica a America Latina, Los Balcanes Oeste y África del Norte. 217 Capítulo VIII: Estado del Arte Nacional Otra iniciativa con recientes resultados ha sido la participación de la Universidad Técnica Federico Santa María en el proyecto EELA-2, quienes han invitado a la Universidad de La Frontera al desarrollo de una aplicación grid para el procesamiento de imágenes GRIP applications.eu-eela.eu Esta aplicación ayuda a encontrar estructuras y patrones para un mejor diagnóstico y tratamiento temprano de enfermedades. 8.3 Identificar las áreas científicas que se trabajan en Chile Para el caso de grids nacionales, la primera iniciativa de un proyecto grid en Biociencias es el Fondef TIC-EDU TE08I1021 Sistema de Aprendizaje Colaborativo basado en Infraestructura Grid (SACGRID), cuyo objetivo es el desarrollo de juegos de biología basados en plataformas grid donde tanto middleware como altos recursos computacionales están disponibles para los alumnos de escuelas donde la meta es llegar a 200.000 estudiantes en línea. El área más directa de aplicación del proyecto es la Educación a través de la innovación en las metodologías del aprendizaje, lo cual aleja a esta iniciativa del área de Biociencias. Una segunda iniciativa es el proyecto Corfo Uso Colaborativo de Recursos de Alto Valor UCRAV que pretende mejorar la investigación por medio del uso compartido de seis equipos a través del levantamiento de un servicio grid. Las áreas de aplicación del proyecto contemplan Biología Molecular, Estructuras Moleculares, Química Orgánica e Inorgánica y Biología Celular. Del punto de vista de las posibles colaboraciones a formar, de los proyectos internacionales podemos destacar que potenciales grupos son los proyectos que involucran a varias instituciones y un número importante de investigadores en un área en particular. Referentes a las Biociencias sugerimos: •Instituto de Ciencias Biomédicas, icbm.cl y sus redes de colaboración. •Centro de Bioinformática y Simulación Molecular, cbsm.utalca.cl, y sus redes de investigación. •Centro de Biotecnología, Universidad de Concepción y su red nacional e internacional www.centrobiotecnologia.cl 218 Capítulo VIII: Estado del Arte Nacional 8.4 Productividad e impacto Científico Debido a lo nuevo de las iniciativas nacionales, no se ha reportado el impacto de las tecnologías grid. El proyecto UCRAV declara que su objetivo es entregar un acceso más equitativo de instrumental científico que ayude al desarrollo de investigaciones científicas. En el caso de la colaboración internacional en Action-Grid, el sitio muestra tres publicaciones pero no están relacionadas con la Universidad de Talca, sino que con la U. Politécnica de Madrid. Para el caso de EELA-2, no hay publicaciones reportadas referentes a éste. 8.5 Iniciativas en las áreas de Biociencias 8.5.1 Proyecto UCRAV Se logró levantar una grid computacional para el manejo de instrumental científico de diferentes instituciones socias (Universidad Católica del Norte, Universidad de Atacama, Universidad Tecnológica Metropolitana, Universidad de Chile y la Universidad de Concepción) coordinados a través de REUNA que además presta servicios a universidades y empresas. El equipamiento es principalmente para el análisis molecular tanto de productos orgánicos como inorgánicos, permitiendo avances en áreas de la Biología Molecular, Biología Celular, Nanotecnologías, entre otras. Estos equipamiento pertenecen a laboratorios que realizan docencia de pre y postgrado, y que cuentan con personal capacitado para su uso, así como entrenados en tecnologías grids. Con una mayor difusión, el proyecto podrá utilizarse para colaboraciones científicas, como estudio de estructura de proteínas, y también en el desarrollo de la industrian biotecnológica nacional donde el uso de nuevos productos permite mejorar las capacidades productivas, por ejemplo, en el desarrollo de biofilms y fármacos. 219 Capítulo VIII: Estado del Arte Nacional 8.5.2 SACGRID Este proyecto se focaliza en técnicas de aprendizaje por lo que el mayor área de impacto es la Educación. Está fuertemente ligado a la docencia escolar y como subproducto se obtendrán capacidades computacionales de alto nivel para desarrollar Simulaciones Moleculares, así como tecnologías grids para el uso colaborativo de recursos. Debido a que está orientado a estudiantes de enseñanza media, el diseño de interfaz gráfica permitirá potenciar estos recursos como plataforma grid de fácil uso. Su impacto se remite principalmente la ámbito público a través de fortalecer el aprendizaje colaborativo basado en la indagación. 8.5.3 ACTION-GRID A pesar de no ser un proyecto nacional, sus objetivos contemplan la posibilidad de extenderse al resto de la comunidad. Por medio de la participación del CBSM es posible conocer la experiencia del proyecto y proponer transferir dicha experiencia al ámbito nacional. Debido a su importancia, la Informática Biomédica es un área en la cual no existen grids colaborativas nacionales y permitiría el desarrollo de una temática de gran relevancia nacional. 8.5.4 EELA-2 Este proyecto de colaboración internacional posee una aplicación desarrollada en Chile entre la colaboración de la Universidad Técnica Federico Santa María y la Universidad de La Frontera. GRIP (Grid Image Processing for Biomedical Diagnosis) es una aplicación grid de Biomedicina orientada en la búsqueda de patrones en imágenes biomédicas, en particular de la detección de núcleos cancerigenos en células de tejido mamario bajo técnicas inmonohistoquímicas. Estudiantes de pregrado se han capacitado en las escuelas EELA en técnicas grids y han podido colaborar en el desarrollo de las aplicaciones. Sus usos potenciales permiten que médicos puedan acceder a análisis de imágenes que le ayudan a tomar decisiones por medio de un mejor diagnóstico. Debido a su característica experimental, aún no se ha implementado a nivel de investigación y se espera que el proyecto EELA-2 sirva para extender sus posibilidades de uso. 220 Estrategia Capítulo IX: Necesidades futuras de Tecnologías de Información en Chile 9 Capítulo IX: Necesidades futuras de Tecnologías de Información en Chile 9.1 Introducción El objetivo de este capítulo es determinar los nichos que requerirán a futuro mayor demanda de tecnologías de información desde el punto de vista país. Chile se ha ido posicionando como localización atractiva en el campo de servicios tecnológicos y es un gran desafío seguir generando las condiciones que permitan atraer inversiones en actividades intensivas en conocimiento. El mundo está sujeto en la actualidad al impacto de revoluciones tecnológicas de amplio impacto: la de las Tecnologías de la Información y las Comunicaciones (TIC), la de las biotecnologías y, más recientemente, la de las nanotecnologías, cada cual en una fase distinta de desarrollo. En el caso de las TIC, la evidencia existente indica que el sistema productivo nacional aún no hace aprovechamiento pleno de las ganancias de productividad que permite el uso de estas tecnologías. Por otra parte, está emergiendo una nueva constelación de innovaciones ligadas a las tecnologías inalámbricas o el software embebido, que pueden multiplicar varias veces esas ganancias de productividad. De allí la necesidad de continuar promoviendo una adopción extendida de estas tecnologías en distintos ámbitos de nuestra sociedad y, especialmente, a nivel de nuestros principales sectores de exportación. 223 Capítulo IX: Necesidades futuras de Tecnologías de Información en Chile El Banco Mundial, en su informe “De los Recursos Naturales a la Economía del Conocimiento: Comercio y Calidad de Empleo“, afirma con fuerza que las actividades que se basan en recursos naturales bien pueden ser industrias con uso intensivo de conocimiento y, por lo mismo, con capacidad para impulsar el crecimiento durante mucho tiempo. Para sostener esta posición, cita varios casos ejemplares. En primer término, comenta que es imposible sostener que Australia, Canadá, Estados Unidos, Finlandia y Suecia no basaron su desarrollo en sus recursos naturales. De hecho, inclusive hoy son exportadores netos de productos basados en ese tipo de recursos, junto con productos de alta tecnología. De acuerdo al informe de Competitividad Global del World Economic Forum (WEF), la preparación tecnológica, que mide la agilidad con la que una economía es capaz de adoptar tecnologías existentes que mejoren la productividad industrial, se muestra bastante débil en nuestro país. La preparación tecnológica resulta especialmente relevante en una economía como Chile que, en general, no está en la frontera tecnológica y que, por lo tanto, puede beneficiarse de la adopción de tecnologías extranjeras. De esta manera, es importante aprovechar la posición respecto de la frontera tecnológica e innovar a través de la adopción y adaptación de nuevas tecnologías, lo que sin duda requiere de la disponibilidad de una base tecnológica nacional. Si bien en ciertos aspectos asociados a este factor el desempeño es destacable, como legislación en TIC>s (ranking 24) y el nivel de IED (Inversión Extranjera Directa) y transferencia tecnológica (ranking 24), otros aspectos se presentan bastante débiles y son los que explican la posición 35 de Chile en este factor: por ejemplo, cantidad de computadores (posición 44), usuarios de Internet (41) y absorción tecnológica a nivel de la firma (33). Con respecto a la innovación, Chile tiene un mal desempeño en el área principalmente por la provisión de productos tecnológicos por parte del gobierno (ranking 54), la capacidad de innovar en el país (ranking 50), la calidad de las instituciones científicas (ranking 48), el nivel de gasto en I+D en la empresa (ranking 48) y la protección a la propiedad intelectual (ranking 45). Como base para este estudio se utilizarán los informes desarrollados por el Boston Consulting Group para el Consejo Nacional de Innovación para la Competitividad. Estos documentos son la base de la nueva estrategia de desarrollo basada en los clusters con mayor potencial en el país y que permitan retomar los ritmos de crecimiento de comienzo de los 90. 224 Capítulo IX: Necesidades futuras de Tecnologías de Información en Chile 9.2 Determinación de las industrias en estudio 9.2.1 La elección de un camino. Una pregunta fundamental respecto de la innovación es cuál de las sendas que se nos ofrecen es la que debemos tomar, teniendo en cuenta que no podemos ser buenos en todo. En este punto fundamental existen dos opciones extremas: •Una afirma que existen algunos sectores donde se concentra la posibilidad de innovar y ser más competitivos, y que son esos los que debemos elegir, sin importar con qué ventajas podamos partir en ellos o cuánto esfuerzo nos puede costar alcanzar los niveles de productividad que nos permitan competir en las ligas mundiales. •La otra, que ha dominado la acción pública durante los últimos decenios, es la neutralidad, esto es, que el mercado irá contestando naturalmente las preguntas relativas a dónde deberemos concentrar nuestros esfuerzos. No apostar a nada entraña el riesgo de sacrificar el desarrollo de algunos sectores en los que el país podría tener ventajas especiales, pues se pierde la oportunidad de moverse a tiempo para llegar a competir exitosamente en el mundo, por el hecho de no proveer oportunamente ciertos insumos que son fundamentales para lograr tal desarrollo. Tal como reconoce la OCDE (Organisation for Economic Co-operation and Development), en la transición hacia un mayor crecimiento impulsado por la innovación, Chile debe aprovechar sus fortalezas y ventajas comparativas mediante el fortalecimiento de aquellos clusters incipientes, principalmente, aunque no exclusivamente, basados en recursos naturales, con el fin de desarrollar prácticas innovadoras que ayuden a transformar en ventajas dinámicas las actuales ventajas estáticas de la economía chilena. Por ello, la propuesta del Consejo de Innovación, y en la cual nos basaremos para este estudio, apunta a incentivar fuertemente el desarrollo empresarial, la formación de capital humano y la investigación (básica y aplicada) considerando la especificidad de aquellos sectores que sean promesa de un mayor desarrollo para el país, con un fuerte impacto en innovación, como son hoy la acuicultura y la minería, ya constituidos y muy fuertes, o la naciente oportunidad que nos dan las nuevas tecnologías de la información para ofrecer desde Chile servicios profesionales de alto valor a empresas localizadas más allá de nuestras fronteras. 225 Capítulo IX: Necesidades futuras de Tecnologías de Información en Chile 9.3 El Consejo Nacional de Innovación para la Competitividad El Consejo Nacional de Innovación para la Competitividad es un organismo público-privado que actúa como asesor permanente del Presidente de la República Su objetivo es asesorar a la autoridad en la identificación y formulación de políticas referidas a la innovación y la competitividad, incluyendo los campos de la ciencia, la formación de recursos humanos y el desarrollo, transferencia y difusión de tecnologías. El Consejo ha tenido como objetivo prioritario la elaboración de la estrategia nacional de innovación para la competitividad que oriente el desarrollo del país durante la próxima década. En el segundo volumen de su informe «Hacia una estrategia nacional de Innovación para la Competitividad» el Consejo entrega sus recomendaciones sobre cómo debe actuar el Estado en cada uno de los tres pilares de la innovación (Capital Humano, Ciencia e Innovación Empresarial) y cómo debe organizarse para cumplir estas tareas de manera oportuna y armónica, teniendo siempre como objetivo final que el sector privado maximice su potencial en beneficio del desarrollo del país. El volumen incluye, además, propuestas de acción concretas para el desarrollo de siete clusters y definiciones más específicas sobre la modernización institucional requerida para la innovación y la competitividad. Buscar el desarrollo de la Economía del Conocimiento y la diversificación en Chile mediante el potenciamiento de los clusters hoy existentes o nacientes (principalmente ligados a recursos naturales) se fundamenta en que estos conglomerados han sido definidos como “fábricas de competitividad”, pues tienen tres características: •Enfocan mejor las necesidades de los clientes que son el corazón de la ventaja competitiva, al estar organizados alrededor de clientes y usos finales. •Crean mercados más eficientes y menores costos de transacción (por ejemplo, costos de búsqueda) para todos los jugadores del cluster y, por ello, dinamizan la productividad. •Son centros de innovación, simultáneamente por la extrema rivalidad que se da en algunas áreas y por la cooperación fluida que se produce en otras. 226 Capítulo IX: Necesidades futuras de Tecnologías de Información en Chile 9.4 Los siete sectores elegidos De entre más de 100 sectores con alto potencial de crecimiento en el mundo, se llegó a una lista con los 33 sectores más prometedores para Chile, en relación con el esfuerzo requerido para capturar ese potencial. Todos ellos tienen alto potencial, pero como los recursos no son ilimitados, era necesario identificar y priorizar los once sectores que estaban en el tope de la lista, considerando tanto su impacto directo en el crecimiento como su potencial de encadenamientos (o conformación de clusters) que pudieran tener un efecto más amplio en la economía. Los sectores priorizados fueron: Acuicultura, Offshoring, Turismo, Fruticultura, Minería del Cobre, Alimentos Procesados, Servicios Financieros, Logística y Transporte, Porcicultura-Avicultura, Comunicaciones y Construcción. Serv. medio ambiente Alto Outsourcing Industriales creativas Crecimiento PIB emn 10 años Potencial de Crecimiento (%) billón de pesos Alimentos procesados de consumo humano Sectores que se destacan Vitivinicultura Comunicaciones Horticultura primaria Medio Acuicultura Servicios financieros Plástico Plataforma de negocios para L.A . Farmacéutica Medicina especializada Consultoría Educación superior Logística y transporte Alimentos para Bovino consumo animal y ovino Lácteo Industria Química Productos de madera Bajo Metalurgia Alto Medio Fruticultura primaria Porcicultura y avicultura Minería no metálica Construcción Comercio minorista Minería cobre y subproductos Turismo Silvicultura Celulosa y papel Bajo Esfuerzo para lograr la competitividad necesaria Fuente: Boston Consulting Group Figura 13. Análisis del potencial de crecimiento de 100 sectores económicos chilenos 227 Capítulo IX: Necesidades futuras de Tecnologías de Información en Chile De ellos, el Consejo seleccionó los primeros siete para ser estudiados en profundidad durante 2007, con el fin de proponer al Ejecutivo una “apuesta selectiva” en el marco de la Estrategia Nacional de Innovación. Adicionalmente y una vez seleccionados los sectores, se procedió a identificar las plataformas habilitadoras, de carácter transversal, más relevantes para el desarrollo del conjunto de los sectores priorizados. Según datos de la industria141, la participación de la industria TIC como oferentes de los clusters priorizados es baja, y sólo un pequeño porcentaje de las empresas de software se enfocaron al mercado exportador -agricultura, pesquero, forestal y minero. 9.5 Requerimientos de TIC de los siete clusters privilegiados Una de las grandes tareas para los próximos años será el incremento de la productividad de las empresas a través de un gran esfuerzo de difusión, adaptación y adopción tecnológica que les permita asimilar las mejores prácticas productivas presentes en Chile y el mundo y les brinde la posibilidad de incorporarse al ámbito de la innovación El área de Tecnologías de Información y Comunicaciones (TICs) busca promover y apoyar el desarrollo y uso de las nuevas tecnologías de información y comunicaciones, del comercio electrónico e Internet en los negocios. Las tecnologías de información y comunicación representan uno de los principales motores de la productividad y del crecimiento económico a nivel mundial. En la siguiente figura se pueden observar las megatendencias globales que tienen un alto impacto en los clusters nacionales: 141 228 Estudio Estrategia competitiva para la industria TIC, ACTI Capítulo IX: Necesidades futuras de Tecnologías de Información en Chile Fuente: Boston Consulting Group Figura 14. Megatendencias globales En el siguiente acápite se realizará un análisis de los requerimientos de tecnologías de información y comunicación de los siete clusters privilegiados por el Consejo de Innovación de acuerdo a lo visto en la sección anterior. 9.6 Offshoring Offshoring es una de las principales megatendencias en el mundo de los negocios. Es una de las industrias más dinámicas, con un crecimiento esperado de 40% anual, llegando a US$ 280 mil millones en 2010142. La oferta de servicios de offshoring está comenzando a diversificarse geográficamente, dada la necesidad de contar con plataforma multi-país para atender necesidades de clientes (husos horarios, combinación de on y offshore, variedad idiomática y cultural). El requerimiento principal es la oferta de recursos 142 Fuente: IDC “Worldwide and U.S. Business Process Outsourcing 229 Capítulo IX: Necesidades futuras de Tecnologías de Información en Chile humanos calificados. En esta diversificación geográfica, América Latina tiene una gran oportunidad de crecimiento apalancando su condición de plataforma nearshore para el mercado de Estados Unidos. 9.6.1 Requerimiento de TIC Este cluster es el que tiene un mayor requerimiento de tecnologías de información, ya que el offshoring en esta área representa el 15% del monto del total mundial, estimándose en US$43,2 mil millones al 2010. Los requerimientos son principalmente aplicaciones, ganando sofisticación con el tiempo, por ejemplo: •Solución de Y2K. •Desarrollo de aplicaciones. •Mantenimiento de aplicaciones. oLegacy oPackage Países desarrollados Otros países de bajos costos India % respondientes 100% 80% 60% 40% 20% 0% TI Call center Bussiness Finanzas y research Administración analysis Recursos Humanos I&D específico para industrias Fuente: MGI Figura 15. Lugares donde mandan o planean mandar a offshore las siguientes actividades 230 Capítulo IX: Necesidades futuras de Tecnologías de Información en Chile La instalación de grandes compañías tecnológicas en el país permite aumentar sustancialmente la cantidad de investigación desarrollada en el país. Este tipo de offshoring las empresas buscan realizarla en países de mayor desarrollo, tal como se ve en la siguiente figura: En conclusión, Chile puede ofrecer un Incremento en la oferta de procesos de mayor valor agregado, dado que ha demostrado capacidad en servicios de mayor valor agregado en algunas empresas internacionales (ej. Synopsys y Evalueserve) y nacionales (ej. Andean Software Development Solutions). Un ejemplo de servicios de valor agregado es Irlanda, país que es usado por las multinacionales como una base sobre la cual puedan manejar sus operaciones de bajo costo en otros países; ej. Microsoft, Apple, Pfizer, Citigroup. 9.7 Acuicultura La acuicultura fue durante muchos años el sector estrella en crecimiento, llegando a exportar sobre US$2.300 millones en 2006, con un crecimiento del 13% en diez años. Sin embargo, la aparición de enfermedades en las especies, como el virus ISA, mermaron la capacidad productiva del sector, la cual se espera comience un periodo de recuperación a partir del año 2010, dada la nueva legislación aprobada en el país. Chile sigue teniendo excelentes condiciones para el desarrollo de la acuicultura, especialmente debido a la temperatura de las aguas, fiordos y canales para cultivo existente, costos relativos inferiores a los competidores directos y el conocimiento acumulado en el país. Se espera que la demanda siga creciendo en los próximos años, y los competidores directos muestran saturación en sus bordes costeros (ejemplo: Noruega). 9.7.1 Requerimiento de TIC Las tecnologías de información son un apoyo vital para lograr un desarrollo más eficiente del sector acuícola, dadas las mejoras que se pueden lograr en los siguientes ámbitos: 231 Capítulo IX: Necesidades futuras de Tecnologías de Información en Chile •Mejorar el rendimiento de los alimentos. •Desarrollo de nuevas especies. •Mejora de la trazabilidad en el proceso productivo, orientado a lo sanitario y medio ambiental. Se espera que el Estado financie la Investigación y Desarrollo relacionada a este cluster, dado el alto potencial de crecimiento que muestra, y las condiciones que tiene el país para su desarrollo. De acuerdo a los estudios del Boston Consulting Group, el país debe gastar entre US$200 y US$500 millones de dólares en investigación en este sector. El desarrollo de estos procesos de investigación debe ser realizado en conjunto con los especialistas en acuicultura, los cuales son escasos en Chile. 9.8 Minería del cobre Chile es líder mundial en producción y reservas de cobre pero con una participación relativa menor en la minería en general. Existe una brecha esperada de producción a nivel mundial en el largo plazo. Un alto nivel de inversiones en Chile genera la posibilidad de crecimiento de la actividad del cluster en los próximos cinco años. Existe una oportunidad de desarrollar proveedores locales en nichos específicos asociados con tecnología e innovación con potencial de exportación. En el año 2009 el 90% de los proveedores de CODELCO, la principal compañía chilena, eran de origen nacional. 9.8.1 Requerimiento de TIC Es necesario incentivar la innovación para favorecer el desarrollo de los proveedores y asegurar el desarrollo sustentable y competitivo de la industria. Las principales áreas de desarrollo para las TIC son: •Análisis químicos •Tecnología de caracterización de yacimientos 232 Capítulo IX: Necesidades futuras de Tecnologías de Información en Chile •Camiones autónomos •Diagnóstico a distancia •Telemanejo •Automatización •Preacondicionamiento •Automatización de procesos •Lixiviación y Biolixiviación •Optimización del uso del agua y energía eléctrica La innovación por medio de tecnología aplicada debe basarse en el entendimiento de las necesidades concretas de la industria y la coordinación del esfuerzo de I+D junto al desarrollo de incentivos específicos. 9.9 Alimentos Procesados La industria de alimentos procesados incluye diversos sub-sectores que comparten oportunidades y desafíos transversales, dentro de los que podemos mencionar: procesados del mar, panadería y pastas, jugos y concentrados, deshidratados y frutas secas, conservas, congelados, confitería, cecinas, café y té, aceite de oliva. El mercado mundial de alimentos procesados muestra un crecimiento considerable por cambios en patrones de consumo, con comercio internacional jugando un rol cada vez más importante. Chile es un actor pequeño, focalizado en alimentos procesados frutícolas y hortícolas: •Exportaciones por US$ 1.400 MM en 2006 en los sub-sectores mencionados. •Competencia en base a productos de buena calidad y bajo costo, pero con potencial de apalancar ventajas competitivas para lograr mayor valor agregado a través de la diferenciación El país tiene la oportunidad de alcanzar exportaciones anuales por US$ 4.300 MM a 2017 233 Capítulo IX: Necesidades futuras de Tecnologías de Información en Chile 9.9.1 Requerimiento de TIC Se requiere crear una fuente de ventaja competitiva para Chile a través de la I+D, la cual complemente diversas disciplinas donde las TIC cumplen un rol fundamental. Las áreas principales identificadas para el cluster de alimentos incluyen: •Variedades específicas para la industria de proceso •Envases y packaging •Inocuidad •Procesos y tecnologías (de producción, inspección, de control de calidad, de manipuleo de materiales, etc.) •Biotecnología •Ingredientes, extractos y alimentos funcionales La industria de alimentos procesados posee un déficit en su programa de I+D apoyado en cuatro dimensiones •Fondos disponibles •Utilización •Capital Humano •Transferencia 9.10 Fruticultura Chile es un actor relevante a nivel mundial en este sector. Es el primer exportador del hemisferio sur, basando su estrategia en una diversidad de productos de calidad superior a la media y venta contra estación. Las exportaciones al 2006 bordearon los US$ 2.330 millones, representando alrededor del 30% de las exportaciones de frutas de interés (que pueden ser producidas en Chile). El país representa el 60% de la producción global de frutas del hemisferio sur y 7% del mundo Oportunidad de aumentar exportaciones anuales a 2012 entre US$ 900 MM y US$ 1.500 MM según escenario. 234 Capítulo IX: Necesidades futuras de Tecnologías de Información en Chile 9.10.1Requerimiento de TIC Las principales demandas de I+D en el área de tecnologías de información para este cluster son: •Tecnología en riego, cosecha, sistemas anti-heladas •Tecnología en selección de frutas y empaque •Tecnología en camiones y barcos (sistema de frío) De acuerdo a los estudios realizados con especialistas en fruticultura, los principales déficits en programas de I+D son: •Falta de visión de largo plazo •Insuficiente coordinación entre agentes •Insuficiente esfuerzo en investigación aplicada •Asignación de incentivos ineficiente •Insuficiente flexibilidad para la ejecución de investigaciones •Insuficiente transferencia de resultados de investigaciones •Escasa investigación aplicada a necesidades particulares de productores chilenos El principal requerimiento señalado por la industria es la creación, difusión y transferencia de paquetes técnicos/tecnológicos estandarizados por región y por especie frutal / variedad. El financiamiento de estas inversiones es un punto crítico en Chile, se espera que tanto el Estado como el sector privado prioricen la Inversión y Desarrollo para así poder llegar al nivel de países líderes en esta área, como se aprecia en la siguiente figura: 2.00% 1.50% 1.00% 0.50% 0.00% 1.69% 1.16% 0.70% Chile Nueva Zelanda Australia Fuente: Zespri, Hort New Zealand Figura 16. Inversión en I+D como porcentaje del PIB de la economía 235 Capítulo IX: Necesidades futuras de Tecnologías de Información en Chile 9.11 Turismo Chile debe aspirar a generar ingresos entre US$ 2.700 y US$ 4.000 millones en 2012 con una inversión acumulada estimada entre US$ 170 y 320 millones El turismo receptivo será el principal motor de crecimiento del sector en los próximos años Chile tiene atractivos turísticos singulares que le entregan ventajas para el posicionamiento turístico internacional en torno a conceptos de naturaleza y outdoors: •Principal oportunidad de Chile está en capturar mayor valor por turista •Crecimiento en arribos internacionales aparece como segunda palanca •Duración promedio de estadía con menor importancia dados altos números actuales Los principales desafíos se concentran en: •Mayor promoción turística en el extranjero •Mayor desarrollo de oferta de actividades y de productos en el destino •Aumento de capacidades de gestión y de servicios de capital humano •Mayor ordenamiento institucional en lo político y territorial •Aumento de asociatividad en el sector 9.11.1Requerimiento de TIC Las necesidades de I+D relacionadas con tecnologías para este cluster son: •Sofisticar mecanismos de investigación y desarrollo para actividades de turismo •Mejora de las plataformas transversales de comunicación con el cliente, lo cual genera un alto impacto dado que la iniciativa es esencialmente I+D aplicada para la industria. 236 Capítulo IX: Necesidades futuras de Tecnologías de Información en Chile 9.12 Servicios Financieros Los servicios financieros han evolucionado significativamente en los últimos años a través de la globalización de negocios, avances tecnológicos y cambios regulatorios, convirtiéndose en un sector altamente complejo y globalizado. Chile tiene un mercado financiero desarrollado, pero de tamaño reducido para estándares mundiales. Esta condición implica que convertir al sector financiero en un sector exportable esté acotado sólo a algunas áreas (por ej.: derivados de industrias particulares, como minería) El impacto de un mayor desarrollo del sector tendrá importantísimos efectos en el resto de la economía. 9.12.1Requerimiento de TIC Desarrollar nuevas tecnológicas para crear y ampliar canales financieros, las cuales permitan mejorar y/o superar los actuales de canales de comunicación con el cliente (Internet, cajeros automáticos, call centers, etc.). El mercado financiero entrega grandes oportunidades de desarrollo de tecnologías avanzadas, y en la actualidad no existen iniciativas directas para su uso en el sector. Dos grandes ejemplos de avances en TIC implementados por esta industria son los pórticos de las carreteras concesionadas y el sistema de pago de Transantiago. 237 BIBLIOGRAFIA Revistas y Publicaciones: Filippo Giorgi. Regionalización de la información sobre el cambio climático para la evaluación de impactos y la adaptación a los mismos, Abril 2008. Jorge E. Allende, Jorge Babel, Server Matínez, Tito Ureta. Análisis y proyecciones de la ciencia chilena 2005. Kevin E. Trenberth. Necesidades de observación para la protección y adaptación climáticas. Boletín OMM. Enero de 2008. CEAZA, Memorias 2008. Organización Meteorológica Mundial, Guide lines Data management. Rob Batchelder, industry analyst and president of Relevance. Rodrigo Delgado y Claudio Baeza, C/CATT-BRAMS description for EELA-2 Grid School. The Earth System Grid: Supporting the Next Generation of Climate Modeling Research. World Climate News OMM. Climate prediction and information for decisionmaking. Enero de 2009. William Wrigth. Observando el Clima: Desafíos para el siglo XXI. Boletin OMM. Enero de 2008. Xuebin Zhang, Francis W. Zwiers y Thomas C. Peterson. La adaptación imperativa: ¿está preparada la ciencia climática? Boletín de la OMM. 239 Entrevistas presénciales y escritas: Ángel Muñoz, Sub-Director, Centro de Modelado Científico, Universidad del Zulia, Venezuela. Claudio Baeza, CMM, Universidad de Chile. Don E. Middleton, Scientific Computing Division, National Center for Atmospheric Research (NCAR). Eugênio S. Almeida, Centro de Previsão de Tempo e Estudos, Climaticos (CPTEC), Instituto Nacional de Pesquisas Espaciais (INPE). Ministério da Ciência e Tecnologia (MCT), Brasil. Juan Quintana. Oficina de Estudios Meteorológicos, Dirección Meteorológica de Chile. Laura Gallardo. Profesora Asociada, Departamento de Geofísica, Universidad de Chile. Maisa Rojas, Departamento Geofísica, Universidad de Chile. Mark Falvey, Investigador Asociado, Departamento de Geofísica, Universidad de Chile. Melitta Fiebig, Investigador Institucional, Modelación Atmosférica, CEAZA. René Garreaud. Profesor Asociado, Departamento de Geofísica, Universidad de Chile. Ricardo Alcafuz. Oficina de Modelamiento y Desarrollo, Dirección Meteorológica de Chile. Rodrigo Delgado Urzúa, Ingeniero de Proyectos, Laboratorio de Medio Ambiente, CMM, U. de Chile. Presentaciones: Eugênio S. Almeida, Grid approach for environmental science in Braz Frank Schmitz, A short Overview of KIT and SCC and the Future of Grid Computing. 240 Rodrigo Delgado Urzúa, Implementación computacional de modelos atmosféricos. Páginas web: http://applications.eu-eela.eu/application_details.php?ID=51 http://arxiv.org/pdf/0712.2262 http://www.atmet.com http://www.ceaza.cl http://www.cecs.cl www.ciifen-int.org/images/stories/file/Proyecto%20BID_CIIFEN.pdf www.ciifen-int.org/images/stories/file/Proyecto%20BID_CIIFEN.pdf http://www.cmc.org.ve/documentos/GridONE2.pdf http://www.dgf.uchile.cl/ACT19 http://datagrid.ucar.edu/esg/about/docs/ESGAMS_final.pdf http://datagrid.ucar.edu/esg/about/docs/ewa.esg_sc01_chervenak_ final.pdf http://www.dgf.uchile.cl/ACT19/ http://www.earthsystemgrid.org http://eu-datagrid.web.cern.ch http://www.eu-eela.eu http://www.eu-egee.org http://www.euindiagrid.eu http://www.eurogrid.org http://www.finep.gov.b http://www.genesi-dr.eu/ 241 http://www.grid.phys.uvic.ca http://www.iag.usp.br/ http://www.ime.usp.br/ http://www.iop.org/EJ/article/1742-6596/46/1/070/jpconf6_46_ 070.pdf?request-id=eb75c3ad-2c5e-4e0f-a54a-f601d1ba4716 http://www.meteochile.cl/ http://opendap.org http://www.opensciencegrid.org/ https://portal.leadproject.org http://saemc.cmm.uchile.cl/ http://www7.cptec.inpe.br http://www.jmarcano.com/varios/desastre/monzon.html. Consultado 24 de mayo de 2009. Major Hurricanes, Typhoons, Cyclones, and other Storms since 1900. Encarta. Consultado el 24 de mayo de 2009. (http://encarta.msn.com/ media_701500587_761565992_-1_1/Major_Hurricanes_Typhoons_ Cyclones_and_other_Storms_since_1900.html) Guiney, John L.; Lawrence, Miles B. (28 de enero de 1999). Hurricane Mitch 22 October - 05 November 1998. National Hurricane Center. Consultado el 24 de mayo de 2009. (http://www.nhc.noaa.gov/1998mitch.html) The Deadliest Atlantic Tropical Cyclones, 1492-1996. National Hurricane Center - National Weather Service. Consultado el 24 de mayo de 2009. (http://www.nhc.noaa.gov/pastdeadlyapp1.shtml) Landsea, Chris. Which is the most intense tropical cyclone on record? Atlantic Oceanographic and Meteorological Laboratory, Hurricane. Consultado el 24 de mayo de 2009. (http://www.aoml.noaa.gov/hrd/tcfaq/E1.html) Super Typhoon Paka’s (1997) Surface Winds Over Guam. Office of the Federal Coordinator of Meteorological Services (17 de agosto de 1998). Consultado el 24 de mayo de 2009. (http://www.aoml.noaa.gov/hrd/project98/sh_ proj1.html) Landsea, Chris.Which are the largest and smallest tropical cyclones on 242 record? Atlantic Oceanographic and Meteorological Laboratory, Hurricane Research Division. Consultado el 24 de mayo de 2009. (http://www.aoml. noaa.gov/hrd/tcfaq/E5.html) Hurricane Inikiki Natural Disaster Survey Report. Central Pacific Hurricane Center - National Weather Service. Consultado el 24 de mayo de 2009. (http://www.prh.noaa.gov/cphc/summaries/1992.php#Iniki) Lawrence, Miles B. (7 de noviembre de 1997). Hurricane Pauline 5 - 10 October 1997. National Hurricane Center - National Weather Service. Consultado el 24 de mayo de 2009. (http://www.nhc.noaa.gov/1997pauline.html) Hurricane Kenna 22 - 26 October 2002. National Hurricane Center - National Weather Service. Consultado el 24 de mayo de 2009. (http://www.nhc. noaa.gov/2002kenna.shtml) Tropical Weather Summary. National Hurricane Centre - National Weather Service. Consultado el 24 de mayo de 2009. (http://www.nhc.noaa.gov/ archive/2005/tws/MIATWSAT_aug.shtml) Knabb, Richard D.; Rhome, Jamie R.; Brown, Daniel P. (20 de diciembre de 2005). Tropical Cyclone Report - Hurricane Katrina 23-30 August 2005 (PDF). National Hurricane Center - National Weather Service. Consultado el 24 de mayo de 2009. (http://www.nhc.noaa.gov/pdf/TCR-AL122005_Katrina. pdf) Biociencias Sitios Web BioMD (EELA 2, UFRJ, Brasil) http://applications.eu-eela.eu/application_details.php?l=20&ID=50 BGBLAST (Italia) geneva2007.healthgrid.org BioSys (EELA 2, UCI y CIM, Cuba) http://applications.eu-eela.eu/application_details.php?l=20&ID=68 BioNMF (EELA-2, UCM, España) 243 http://bionmfeela.dacya.ucm.es BIG, BLAST en Grid (EELA 2, UPV, España) http://sacmis.itaca.upv.es:8080/PortalBiG/Inicio/index.jsp CardioGrid Portal (EELA 2, UBA, Argentina) http://applications.eu-eela.eu/application_details.php?l=20&ID=15 DicomGrid (EELA 2, InCor-USP, Brasil) http://applications.eu-eela.eu/application_details.php?l=20&ID=9 DYNADRUG (DEISA, National Research Council (CNR), Istituto di Chimica del Riconoscimento Molecolare, Italy) http://www.deisa.eu/science/deci/projects2009-2010/DYNADRUG http://applications.eu-eela.eu/application_details.php?l=20&ID=55 MHOLline (EELA-2, UFRJ, Brasil) http://applications.eu-eela.eu/application_details.php?l=20&ID=25 Squid - a simple bioinformatics grid (BMC Bioinformatics 2005, 6, 197) http://www.dbbm.fiocruz.br/labwim/bioinfoteam/templates/archives/ squid/squid.html Dist-SOM-PORTRAIT (EELA 2, UnB, Brasil) http://applications.eu-eela.eu/application_details.php?l=20&ID=63 Biomedical Research Informatics Delivered by Grid Enables Services BRIDGES (Glasgow, Edinburgh) http://www.brc.dcs.gla.ac.uk/projects/bridges/index.html DRI/mammogrid (EELA 2, MAAT, CETA.CEIMAT, España) http://applications.eu-eela.eu/application_details.php?l=20&ID=32 DistBLAST (EELA 2, UnB, Brasil) http://applications.eu-eela.eu/application_details.php?l=20&ID=49 G-HHMER (EELA 2, UNIANDES, Colombia) 244 http://applications.eu-eela.eu/application_details.php?l=20&ID=57 G-InterProScan (EELA-2, UNIANDES, Colombia) http://applications.eu-eela.eu/app_list.php?l=20 GrEMBOSS (EELA-2, UNAM, México) http://applications.eu-eela.eu/application_details.php?l=20&ID=11 GRIP (EELA-2, UFRO, Chile) http://cmcc.ufro.cl/doku.php?id=Tratamiento_De_Imagenes Heart Simulator (EELA 2, UFJF, Brasil) http://applications.eu-eela.eu/application_details.php?l=20&ID=12 HeMolab (EELA 2, LNCC, Brasil) http://www.lncc.br/prjhemo/main.htm HPC Structure (EELA 2, CIP, Perú) Integra-EPI (EELA 2, Mackenzie, Brasil) http://telemedicina.unifesp.br/set/projetos/integraepi/entrada.php eIMRT (EELA 2, CESGA, España) http://eimrt.cesga.es ESSM (BalticaGrid, República de Latvia) http://www.balticgrid.eu fMRI (EELA 2, UA, Portugal) http://applications.eu-eela.eu/application_details.php?l=20&ID=10 eDiamond (www.ediamond.ox.ac.uk) GAMOS (EELA-2, CIEMAT, España) http://applications.eu-eela.eu/application_details.php?l=20&ID=33 GBIO (Laboratory of Bioinformatics and nmR for Structure Lyon, Francia) gbio.ibcp.fr/ws 245 Grid Bio Portal (EELA-2, UPV, España) Grid Enable BLAST (Proyecto de magíster en Francia) www-sop.inria.fr Grid – BLAST (Royal Institute of Technology, Suecia) http://kthgridproxy.biotech.kth.se/grid_blast/index.html GriPPS Grid Protein Pattern Scanning (Proyecto francés) gripps.ibcp.fr Grid Protein Sequence @nalysis (PBIL NPS, Lyon) gpsa-pbil.ibcp.fr HA-HELIX (DEISA, Università degli Studi di Torino, Italy) http://www.deisa.eu/science/deci/projects2009-2010/HA-HELIX MEGASIM (Cambridge University, UK) http://www.deisa.eu/science/deci/projects2009-2010/MEGASIM Molecular Modelling and Grid Computing (BIo-ICT, Italia) www.cnr-bioinformatics.it TotalEnz (University of Bristol, School of Chemistry, Bristol, UK) http://www.deisa.eu/science/deci/projects2009-2010/TotEnz2 GenocodisGrid (EELA 2, UCM, España) http://genecodis.dacya.ucm.es Phylogenetics (EELA-2, UPV, España) http://applications.eu-eela.eu/application_details.php?l=20&ID=39 Phylogrid (EELA-2, CEIMAT, España) The Virtual Laboratory Project (WEHI and Monash U., Melbourne) www.buyya.com/vlab Comb-e-chem (Reino Unido) 246 www.combechem.org BioCoRe (University of Illinois, EE.UU) www.ks.uiuc.edu/Research/biocore InvCell (EELA 2, UFJF, Brasil) http://applications.eu-eela.eu/application_details.php?l=20&ID=61 INVTissue (EELA 2, UFJF, Brasil) http://applications.eu-eela.eu/application_details.php?l=20&ID=62 MetaDock (EELA 2, UNAM, México) Action-Grid www.action-grid.eu EELA http://www.eu-eela.eu/ Proyecto UCRAV http://www.ucrav.cl/ Footnotes 1 http://www.cmc.org.ve/documentos/GridONE2.pdf 2 http://www.cmc.org.ve/documentos/GridONE2.pdf 3 http://www.cmc.org.ve/documentos/GridONE2.pdf 4 http://datagrid.ucar.edu/esg/about/docs/ewa.esg_sc01_ chervenak_final.pdf 5 http://datagrid.ucar.edu/esg/about/docs/ESGAMS_final.pdf 6 http://arxiv.org/pdf/0712.2262 7 http://www.iop.org/EJ/article/1742-6596/46/1/070/jpconf6_46_ 070.pdf?request-id=eb75c3ad-2c5e-4e0f-a54a-f601d1ba4716 8 “Acceso y Gestión del conjunto de datos de los modelos climáticos, entregando también servicios de colaboración”.- 247 248 Paper Supporting the Next Generation of Climate Modeling Research 9 Publicación “The Earth System Grid: Supporting the Next Generation of Climate Modeling Research” 10 http://www.opensciencegrid.org/About/Learn_About_Us/OSG_ Organization/Members_and_Partners 11 http://www.opensciencegrid.org/About/Learn_About_Us/ Outreach 12 Stormy weather: grid computing powers fine-scale climate modeling, publicado en http://www.opensciencegrid. org/About/What_We%27re_Doing/Research_Highlights/ Stormy_Weather 13 Imagen obtenida de http://wrf-model.org/plots/realtime_ hurricane4km.php 14 https://portal.leadproject.org/gridsphere/gridsphere?cid=intro 15 https://portal.leadproject.org/gridsphere/ gridsphere?cid=purpose 16 https://portal.leadproject.org/gridsphere/gridsphere?cid=lead- grid 17 CAM-WRF, http://applications.eu-eela.eu/application_details. php?ID=5 18 BRAMS,http://applications.eu-eela.eu/application_details. php?ID=19 19 http://seghidro.lsd.ufcg.edu.br 20 http://www.atmet.com 21 http://www.ime.usp.br/ 22 http://www.iag.usp.br/ 23 http://www7.cptec.inpe.br 24 http://www.finep.gov.br 25 http://www.atmet.com 26 http://project.eu-egee.org/index.php?id=104 27 http://technical.eu-egee.org/index.php?id=255 28 http://technical.eu-egee.org/index.php?id=134 29 El Middleware es un software de conectividad que ofrece un conjunto de servicios que hacen posible el funcionamiento de a plicaciones distribuidas sobre plataformas heterogéneas. 30 Traducción para Production Service infrastructure. 31 Traducción para Pre-Production Service (PPS). 32 The EGEE Network Operations Centre (ENOC) 33 http://www.genesi-dr.eu/ 34 http://genesi-dr.terradue.com/news/_images.asp 35 Lowest Arctic ice coverage in history, http://genesi-dr.terradue. com/news/_images.asp?id=18 36 Earth roughness and humidity captured by TerraSAR, http:// genesi-dr.terradue.com/news/_images.asp?id=22 37 Sand and dust from the Sahara Desert, http://genesi-dr.terradue.com/news/_images.asp?id=16 38 Glory Over Pacific Ocean Clouds, http://genesi-dr.terradue.com/ news/_images.asp?id=15 39 http://www.eurogrid.org/wp2.html 40 http://www.euchinagrid.org/partners-engl.htm 41 http://www.euchinagrid.org/IPv6/index.html 42 http://www.euchinagrid.org/work_package.html 43 http://www.euindiagrid.eu/partner_listing 44 http://www.euindiagrid.eu/applications/earth-atmospheric-sciences 45 Viento que sopla en el sureste de Asia. En invierno sopla de la tierra al mar y es seco y frío, mientras que en verano sopla desde el océano a la tierra siendo cálido y húmedo, y trae abundantes lluvias: el monzón ha provocado grandes inundaciones. 249 250 46 http://www.worldcommunitygrid.org/about_us/ viewOurPartners.do 47 http://www.worldcommunitygrid.org/projects_showcase/ach/ viewAchMain.do?SearchParam=climate 48 http://www.csag.uct.ac.za/worldcommunitygrid 49 http://www.worldcommunitygrid.org/forums/wcg/ listthreads?forum=281 50 http://applications.eu-eela.eu/application_details.php?ID=51 51 Esquema facilitado por Melitta Fiebig. 52 Imagen entregada por Melitta Fiebig 53 http://saemc.cmm.uchile.cl/ 54 www.ciifen-int.org/images/stories/file/Proyecto%20BID_CIIFEN.pdf 55 http://www.dgf.uchile.cl/ACT19 56 Memorias 2008 de CEAZA, disponible en http://www.ceaza.cl/ images/docs/memoria_ceaza_2008.pdf 57 Memorias 2008 de CEAZA, obra citada. 58 Memorias 2008 de CEAZA, obra citada. 59 http://www.ceaza.cl/index.php?option=com_content&task=vie w&id=381&Itemid=84 60 http://www.ceaza.cl/index.php?option=com_content&task=cat egory§ionid=12&id=97&Itemid=84 61 Información proporcionada por Melitta Fiebig. 62 http://www.ceaza.cl/index.php?option=com_content&task=cat egory§ionid=16&id=79&Itemid=84 63 Información proporcionada por Melitta Fiebig. 64 http://www.ceaza.cl/index.php?option=com_content&task=cat egory§ionid=16&id=77&Itemid=84 65 http://www.ceaza.cl/index.php?option=com_content&task=cat egory§ionid=13&id=309&Itemid=84 66 Información proporcionada por Melitta Fiebig. 67 Porción de la superficie de la tierra donde el agua esta en forma solida. 68 http://www.uchile.cl 69 http://www.udec.cl 70 http://www.meteochile.cl 71 http://www.dgf.uchile.cl/ACT19 72 http://www.dgf.uchile.cl/ACT19 251
Documentos relacionados
Nuevas capacidades en el descubrimiento de recursos
aunque existen iniciativas que tratan de usar técnicas aisladas para manejar algunas propiedades no funcionales o de calidad de servicio. En la presente tesis se proponen nuevas capacidades en el m...
Más detalles