Estado del Arte Internacional

Transcripción

Estado del Arte Internacional
Elaborado por:
Universidad Catolica del Norte
Universidad de La Frontera
REUNA
Fecha: Enero 2010
Financiado por: Programa de Investigación Asociativa PIA
CONICYT
Nota: Se autoriza la reproducción total y/o parcial de este libro, por cualquier
medio impreso y/o digital, para fines de investigación y ampliación y difusión
del conocimiento (no comerciales), citando las respectivas fuentes.
PREFACIO
A lo largo de su trayectoria y respondiendo al mandato de sus socios, la
Corporación REUNA ha buscado promover y apoyar el desarrollo de la comunidad
de educación superior, investigación e innovación del país. La gestión de
una infraestructura nacional de Red Académica globalmente conectada, la
incorporación y el desarrollo de tecnologías, servicios y aplicaciones de vanguardia
que promueven la conexión, la comunicación y la colaboración, y la articulación de
los actores que puedan ver sus investigaciones y proyectos beneficiados con éstas,
son las vías que ha tomado REUNA para cumplir sus objetivos.
En el año 2000 la Corporación se conecta a la red de investigación y educación
norteamericana, Internet2, el 2004, a la red latinoamericana, RedCLARA, y desde el año
2006 trabaja intensamente para incentivar la discusión nacional en torno a la e-Ciencia.
A nivel mundial se está dando un fuerte impulso al despliegue de las eInfraestructuras para impulsar y permitir el avance de la ciencia colaborativa. La
importancia que ello ha representado para las ciencias es crucial; la explotación
eficiente de centros y/o recursos de excelencia y a la existencia de nuevas formas de
compartir conocimiento en todas las áreas de investigación son dos signos claros
de esto y la profundidad del impacto de tan significativa evolución llevó al cambio
de paradigma, a la modificación de la forma en que se desarrolla el quehacer
científico desde el Polo Norte hasta la Antártica.
En el presente contexto, este estudio constituye un avance complementario
al ya realizado en el área de Astronomía, y –consideramos- significativo para
motivar la definición de acciones que conduzcan a la consolidación de una eInfraestructura nacional. Más aún, las grid y los sistemas que generan y sobre los
cuales operan, poseen una gran cantidad de propiedades latentes que aumentan
y extienden aquellas que son propias de la computación tradicional, y están
aportando grandes beneficios a la academia, la ciencia, la pequeña, mediana y
gran industria, y a los gobiernos (aspectos que pudieron validarse ampliamente en
el trabajo realizado en el Proyecto de Articulación Ciencia-Empresa, en el cual se
enmarca el presente documento).
La necesidad en Chile de una infraestructura tecnológica colaborativa de apoyo a la
investigación astronómica, nov 2008. Estudio financiado por el Programa Kawax (PIA)
Taller de Articulación para la Vinculación de Ciencia y Empresa: E-Ciencia E-Industria:
Hacia una Infraestructura de Grid Nacional
AGRADECIMIENTOS
Red Universitaria Nacional (REUNA) quiere agradecer a todos quienes
hicieron posible la realización de este estudio; a cada uno de los autores y a
quienes apostaron junto a nosotros por una propuesta integrada para evidenciar
la necesidad de una e-Infraestructura nacional.
Nuestros reconocimientos son para el Centro de Modelamiento Matemático
(CMM) - Universidad de Chile, el Centro de Excelencia de Modelación y Computación
Científica (CEMCC) - Universidad de La Frontera, la Universidad de Concepción, la
Universidad Católica del Norte y el Centro de Estudios Avanzados en Zonas Áridas
(CEAZA) – Universidad de La Serena, por aceptar y apoyar esta iniciativa, y para
el Programa de Investigación Asociativa (PIA) de la Comisión Nacional Científica y
Tecnológica (CONICYT) que, confiando en nuestra visión, financió este estudio.
Especial mención merecen los científicos, investigadores, académicos, tanto
nacionales como internacionales, que nos entregaron su visión y conocimientos
para construir esta propuesta.
Por último, queremos agradecer con especial énfasis al Comité CienciaEmpresa y al equipo de profesionales de REUNA.
Índice de Contenidos
1 Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia 15
1.1
Marco Conceptual
15
1.2
Definición general de una grid
16
1.3
1.3.1
1.3.2
1.3.1
Tipos de e-Infraestructuras Infraestructura para la e-Ciencia
Elementos de una e-Infraestructura Arquitectura de Seguridad en la Plataforma Grid 18
19
22
29
2 Capítulo II Estado del Arte Internacional
39
2.1
Introducción
39
2.2
Incorporación de HPC en el mundo
40
2.3
2.3.1
2.3.2
2.3.3
2.3.4
2.3.5
2.3.6
Proyectos de e-Infraestructuras APGRID (www.apgrid.org)
AUSTRIAN GRID (www.austriangrid.at)
BalticGrid II (www.balticgrid.org)
The Belgian Grid for Research (Begrid) (www.begrid.be)
BiG Grid - Grid Holandesa de e-Ciencia (http://www.nwo.nl)
Recursos grid
41
41
43
46
48
50
66
3 Capítulo III: Estado del arte en Latinoamérica 79
3.1
Introducción
79
3.2
3.2.1
3.2.2
3.2.3
Avances en computación grid en Latinoamérica
Computación grid en Colombia
Computación grid en Argentina
Computación grid en Brasil
82
82
84
85
4 Capítulo IV: Estado del Arte Nacional 87
4.1
Iniciativa articulada por REUNA
4.1.1 Iniciativas Centro de Modelamiento
Matemático CMM, Universidad de Chile
4.1.2 Iniciativas Universidad Católica del Norte
4.1.3 Iniciativas CEAZA, Universidad de La Serena
4.1.4 Iniciativas de la Universidad de La Frontera
4.1.5 Iniciativas de la Universidad Técnica Federico
Santa María
4.1.6 Iniciativas de la Universidad de Talca
4.1.7 Iniciativas de la Universidad del Bío-Bío
4.1.8 Iniciativas de la Universidad Austral
4.1.9 Iniciativas de la Universidad de Valparaíso
4.1.10Computación grid de apoyo a la Astronomía
87
5 Capítulo V: Estado del Arte Internacional 5.1
5.1.1
5.1.2
5.1.3
5.1.4
5.1.5
5.1.6
5.1.7
Tendencias de investigación en clima
Desafíos para el registro climático global
La observación, base de la investigación climática
Gestión y administración de datos derivados
de la observación
Otras problemáticas
Los modelos matemáticos como aporte al estudio
del clima y el tiempo
Esfuerzos existentes en Chile
Fenómenos climáticos
89
91
93
94
94
95
95
95
96
96
99
99
99
102
103
105
107
109
110
5.2
Iniciativas Internacionales: e-infraestructuras
para el desarrollo de la e-ciencia en Clima
5.2.1 Tipos de e-Infraestructura
5.2.1 Proyectos Internacionales de e-Infraestructuras
para la e-Ciencia en Clima
5.3
115
115
121
Visión Futura
6 Capítulo VI:Estado del Arte Nacional 156
161
6.1
Instituciones y/o grupos de investigación a nivel nacional
161
6.2
Proyectos a nivel nacional
180
7 Capítulo VII: Estado del Arte Internacional
7.1
Introducción 7.2
Tendencias de investigación en Biociencias
7.3
Iniciativas Internacionales:
185
185
188
e-Infraestructuras para el desarrollo de la e-Ciencia
7.3.1 Descripción tecnológica de la e-infraestructura
7.3.2 Descripción de Iniciativas
189
190
191
7.4
Apoyo de la e-infraestructura en la investigación
213
7.5
Visión Futura
213
8 Capítulo VIII:Estado del Arte Nacional 215
8.1
Investigación y Colaboración
215
8.2
Instituciones y/o grupos de investigación a nivel nacional
217
8.3 Identificar las áreas científicas que se trabajan en Chile
218
8.4
Productividad e impacto Científico
219
8.5
8.5.1
8.5.2
8.5.3
8.5.4
Iniciativas en las áreas de Biociencias
Proyecto UCRAV SACGRID
ACTION-GRID
EELA-2
219
219
220
220
220
9 Capítulo IX:Necesidades futuras de Tecnologías
de Información en Chile 9.1
223
Introducción
223
9.2
Determinación de las industrias en estudio
9.2.1 La elección de un camino.
225
225
9.3
El Consejo Nacional de Innovación para la Competitividad
226
9.4
Los siete sectores elegidos
227
9.5
Requerimientos de TIC de los siete clusters privilegiados
228
9.6
Offshoring
9.6.1 Requerimiento de TIC
229
230
9.7
Acuicultura
9.7.1 Requerimiento de TIC
231
231
9.8
Minería del cobre
9.8.1 Requerimiento de TIC
232
232
9.9
Alimentos Procesados
9.9.1 Requerimiento de TIC
233
234
9.10 Fruticultura
9.10.1Requerimiento de TIC
234
235
9.11 Turismo
9.11.1Requerimiento de TIC
236
236
9.12
Servicios Financieros
9.12.1Requerimiento de TIC
237
237
Estado del Arte Nacional e Internacional
en las áreas Clima, Biociencia y Tecnología Grid
Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia
1 Capítulo I: e-Infraestructuras para el
desarrollo de e-Ciencia
1.1 Marco Conceptual
“E-Ciencia es el concepto que define a aquellas actividades científicas que se
desarrollan a través de la utilización de recursos geográficamente distribuidos a los
que se accede mediante Internet. Pero recursos como cálculo y almacenamiento
masivo -los más frecuentemente requeridos en el ámbito de la e-Ciencia-, no se
satisfacen con la Internet comercial, ellos requieren de las redes de alta velocidad
dedicadas a la investigación -las denominadas Redes Académicas. Éstas y las
aplicaciones de trabajo colaborativo que en ellas se desarrollan, están creando
un escenario ideal para la interacción entre investigadores”. Consecuentemente,
para el desarrollo e la e-Ciencia se requiere de la e-infraestructura o plataforma
tecnológica que la da sustento.
El término e-Infraestructura se refiere a un nuevo ambiente de investigación,
donde investigadores trabajando en el contexto de sus instituciones base o en
iniciativas científicas nacionales o multinacionales, obtienen acceso compartido
a instalaciones o recursos científicos únicos o distribuidos (incluyendo datos,
instrumentos, capacidad de cómputo y comunicaciones), independiente de sus
características individuales o su localización en el mundo.
E-Infraestructura abarca redes de computadores, grids, data centers, registros
de servicios, autenticación, autoridad certificadora, capacitación, servicio helpdesk. Más importante, es la integración de todos estos elementos lo que define la
e-Infraestructura.
E-Ciencia en REUNA [http://.www.reuna.cl/index.php/es/e-ciencia] Consultado
en abril 20, 2010.
15
Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia
Un conjunto de desarrollos de e-Infraestructura han alcanzado un grado de
maduración; la computación grid es hoy la base estándar típicamente usada para
cómputo y administración de datos requeridos en el desarrollo de investigación
colaborativa.
1.2 Definición general de una grid
Varios conceptos similares coexisten acerca de qué es una grid. Uno de
ellos, elaborado por el Grid Computing Information Centre (asociación dedicada
exclusivamente al desarrollo de esta tecnología), llama grid a un “tipo de sistema
paralelo y distribuido que permite compartir, seleccionar y reunir recursos
‘autónomos’ geográficamente distribuidos en forma dinámica y en tiempo de
ejecución, dependiendo de su disponibilidad, capacidad, desempeño, costo y
calidad de servicio requerida por sus usuarios”. Según esta definición, se busca
aprovechar la sinergia que surge de la cooperación entre recursos computacionales
y proveerlos como servicios.
Otra definición más estructurada es la expuesta por Foster, Kesselman y Tuecke,
precursores de la computación grid; ésta plantea la existencia de Organizaciones
Virtuales (OV) como puntos de partida de su enfoque. Una Organización Virtual es
“un conjunto de individuos y/o instituciones definida por reglas que controlan el
modo en que comparten sus recursos”. Básicamente, son organizaciones unidas para
lograr objetivos comunes. Ejemplos de OVs podrían ser proveedores de servicios
de aplicaciones o almacenamiento, equipos de trabajo empresarial realizando
análisis y planeamiento estratégico, miembros de una planta de energía evaluando
trabajo de campo, universidades involucradas en un proyecto de investigación
conjunto, etc. Las OVs varían enormemente en cuanto a sus objetivos, alcance,
tamaño, duración, estructura, comunidad y sociología. Sin embargo, existen varios
requerimientos y problemas subyacentes tales como la necesidad de relaciones
flexibles para compartir recursos, niveles de control complejos y precisos, variedad
de recursos compartidos (programas, archivos, datos, sensores y redes, entre otros),
modos de funcionamiento (individual, multiusuario), calidad de servicio, etc. Las
tecnologías actuales o bien no proveen espacio para la variedad de recursos
involucrados o no aportan la flexibilidad y control de las relaciones cooperativas
necesarias para establecer las OVs.
Foster, I. y Kesselman, C. (eds.). The Grid: Blueprint for a New Computing
Infrastructure. Morgan Kaufmann, 1999.
16
http://www.textoscientificos.com/redes/computacion-grid
Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia
Como solución, se propone la grid como un modelo de trabajo para “compartir
recursos en forma coordinada y resolver problemas en organizaciones virtuales
multi-institucionales de forma dinámica”. De esta manera, varias instituciones
pueden formar distintas OVs e incluso formar parte de más de una al mismo tiempo,
realizando diferentes roles e integrando distintos recursos como se muestra en la
Figura 1.
Organización A
Organización B
Organización Virtual 1
Organización Virtual 2
Organización C
Figura 1. Una organización real puede participar en una o más OVs compartiendo
algunos o todos sus recursos. Se muestran tres organizaciones reales (los círculos
de puntos) y dos OVs (conformadas por los recursos compartidos en cada caso).
Las políticas que controlan el acceso a los recursos varían de acuerdo a las
organizaciones reales, los recursos y las OVs involucradas. Nótese que existen
recursos que componen una o más OVs y otros que no se comparten.
Idem 3.
17
Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia
Para lograr este nuevo cometido, se han desarrollado varios protocolos,
servicios y herramientas que intentan sustentar organizaciones virtuales escalables.
Debido a su enfoque, basado en compartir recursos de manera dinámica y multiorganizacional, las tecnologías grid se complementan en vez de competir con las
tecnologías de computación distribuida existentes.
1.3 Tipos de e-Infraestructuras
Las e-Infraestructuras han ido evolucionando a medida que aumentan las
comunidades de usuarios, las necesidades de herramientas administrativas y de
control, el acceso a datos, las mejoras en las redes avanzadas y el procesamiento.
Junto con el aumento de la cantidad de grids académicas y nacionales, han
comenzado a emerger dos tipos centrados en el área de negocios grid y servicios
comerciales de grid.
Vamos a describir una tipología de e-infraestructuras que nos permita entender
mejor las necesidades de seguridad y comunicación, los grupos de investigación
que se benefician al reunirse en entornos grid, las comunidades que se generan para
resolver problemas específicos y la extensión al área privada con sus respectivos
beneficios. Esta tipología está basada en los lineamientos más generales que se
observan del desarrollo del grid computing (computación grid) y es un tema en gran
expansión. Cabe mencionar que en sourceforge.net se encuentran a la fecha 1150
proyectos de grid computing dedicados tanto a herramientas grid como a desarrollar
soluciones específicas a problemas de investigación y desarrollo tecnológico.
El deseo de compartir recursos computacionales, datos y equipamiento
especializado requiere de confianza afianzada en protocolos de buen uso, cuotas
de acceso, administración de la información generada, seguridad en la transferencia
de información y personal administrativo dedicado al mantenimiento del
equipamiento, entre otros. Esto se reduce a construir procedimientos y software
que ayuden a la estandarización de las diferentes necesidades. Los grupos que se
han centrado en este problema han conformado las Grid Computing Organizations.
Ellas se centran en:
•Desarrollo de estándares y buenas prácticas
•Desarrollo de toolkits, frameworks y middleware
Aguilar, Gladys. Grid computing para cálculo intensive, Reporte de tesis.
Universidad Nacional del Nordeste, Argentina.
18
Grid Computing, IBM Press 2004.
Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia
•Construcción de soluciones basadas en grid
•Trabajo para adoptar conceptos grid en productos comerciales
Se utilizará este lineamiento para describir diferentes tipos de eInfraestructuras.
1.3.1 Infraestructura para la e-Ciencia
En la construcción de soluciones, el Departmento de Energía de Estados
Unidos se ha centrado en desarrollar el DOE Science Grid (DOE: Department of
Energy) para apoyar la investigación en el área de energía [www.sciencegrid.org].
En Europa, EUROGrid reúne en una red a los mayores centros de cómputo y al
proyecto Data Grid, que trabaja con CERN (dedicado a la investigación en física de
altas energías), CNRS (en materia de imágenes biológicas y médicas) y ESA/ESRIN
(observaciones geológicas). El proyecto TeraGrid de NSF (Fundación Nacional de
Ciencias de los Estados Unidos), trabaja en el lanzamiento de la mayor comunidad
científica distribuida.
Numerosas organizaciones se han desarrollado en torno a compartir recursos
de cómputo y almacenamiento en aplicaciones como:
• Astronomía: Astro-grid
• Bioinformática: BioinfoGrid, IMPACT, INSTRUCT, Mygrid
• Clima: C3 Grid
• Geociencias: Degree, NEESit
• Física de Partículas: GridPP, HEP Grid
• Medicina: MediGRID, neuGRID
Sin embargo, algunas se han centrado solamente en cómputo, como NWGrid, en el Reino Unido, reuniendo alrededor de 400 nodos. Otras se han centrado
solamente en datos, como GERES-med, repositorio de aplicaciones médicas con
sede en Portugal. Finalmente, existen proyectos de e-Ciencia centrados en el uso
de instrumentación específica como los radiotelescopios ASTRON y el colisionador
de partículas ATLAS, entre otros.
1.3.1.1 Negocios y Cloud Computing
En lo referido a las organizaciones comerciales, los esfuerzos se han
centrado en compartir recursos y en la virtualización. Esto se traduce en Web
19
Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia
services, capacidades de virtualización de hardware, como clusters o blades, y
capacidades de software en administración de recursos. Las empresas dedicadas
a desarrollar productos son IBM Business on Demand, HP con sus centros de datos
y computación utilitaria, Sun Microsystems con la tecnología N1 y Microsoft con la
estrategia .NET.
En este contexto surge el concepto de cloud computing, donde, manteniendo
el concepto de servicio de cómputo bajo demanda, la principal característica está
en la propiedad centralizada de los recursos.
1.3.1.2 Infraestructuras Comunitarias (voluntariado)
Una de las fortalezas de la computación grid es la posibilidad de reunir
a diferentes actores en un trabajo conjunto para cooperar en el desarrollo de
diferentes soluciones, como las grids nacionales, o, simplemente, para compartir
recursos propios en función de una causa, como voluntarios de una organización
benéfica.
En el caso de las grid nacionales, han sido los gobiernos quienes han
observado el potencial de la computación grid en el desarrollo de la investigación
científica y tecnológica de sus países, por ello algunos financian proyectos de
integración de universidades y centros de investigación para compartir recursos
computacionales y de almacenamiento. Dentro de algunas naciones se encuentran
grids de diferentes características, lo cual muestra las ventajas competitivas que
aportan al desarrollo. Ejemplos de esto son casi todos los países europeos, China,
India, Tailandia, Taiwan, Colombia y Brasil. Las grid nacionales han permitido que los
países que las poseen se integren a proyectos mayores de investigación como EELA,
entre Europa y Latinoamérica, DEISA, entre los centros de cómputo europeos, o a
grids intercontinentales, como EUAsiaGrid, EUChinaGrid y EUIndiaGrid, reportando
altos beneficios en términos de investigación y desarrollo.
En el caso de la computación voluntaria (volunteer computing), cada
voluntario ayuda a crear una grid al compartir sus recursos, esto es, donando el
tiempo libre de sus PCs para que investigaciones de alto impacto social puedan
desarrollarse. Uno de los primeros proyectos exitosos en este ámbito es BOINC
(Berkeley Open Infraestructura for Network Computing, http://boinc.berkeley.
edu ), que en su marco lleva a cabo la famosa búsqueda de inteligencia artificial
SETI@Home; esta iniciativa opera mediante un protector de pantalla que se activa
en los tiempos inactivos del PC del donante/voluntario para analizar las señales
20
http://www.ibm.com/ibm/cloud
Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia
del radiotelescopio de Arecibo que busca patrones no existentes en la naturaleza.
Actualmente SETI@Home cuenta con casi un millón de participantes y más de dos
millones de computadores provenientes de 234 países. BOINC ha desarrollado
otros 26 proyectos con orientación científica, reuniendo 1,6 millones de usuarios y
3,7 millones de computadores.
Otras iniciativas se han desarrollado buscando mejorar las condiciones de
vida de todos los habitantes del planeta. Un ejemplo calve es el World Community
Grid, con proyectos en energías limpias, alimentación y salud pública. En la misma
línea pero en otro ámbito, Grid4all pretende democratizar el acceso a tecnologías de
información y hacer que todos quienes están en la red compartan sus recursos10.
1.3.1.3 Servicios Comerciales
En torno a la grid se han desarrollado servicios de integración de tecnologías
y difusión del conocimiento para que la comunidad conozca, participe y aproveche
esta tecnología en su trabajo.
Grid Infoware (http://www.gridcomputing.com/) es un sitio dedicado
a reunir cientos de proyectos grid en diferentes áreas y documentar su uso y
aplicación, mostrando ejemplos concretos de éxito, conferencias, y otros centros
de información.
Gridtalk se encarga de destacar los proyectos grid europeos, difundiendo los
resultados del proyecto EEGE.
ICEAGE se encarga de difundir y capacitar en el uso y administración de
tecnologías grid a través de escuelas de verano.
Otro servicio que ha destacado por su impacto, son las revistas de difusión
de computación grid. Grid Computing Planet mantiene en su sitio noticias, avisos
publicitarios, desarrollo e implementación de tecnologías, aportando al desarrollo
comercial de las soluciones grid. iSGTW - International Science Grid This Week es un
semanario de promoción de la computación grid y su impacto en la ciencia; posee
más de 3500 lectores en más de 100 países y está financiada por el Departmento
de Energía de Estados Unidos y NSF.
10
http://www.worldcommunitygrid.org/
21
Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia
1.3.2 Elementos de una e-Infraestructura
1.3.2.1 Middleware
El middleware permite a las aplicaciones utilizar, de forma conjunta o
coordinada, recursos disponibles en diversos centros. Las tecnologías de middleware
más utilizadas en entornos científicos son Globus Toolkit, gLite y Unicore, las que se
describen a continuación.
1.3.2.1.1 Globus
Globus Toolkit es un software de código de fuente abierta que, impulsado
por Globus Alliance, permite la construcción de grids. Globus está compuesto por
servicios locales para la explotación eficiente de recursos (gestores de colas batch,
librerías de programación paralela, herramientas de depuración y monitorización,
etc. Ver Figura 2), servicios grid básicos de autenticación y acceso a los datos,
información y estructura de los recursos y ejecución de aplicaciones y seguimiento,
servicios grid de alto nivel, de acceso rápido y eficiente a los servicios básicos, y
herramientas grid para el desarrollo de aplicaciones.
El middleware de Globus permite a las aplicaciones emplear, de forma
conjunta o coordinada, recursos disponibles en diversos centros. La tecnología
más utilizada en entornos científicos parte con Globus Toolkit y es complementada
con otros paquetes (Ver Figura 1).
1.3.2.1.1.1 Servicios locales
Incluye el desarrollo de herramientas para explotar los recursos en la Intranet
del centro de investigación. En este campo existen, en la actualidad, muchos
servicios disponibles para realizar un uso eficiente de los recursos locales, de ellos
podemos destacar las herramientas de monitorización de los diferentes recursos
físicos del cluster, los gestores de colas batch, las librerías de programación paralela,
y las herramientas de depuración y monitorización de aplicaciones.
1.3.2.1.1.2 Servicios grid básicos
Global Grid Forum es el organismo encargado de definir los estándares de
servicios y protocolos necesarios para crear la infraestructura o tecnología grid.
Aunque existen otras tecnologías grid como Legion, Unicore o MOL, la mayoría de
22
Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia
Aplicaciones
Condor- SerGHerramientas
MPI
GridWay
GASS
GridFTP
Condor
LSF
Grid
Nimrod’G
DataGrid
CrossGrid
Servicios Grid básicos
Metacomputing
Directory
Service
MPI
PBS
Servicios Grid alto nivel
SGE
Workstations
Servids. Unix
Desktops
Serv. Windows
Globus
Security
Interface
Servicios
locales
Recursos
GRAM
Replica
Catalog
I/0
TCP
Linux
GrADS
UDP
AIX
Solaris
Cluster Linux
SMFs
MPPs
Figura 2. Tecnología Grid: Taxonomía de Globus.
los proyectos grid actuales se están construyendo basados en los servicios y
protocolos proporcionados por Globus Toolkit. La tecnología Globus ha sido
seleccionada como estándar de facto por las doce compañías más importantes del
sector de computación de altas prestaciones (Compaq, Cray, SGI, Sun Microsystems,
Entropia, IBM, Microsoft, Platform Computing y Veridian, en Estados Unidos; y
Fujitsu, Hitachi y NEC, en Japón). La versión actual de Globus, basada en Open Grid
Services Architecture (OGSA), muestra una clara convergencia hacia la tecnología
de Web Services utilizada en el campo del e-Business, a ésta apuesta Globus Toolkit
(GT).
Esta evolución representa una gran oportunidad para lograr una amplia
aceptación y difusión de la tecnología grid, que puede extenderse, al igual que lo
hizo la WWW, desde su ámbito original, en el área de la computación científica, al
de las aplicaciones comerciales.
23
Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia
Globus Toolkit es una colección de componentes de software de código y
arquitectura abiertos, diseñados para soportar el desarrollo de aplicaciones de
alto rendimiento sobre entornos distribuidos tipo grid. Realmente se trata de
un conjunto de componentes autónomos que permiten al diseñador construir
una grid. Cada componente proporciona un servicio básico como autenticación,
asignación de recursos, información, comunicación, detección de fallos y acceso
remoto a datos. Los sistemas y aplicaciones grid pueden desarrollarse empleando
los siguientes servicios y protocolos como elemento básico:
• GT CORE: Implementa los estándares de OASIS WSRF (Web Services
Resources Framework) y WSN (Web Service Notification).
• Seguridad, formada por dos servicios:
- Grid Security Infrastructure (GSI), que permite la autenticación y
comunicación segura sobre redes abiertas.
- Community Authorization Service (CAS), que define a los proveedores
de recursos políticas de control de acceso para comunidades.
• Gestión de datos (Data Management), incluye tres servicios:
- GridFTP, protocolo para la transferencia segura y fiable optimizada y su
API Global Access to Secondary Storage (GASS Transfer API).
- Reliable File Transfer Service (RFT), un servicio OGSA que permite
controlar y monitorizar transferencias que usen GridFTP.
- Replica Location Service (RLS), que mantiene y provee de acceso a
información de localización de datos.
• Gestión de recursos (Resource Management), formado por:
- Grid Resource Allocation and Management (GRAM), que provee una
interfaz para solicitar y usar recursos remotos para la ejecución de
trabajos.
- Servicios de información (Information Service).
• Monitoring and Discovery System (MDS3), que proporciona información
sobre los recursos disponibles en el Grid y su estatus.
• XIO: Globus XIO es una utilidad de entrada/salida que proporciona una API
para el acceso a sistemas de IO.
24
Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia
1.3.2.1.1.3 Servicios Grid de alto nivel
A pesar del tremendo esfuerzo realizado por la comunidad científica, la
ejecución y la gestión de trabajos en una grid resulta una tarea ardua y difícil,
debido principalmente a la naturaleza dinámica y compleja que caracteriza a las
grid.
Habitualmente el usuario ha de encargarse manualmente de todos los pasos
involucrados en la ejecución de un trabajo, como descubrimiento y selección
de recursos, inicialización, envío, monitorización, migración y finalización. Para
facilitar el uso de esta tecnología, se están desarrollando servicios grid de alto
nivel y herramientas que realicen de forma automática y eficiente los pasos que
hoy debe llevar a cabo el usuario, además de adaptar la ejecución de un trabajo
a las condiciones dinámicas de la grid (disponibilidad, carga, costo, etc.) y a las
demandas dinámicas de la aplicación (tiempo máximo de ejecución, presupuesto,
necesidad de hardware/software específico, etc.).
1.3.2.1.1.4 Herramientas grid
En este nivel se incluyen herramientas de más alto nivel como librerías
de programación, entornos especializados para la resolución de problemas y
otras herramientas de ayuda al desarrollo de aplicaciones. Éstas se basan en los
componentes básicos y de alto nivel.
Aunque Global Grid Forum está coordinando un gran esfuerzo colectivo
de estandarización, la grid aún es una tecnología en vías de consolidación y
su desarrollo está en confluencia con el de los Web Services. Dentro del mundo
industrial, también se apoya a esta tecnología a través de Enterprise Grid Alliance.
1.3.2.1.2 gLite
Para el proyecto europeo de Habilitación de Grids para e-Ciencia (EGEE), se
decidió que lo mejor sería una aproximación en dos fases. Originalmente, EGEE
utilizaba una capa intermedia basada en los trabajos de su predecesor, el proyecto
de Grid de Datos Europeo (EDG, su sigla en inglés), luego evolucionó hacia una
capa intermedia de LCG, la que empleó en sus primeras fases.
EGEE ha desarrollado y reestructurado prácticamente la totalidad de esta capa
intermedia, convirtiéndola en una nueva solución de middleware: gLite. Ésta hoy
se implanta en el servicio de preproducción. gLite combina una capa intermedia
básica con una gama de servicios de mayor nivel.
25
Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia
Distribuida bajo una licencia de fuente abierta, gLite es favorable para los
negocios e integra componentes de los mejores proyectos actuales de capa
intermedia, tales como las herramientas Condor y Globus Toolkit, así como
componentes desarrollados para el proyecto LCG. El resultado es una óptima
solución básica de capa intermedia, compatible con programadores tales como
PBS, Condor y LSF; su construcción se ha llevado a cabo con el objetivo de asegurar
la interoperabilidad y la provisión de servicios fundamentales que faciliten el
desarrollo de aplicaciones en grid en todos los campos.
1.3.2.1.2.1 El desarrollo
En el desarrollo del software están colaborando varios centros de investigación
académica e industrial, organizados por diferentes actividades: seguridad, acceso
a recursos (elementos computacionales y de almacenamiento), contabilidad,
gestión de datos, gestión de cargas de trabajo, registro y mantenimiento de libros,
información y monitorización, y supervisión y aprovisionamiento del trabajo en
red.
El desarrollo y la implantación también tienen el apoyo del programa
extensivo de infraestructura-f (infraestructura de formación) de EGEE. Éste da un
amplio soporte que cubre desde la documentación en línea hasta los seminarios
presenciales y los tutoriales transmitidos vía Internet. La formación también está
disponible en el banco de pruebas de diseminación GILDA, que cuenta con su propia
Autoridad de Certificación (CA) y permite a los usuarios y a los administradores del
sistema probar todos los aspectos de la implantación y el uso de gLite.
1.3.2.1.2.2 El producto
Los servicios en grid de gLite están basados en una arquitectura orientada al
servicio, que permite conectar fácilmente el software a otros servicios en grid, y
también facilita el cumplimiento de los estándares futuros en el campo de los grid,
por ejemplo el Web Service Resource Framework (WSRF) de OASIS y la Open Grid
Service Architecture (OGSA) del Global Grid Forum. gLite está considerado como
un sistema modular que permite que los usuarios implementen diferentes servicios
según sus necesidades, sin verse obligados a utilizar el sistema completo. Con esto
se pretende que cada usuario adapte el sistema a su situación particular.
1.3.2.1.3 UNICORE
El sistema UNICORE – Uniform Interface to Computing Resources
– fue originalmente concebido en el año 1997 para permitir que los centros de
26
Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia
supercómputo en Alemania proveyesen a sus usuarios acceso en forma continua,
segura e intuitiva a los recursos heterogéneos en los centros. Como resultado, los
proyectos UNICORE 4 y UNICORE Plus 5 fueron financiados por BMBF, el Ministerio
Alemán para la Educación y la Investigación, con los objetivos que se refieren a
continuación.
UNICORE fue diseñado para ocultar las fusiones que resultan de arquitecturas
diferentes de hardware, del proveedor de sistemas operativos específicos, de
sistemas incompatibles de gestión de recurso y de ambientes diferentes de
aplicaciones.
Un objetivo clave de UNICORE era retener la autonomía de la organización y
la autonomía administrativa de los centros. Para poder utilizar la totalidad de los
beneficios ed UNICORE, ninguno de los proveedores de Internet debía ser forzado
a cambiar las prácticas históricas de los centros informáticos, ni las convenciones
de nombres y políticas de seguridad.
Desde el comienzo, la seguridad fue parte del diseño de UNICORE, siempre
basándose en el estándar X.509. Los certificados son utilizados para autenticar
servidores, el software, y los usuarios, así como para encriptar la comunicación a
través del Internet abierto.
Por último, UNICORE tenía que ser utilizable por científicos e ingenieros, sin
que requiriesen estudiar la documentación del proveedor o del sitio específico.
Una interfaz gráfica fue desarrollada para ayudar a los usuarios a crear y gestionar
los trabajos.
UNICORE soporta el acceso a recursos –computadoras, datos y aplicaciones–
para el espectro completo de la estructura organizacional:
- Consistente, utilización estandarizada de las diferentes arquitecturas y
sistemas dentro de una organización.
- Seguridad, acceso basado en Internet a recursos distribuidos
geográficamente de una organización global.
- Organizaciones virtuales, combinando los recursos de compañías
independientes para el soporte de comunidades de usuarios
seleccionados.
1.3.2.1.3.1 Seguridad y Confianza
La seguridad y confianza son los criterios claves, aquellos que determinan si
la tecnología grid será exitosa. UNICORE tiene una arquitectura para dar el soporte
27
Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia
a los requerimientos de seguridad más estrictos. Los certificados, de acuerdo al
estándar X.509, proveen la base de la arquitectura de seguridad UNICORE; éstos
sirven como identificaciones de usuario a través de la grid: son mapeados a las
cuentas en diferentes sistemas. Este enfoque tiene tres ventajas significativas,
especialmente para organizaciones virtuales:
• Los sitios participantes no tienen que cambiar sus convenciones
establecidas.
• Los usuarios no necesitan saber los nombres de usuarios locales y
contraseñas en los distintos sistemas
• Los proveedores de recursos pueden siempre identificar el originador de
una petición y pueden así cobrar al usuario por el consumo del recurso en
forma confiable.
La clave privada del usuario es usada para firmar y encriptar la petición, por
ejemplo para el envío de los trabajos, los cuales permiten a los componentes del
servidor de UNICORE detectar cualquier manipulación que se realice con los datos
mientras éste se encuentre en tránsito (a través de Internet) y mapea el certificado
a la cuenta apropiada en el sistema objetivo.
Los certificados también autentican los sistemas pares mutuamente en una
grid UNICORE. El gateway aceptará solamente peticiones desde un cliente o un
sistema par que pueda proveer un certificado de confianza. Simétricamente, el
cliente se comunicará solamente con Gateways confiables. Los Gateways y otros
servidores residen detrás de un firewall. El software cliente es ejecutado desde
el sistema personal del usuario – un equipo de escritorio que puede residir en la
oficina o a través de un notebook conectado a Internet desde cualquier lugar. Los
servidores UNICORE requieren que solamente un puerto y un servicio esté abierto
en el firewall por sitio. El código Java que implementa el Gateway es pequeño
en tamaño; más aún si éste ha sido profundamente inspeccionado por expertos
de seguridad de compañías líderes en TI, tales como T-Systems; aún no se le han
encontrado vulnerabilidades.
Los certificados, como base para la seguridad, requieren la existencia de
una Infraestructura de Clave Pública (PKI). Esencialmente, los participantes en
una grid UNICORE tienen que acordar cuáles Autoridades Certificadoras (CA)
serán de confianza. Sin embargo, UNICORE no está limitado a exactamente un
CA. Durante la operación de una grid UNICORE varios CA pueden ser aceptados
concurrentemente.
28
Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia
1.3.1 Arquitectura de Seguridad en la Plataforma Grid
En esta sección nos enfocaremos en la seguridad del servicio grid con una
discusión detallada sobre los desafíos de seguridad enfrentados por la comunidad
grid en general, y luego exploraremos los detalles de las soluciones de seguridad
provistos por el OGSA (Open Gris Service Architecture – Globus Alliance11). La
compartición de recursos entre los participantes de organizaciones virtuales
heterogéneos es un proceso complejo debido a los desafíos enfrentados en la
integración, interoperabilidad y relaciones de confianza.
Podemos explicar con mayor profundidad examinando los siguientes factores:
Desafíos de la Integración: Existen numerosos frameworks de seguridad,
estándares e implementaciones disponibles hoy en día. La mayoría de estas
organizaciones, individuos y/o recursos tienen sus propias preferencias acerca
de los requerimientos de seguridad que sean más convenientes para su propio
ambiente. No podemos reemplazar todos estos frameworks de seguridad ni
tampoco seremos capaces de tener una alternativa común. Esto implica enfocarse
en los participantes para usar los frameworks existentes e integrar en forma
continua con ellos. Por tanto la arquitectura de seguridad de OGSA se basa en los
mecanismos de seguridad existentes y en su extensión, de tal manera que éste
pueda incorporar nuevos servicios de seguridad cuando estén disponibles y que
sean capaces de integrarlos con los servicios de seguridad pre-existentes.
Desafío de Interoperabilidad: La compartición de estos recursos
interoperables puede extenderse en muchos dominios de reinos de seguridad y
sus respectivas necesidades de interoperabilidad de seguridad en cada capa de
la implementación del servicio. Examinaremos distintos niveles en los siguientes
puntos:
• A nivel de protocolos, distintos dominios necesitan intercambiar mensajes
a través de sus capas de protocolos y necesitan tener interoperabilidad en
cada capa del stack de protocolos.
• A nivel de políticas, la interoperabilidad de seguridad requiere que cada
participante especifique cualquier política que este desea decretar para
poder establecer una conversación segura, y estas políticas necesitan
interoperar mutuamente.
• Al nivel de identidad, se requieren mecanismos para identificar un usuario
de un dominio a otro dominio. Para cualquier invocación a través de dominios
para ser exitoso en un ambiente seguro, se requiere absolutamente de un
mapeo de identidades y credenciales a la identidad del dominio objetivo.
11
http://www.globus.org/ogsa/
29
Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia
Desafío de la Relación de Confianza: La confianza entre los participantes
en una organización virtual dinámica es el aspecto más complejo de lograr, y ésta
debe ser evaluada por cada sesión o petición. Esto requiere de una federación que
asegure la existencia de una relación de confianza entre los participantes.
grid.
La Figura 3 muestra las categorías de los desafíos de seguridad en un ambiente
Integrate
Extensible architecture
Using existing services
Implementation agnostic
Figura
Interoperate
Secure Interoperability
Protocol mapping
Federation
Publish QoS
3.
Trust
Trust relationship
Trust establishment
Assertion
Categorías de los desafíos de seguridad son complejas en un ambiente grid.
1.3.1.1 Arquitectura de Seguridad OGSA
La arquitectura de seguridad OGSA enfrenta los problemas de arriba a través
de mecanismos de seguridad que son plug-and-play en el lado del cliente y del
servicio. El ambiente grid requiere una plataforma OGSA con el mecanismo de
seguridad para dar el soporte, integrar y unificar modelos de seguridad populares,
mecanismos, protocolos, plataformas y tecnologías.
Elementos de Seguridad Común requeridos para un ambiente grid
Autenticación
Provee puntos de integración para múltiples mecanismos de autenticación y
el medio para converger el mecanismo específico utilizado en cualquier operación
de autenticación dada.
30
Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia
Delegación
Ofrece facilidades para la delegación de derechos de acceso de los solicitadores
a los servicios. Estos derechos de acceso delegados deben ser transferidos a las
tareas a ser realizadas, y por un tiempo limitado, para poder limitar el riesgo de mal
uso.
Ingreso de una sola vez
Esta capacidad permite a un servicio de usuario utilizar múltiples recursos
con un solo proceso de ingreso explícito y, por tanto, de ahí para adelante
automáticamente delegar la misma credencial autenticada para los siguientes
accesos de recursos sin la necesidad de la intervención del usuario, dentro de un
periodo específico de tiempo. Estas sesiones de ingreso pueden incluir acceso de
recursos en otros dominios usando una delegación de credencial de servicio.
Ciclo de vida de la credencial y renovación
Las credenciales tienen un tiempo de uso limitado, y la mayoría de los
trabajos grid pueden tomar bastante tiempo en ejecutarse. Esto puede causar que
las credenciales sean invalidadas, llevando al sistema a un estado también inválido.
Para evitar esto, un sistema grid debe soportar notificaciones de no expiración de
credencial y facilidades de revalidación de la misma.
Autorización
Este modelo permite el acceso controlado a los servicios OGSA basados
en políticas de autorización (p.ej., quién puede acceder a un servicio y bajo qué
condición) adjuntos a cada servicio. Además, esto permite a los solicitantes
especificar políticas de invocación (p. ej., en quién confía el cliente confía para
proveer el servicio pedido). La autorización debería acomodar varios modelos de
control de acceso e implementaciones.
Privacidad
Las políticas de privacidad deben ser tratadas como un tipo de política de
autorización que trae la semántica de privacidad a una sesión de uso del servicio.
Similar a la autorización, la seguridad OGSA debe permitir tanto al solicitante y al
servicio forzar las políticas de privacidad, por ejemplo, tomando en cuenta cosas
como la información identificable personal (PII), el propósito de la invocación, etc.
Confidencialidad
Proteger la confidencialidad del mecanismo de comunicación subyacente
(transporte de servicios de red), y la confidencialidad de los mensajes o documentos
que fluyen sobre el mecanismo de transporte en una infraestructura compatible
OGSA. El requerimiento de confidencialidad incluye transporte punto a punto,
como también mecanismos de almacenamiento y envío.
31
Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia
Integridad de Mensajes
Éste provee mecanismos para detectar el cambio no autorizado a los
mensajes. El uso del chequeo de la integridad de los mensajes o de los documentos
es determinado por una o más políticas, a su vez definidas por la Calidad de Servicio
(QoS) de la prestación.
Intercambio de Políticas
Permite a los clientes y servicios intercambiar información de políticas en
forma dinámica, para establecer un contexto de seguridad negociado entre ellos.
Tal información de políticas contendrá requerimientos de autenticación, soporte
de funcionalidad, restricciones, reglas de privacidad, etc.
Registro Seguro
Para eliminar el repudio, la notarización y auditoría, se provee facilidades de
registro (logging) para que todas las conversaciones sean seguras, especialmente
para el registro de negociaciones.
Aseguramiento
Provee un medio para calificar el nivel de aseguramiento de la seguridad que
puede ser esperada desde un ambiente de hospedaje. Éste puede ser utilizado
para expresar características de protección del ambiente, tales como protección de
virus, utilización de firewall, acceso VPN interno, etc.
Manejabilidad
Provee manejabilidad de funciones de seguridad, tales como administración
de identidad, administración de políticas, administración de clave secreta y otros
aspectos críticos.
Firewall Trasversal
Los firewall de seguridad están presentes en la mayoría en la redes de
sistemas distribuidos para prevenir que mensajes no deseados ingresen a un
dominio respectivo. La grid, siendo una organización virtual, nota que los firewalls
pueden causar desafíos en la transferencia de mensajes entre los participantes.
Esto obliga al modelo de seguridad de OGSA a rodear la protección del firewall sin
comprometer la seguridad del host local.
Asegurando la Infraestructura de OGSA
Asegurando la infraestructura de OGSA se asegura el OGSI (Open Grid Services
Infrastructure). El modelo debe incluir aseguramiento de componentes como Grid
HandleMap, servicio de descubrimiento, etc.
32
Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia
1.3.1.2 Servicios de Seguridad
La arquitectura de seguridad de OGSA tiene una tarea insuperable en el
establecimiento de un modelo de seguridad para capturar todos los requerimientos
indicados en los párrafos anteriores. Como una progresión natural, la arquitectura
de seguridad de OGSA está alineada con el modelo de seguridad de Web Services.
La Figura 4 muestra el modelo de la arquitectura de seguridad de OGSA.
Intrusion
management
Antivirus
management
Policy
management
Secure
Conversation
privacy
rules
Access Control
Authorization
Enforcement
Credential Identity
Mapping
service
policy
authorization
policy
User
management
Policy expression and exchange
(WSDL, WS-SecurePolicy, WS-Policy)
Key
management
Binding seWS-WS-Security)
identity
mapping rules
Figura 4. Arquitectura de seguridad de OGSA.
La Figura 4 muestra el modelo de seguridad del núcleo utilizado en el ambiente
grid. Todos los servicios grid se comunican entre sí, basados en un conjunto de lazos
especificados por los servicios. Éstos deben tratar con los detalles de seguridad
incluyendo confidencialidad de mensajes, integridad y autenticación.
Normalmente hablando, estos lazos son inicializados en un conjunto de
políticas basado en tiempo de ejecución. Estas políticas de seguridad pueden
ser especificadas como documentos estáticos, tales como documentos WSDL
o Política-WS, o pueden ser negociados en tiempo de ejecución basado en las
capacidades del cliente y el servicio.
Las políticas comunes especificadas incluyen elementos soportados tales
como mecanismo de autenticación, confidencialidad/integridad requerida,
políticas de confianza, políticas de privacidad, y afirmaciones de seguridad. Una vez
que el cliente del servicio grid y los proveedores de servicio descubren la política
33
Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia
de seguridad receptiva, ellos pueden entrar en un modo de conversación segura y
establecer un canal resguardado para el intercambio de mensajes. Este canal debe
también forzar todas las garantías de QoS de seguridad que fueron acordadas.
A continuación se exploran los detalles de cada uno de estos componentes
en más detalle, para comprender mejor las tecnologías de interés en cada capa del
modelo de componentes de seguridad.
1.3.1.3 Elementos anexos de Seguridad
La anexión de seguridad de transporte incluye SOAP, IIOP, JMS, HTTP, etc,
y cada uno de estos protocolos de transporte tiene diferentes requerimientos
de seguridad para la autenticación, integridad de mensajes y confidencialidad.
Por ejemplo, HTTP y SSL combinados comprenden “HTTPS” como un canal de
conversación segura, garantizando la integridad y la confidencialidad de los
mensajes, aún con la limitación de un protocolo de canal punto a punto. Este
protocolo de servicio de red puede también requerir servicios de coordinación de
más alto nivel para flujos de extremo a extremo a través de intermediarios (p. ej.,
firewalls, proxy servers, etc.).
En el caso de los mensajes SOAP, el modelo WS-Security provee un patrón
de intercambios seguros, utilizando los encabezados SOAP como el portador de
intercambio de información de seguridad. La integridad y confidencialidad de los
mensajes SOAP pueden ser luego protegidas usando firmas digitales con XML y
estándares de encriptación; WS-Security luego provee perfiles de seguridad para
el intercambio de esta información. Otra infraestructura de ligamiento de nivel
de seguridad incluye CSIv2 para la comunicación basada en IIOP adoptada por
los proveedores de CORBA y el J2EE 1.4 como un estándar obligatorio para el
intercambio de mensajes seguros IIOP.
1.3.1.4 Expresión e Intercambio de Políticas
Para que pueda existir un intercambio de mensajes seguros, tanto la petición
del servicio como el proveedor del mismo deben acordar ciertas políticas para que
ocurran la recepción segura del mensaje y la conversación. Este acuerdo de políticas
debe llevarse a cabo anticipadamente (p.ej., información estática) o en tiempo
de ejecución (p. ej., dinámica), y las mejores posibles selecciones de ligamientos
de seguridad deben ser realizadas tanto dellado del proveedor del servicio con
en el de la petición del servicio de conversación. La grid, siendo un ambiente
altamente dinámico, también requiere políticas dinámicas y decisiones que deben
34
Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia
ser efectuadas en tiempo de ejecución. Estas políticas dinámicas pueden estar
asociadas con el servicio WSDL o ser intercambiadas a través de negociaciones
colaborativas.
Uno de los candidatos tecnológicos notables en las áreas de intercambio
de políticas es WS-Policy, el cual detalla cómo los proveedores y las peticiones de
servicio pueden especificar sus requerimientos y capacidades respectivas.
La próxima capa está relacionada a la naturaleza y aplicación de estas
políticas. Esto es, una asociación segura entre los puntos terminales del servicio;
mapeo de identidades y traducción de credenciales, y políticas de autorización y
de privacidad los que proveen control de acceso a los servicios.
1.3.1.5 Asociación segura
En el contexto grid, las comunicaciones entre el que pide y el que provee
un servicio son, a menudo, conversaciones de largo alcance a través de varios
intercambios de mensajes. La arquitectura de seguridad OGSA especifica crear un
contexto seguro durante la negociación inicial entre el cliente y el servicio, mientras
utiliza el mismo contexto para proteger los mensajes subsiguientes.
El contexto seguro es luego acoplado con el transporte de los servicios de red
y este concepto está ya disponible con la mayoría de los protocolos de seguridad
(p. ej., SSL y IIOP-CSIv2). Para el ambiente de cómputo grid OGSA, el soporte de
conversación segura es provisto usando el protocolo WS-SecureConversation.
1.3.1.6 Mapeo/Traducción de Identidad y Credenciales
Un ambiente grid consiste de múltiples confianzas (p. ej., organizaciones
virtuales) y dominios de seguridad. Para cruzar las fronteras del dominio se requiere
autenticación mutua. Así, existe un requerimiento para mapear y/o traducir las
credenciales desde un dominio a otro. Esta interoperación necesita una “federación”
de dominios y sus mecanismos de seguridad.
Esta federación puede ser lograda a través del mapeo y/o traducción de
identidades y/o credenciales desde un dominio a otro utilizando algún servicio
intermediario de confianza, gateways o proxies. En el contexto de Web services, hay
algún trabajo que define esta federación de patrón y modelo de intercambio de
mensajes. La comunidad grid espera la WS-Federation para llegar a ser un enfoque
basado OGSA de servicios grid.
35
Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia
1.3.1.7 Reforzamiento de autorización
La autorización para acceder a un recurso es controlada por políticas
reforzadas en el lado del ambiente del proveedor del recurso. Hoy en día, hay
varios mecanismos de autorización comerciales disponibles a través de la industria.
Los más prominentes son la autorización basada en el rol, la basada en la regla y
la basada en la identidad. La selección de estos mecanismos está completamente
referida a los requerimientos de servicio, capacidades de hospedaje de la plataforma
y el dominio de la aplicación (p. ej., B2B, B2C, G2C, etc.).
WS-Authorization provee detalles más concretos de cómo son especificadas
y administradas las políticas de acceso para servicios grid y Web services. En los
escenarios grid actuales, la mayoría de los accesos a los recursos es controlado
considerando la identidad de quien hace la petición. Esto requiere que el recurso
mantenga una lista de control de acceso (ACL) con la identidad del usuario final, o
con su identidad mapeada. En el segundo caso, debe ocurrir un mapeo o traducción
de la identidad antes que el usuario final pueda acceder al o los recursos.
1.3.1.8 Reforzamiento de Privacidad
Mantener el anonimato, o la capacidad de retener la información privada,
es uno de los requerimientos de núcleo en muchos ambientes de servicios grid.
Las organizaciones involucradas en el mundo grid pueden necesitar declarar
sus requerimientos de privacidad y, a la inversa, pueden necesitar monitorear
la privacidad de los resultados de reforzamiento de ésta. La especificación WSPrivacy provee mecanismos para describir un modelo, incrustar información
privada e intercambiar esta información en conjunto con los mensajes. En el caso
de requerimientos de protección de privacidad que deben ser declarados a los
clientes, el ambiente grid debe adherirse al modelo WS-Policy, y así alinearse con
los esfuerzos P3P del W3C.
1.3.1.9 Confianza
Cada miembro de una Organización Virtual va a tener una infraestructura de
seguridad que incluya el servicio de autenticación, registro de usuario, motor de
autorización, firewalls, protección a nivel de red y otros servicios de seguridad. Estas
políticas de seguridad son definidas en el dominio de seguridad en el cual ellos
existen. Este modelo autocontenido requiere una confianza entre los miembros de
la organización virtual antes que ellos puedan acceder a los servicios anteriores.
Ésta puede ser llamada “membresía en la Organización Virtual” y permitirá un
conjunto de políticas entre los participantes de la Organización Virtual, políticas de
36
Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia
mapeo de identidad y credenciales, y/o una membresía con el lado de confianza a
través de algunos proxies o gateways. El modelo de confianza grid está basado en
la especificación WS-Trust.
1.3.1.10 Servicios de Seguridad de Núcleo para OGSA
Para poder lograr las capacidades anteriormente mencionadas, el estándar de
seguridad grid OGSA ha definido un conjunto de servicios abstractos encima de la
plataforma y del framework de seguridad existente. Estos servicios son expuestos
a través del WSDL.
La Figura 5 detalla los servicios de la plataforma de seguridad OGSI y sus
relaciones con otros componentes OGSA. A continuación exploraremos con más
detalle los candidatos de servicio de seguridad:
• Servicio de Autenticación. Valida la identidad del que pide el servicio. Un
ejemplo puede ser el mecanismo de autenticación básico donde la identidad
del usuario y contraseña son validados dentro del registro del usuario.
• Servicio de mapeo de identidad. Provee una función de mapeo de
identidad donde una identidad de servicio puede ser mapeada a otra
identidad de servicio en otro dominio. Estos servicios no están relacionados
con el servicio de autenticación.
• Servicio de Autorización. Resuelve la petición para acceder a un servicio
verificando las políticas de acceso asociado con la petición. El servicio de
seguridad OGSA se basa en el mecanismo de control de acceso al ambiente
del equipo usando la identidad del peticionario del servicio y las políticas
asociadas con este último.
• Servicio de políticas de organización virtual. El servicio de seguridad
OGSA puede utilizar el framework de políticas OGSA para proveer el
almacenamiento, aplicación y validación de políticas.
• Servicio de conversión de credenciales. Responsable para la conversión de
credencial de usuario a otro tipo o forma de credencial.
• Servicio de auditoría. Responsable de producir los registros de las
actividades de seguridad y de hacerlo sobre la base de las políticas
especificadas.
• Servicio de perfiles. Se refiere a la creación y el almacenamiento de los
perfiles, incluyendo los datos personales.
• Servicio de privacidad. Está relacionado con la clasificación de políticas.
Estos servicios pueden ser utilizados para forzar los requerimientos de
privacidad para un servicio de petición y del proveedor.
37
Capítulo I: e-Infraestructuras para el desarrollo de e-Ciencia
OGSA Services
OGSA Security Service Candidates
No
Security
Authentication
Authorization
ID mapping
VO Policy
Credential Mapping
Privacy
WS-Security, WS-Trust,
WS-Secure Conversation,
WS-Policy, WS-Privacy,...
OGSI
XML
Audit/Profile
Native Registries
and Services
IIOP/HTTP/SSL/SOAP
Figura 5. Componentes de seguridad de la plataforma OGSA.
38
Capítulo II: Estado del Arte Internacional
2 Capítulo II
Estado del Arte Internacional
2.1 Introducción
“Hay cientos de grid computacionales alrededor del mundo. Muchas se están
usando en e-Ciencia, posibilitando la ejecución de proyectos que serían imposibles de
realizar sin el poder computacional de la grid.
• “Los biólogos están empleando grids para simular miles de posibles drogas
en sus computadores, con el objetivo de descubrir una molécula capaz de
bloquear proteínas específicas de ciertas enfermedades. • “Los científicos de la Tierra están empleando grids para registrar los niveles
de ozono, usando satélites, descargando diariamente cientos de Gigabytes de
datos (¡el equivalente a 150 CDs cada día!) • “Los físicos de altas energías están aplicando las grids en su búsqueda por
una mejor comprensión del Universo, sobre la base de una grid de decenas de
miles de computadoras de escritorio para almacenar y analizar los 10 Petabytes
de datos (¡equivalentes a los datos que pueden contener alrededor de 20
millones de CDs!) producidos anualmente por el Gran Colisionador de Hadrones
(Large Hadron Collider). Miles de físicos en docenas de universidades alrededor
del mundo quieren analizar esos datos.. • “Los ingenieros están usando las grid para estudiar energías alternativas,
tales como la fusión de energía. • “Los artistas hoy usan las grid para crear complejas animaciones para las
películas (puedes ver un buen ejemplo en Kung Fu Panda). • “Los cientistas sociales hoy estudian la vida de las abejas, el maquillaje que
emplea nuestra sociedad y los secretos de la historia, mediante el uso de las
grid. • “... y más, más, ¡mucho más!
39
Capítulo II: Estado del Arte Internacional
“La computación grid no solo provee los recursos que permiten a nuestros
científicos manejar grandes colecciones de datos, además permite que estos datos
estén distribuidos por todo el mundo, los que significa que los equipos de científicos
pueden trabajar en proyectos internacionales desde la comodidad de sus propios
laboratorios. “La computación Grid está brindándole poder a la ciencia de todo el orbe, al proveerle
de la tecnología que se requiere para explorar nuevos modos de hacer ciencia. Hoy
los científicos pueden compartir datos, espacio de almacenamiento de datos, poder
computacional y resultados. Unidos, los investigadores pueden hoy, como nunca
antes, enfrentar de mejor modo los grandes cuestionamientos: desde la cura a las
enfermedades y el manejo de desastres, hasta el calentamiento global y los misterios
del universo”12.
Las grid internacionales cruzan las fronteras de los países, expandiendo las
culturas, las lenguas, las tecnologías y más, para crear recursos internacionales y
darle poder a la ciencia global, empleando computación global.
2.2 Incorporación de HPC en el mundo
Estos grandes centros de HPC (high performance computing – computación
de alto rendimiento) en el mundo están conformados por grandes clusters que se
unen a través de una grid como un estándar para compartir recursos distribuidos
y accesibles a través de Internet; en ellos es posible compartir el cálculo, el
almacenamiento y la información, entre otros.
La evolución de las redes de comunicación de alta velocidad dedicadas a
la investigación y las tecnologías y aplicaciones colaborativas, están creando un
escenario idóneo para la interacción entre investigadores.
La herramienta más utilizada en entornos científicos es Globus Toolkit,
software de código fuente abierto, impulsado por Globus Alliance, que permite la
construcción de grids. En poco más de cinco años, tanto en Estados Unidos como
en Europa se han puesto en marcha diferentes proyectos grid, entre los que se
destacan el proyecto EELA (con financiamiento europeo y participación de países
europeos y latinoamericanos) y PRAGMA GRID (Estados Unidos).
12
GridCafe, Las Grid del Mundo, en: [http://www.gridcafe.org/las-grid-delmundo_ES.html]
40
Capítulo II: Estado del Arte Internacional
2.3 Proyectos de e-Infraestructuras
A continuación se presentan algunos de los proyectos grid que son actores
de este nuevo concepto de la computación. En la tabla se da cuenta del nombre
del proyecto y de la institución coordinadora, y se entrega una breve explicación
del mismo, las aplicaciones que soporta, los recursos locales, el capital humano
que se necesita para su administración y algunos recursos grid.
2.3.1 APGRID (www.apgrid.org)
Institución
Coordinadora
National Institute of Advanced Industrial Science and Technology(AIST)
Países
Participantes
Australia, Canadá, China, Hong Kong, India, Japón, Malasia, Nueva Zelanda,
Filipinas, Singapur, Corea del Sur, Taiwán. Tailandia, USA, Vietnam
Instituciones
participantes
• Australia: APAC, ANU, Monash U., U. of Melbourne, Sydney VisLab,U. of
Adelaide, Griffith U.
• Canadá : National Research Council, CANARIE
• China: ICT/CAS, CNC/CAS, SDB/CAS
• Hong Kong : CSIS/HKU, Computer Center/HKU
• India: CDAC, U. of Hyderabad
• Japón: AIST, TITECH, U. of Tsukuba, RIKEN, KDDI, Osaka U., NAIST,
Doshisha U., Kyushu Inst. of Technology, U. Tokyo, RACE / U. Tokyo,
Waseda U.
• Malasia :USM, UTM
• Nueva Zelanda: U. of Otago
• Filipinas: Ateneo de Manila Univ.
• Singapur: NGO, iHPC, NTU, NUS, SCS, APSTC
• Corea del Sur: KISTI
• Taiwán: NCHC, ASCC
• Tailndia: NECTEC, Kasetsart U., KMITNB
• U.S.A.:Indiana U., SDSC, San Jose State U.
• Vietnam: MOSTE, NCST
Integración
Abierta a la comunidad
Área científica /
Aplicaciones
Earth Science: Climate simulation, Fluid simulation, Earthquake engineering.
Bio Informatics: Genome science
Sitio web
www.apgrid.org
41
Capítulo II: Estado del Arte Internacional
Comunidad del Asia - Pacífico vigente desde el 2001 para crear testbeds
(sitios de prueba), promover las tecnologías grid y otras labores de desarrollo de
tecnologías grid propiamente tales, como Ninf-G. Su propósito es desarrollar una
asociación entre las comunidades de Asia y el Pacífico, considerándose como un
punto de encuentro para todos los investigadores, además de ser un canal de
comunicación a la GGF, la red y hacia otras comunidades (por ejemplo, TeraGrid,
UK-eScience, EUGrid, etc). Participan actualmente 49 organizaciones de 14 países.
Enhance Economic Competitiveness of the Rigion by Increasing
the Research Power for Science and Technology
Execution of Asia Pacific Grid Application Project
Emerging Industry : IT,BT, NT ET, etc.
Industry: Semiconductor, Car, Steel, Machimery, etc.
al
Gri
sive Grid
)
ten
Large capacity
Storages
Research Instruments
R&D
Resources
In Asia
Countries
n
In
omputatio
(NGI Killer
Application)
Computers
C
-(
APGrid
Implementation
Project
ess Gri
d)
Acc
-(
Grid Project
& Support
In the Asia Pacific
d) - (Dat
a
Grid
Creative Experts
Middleware (Globus, KMI-R1, ...)
High Speed Networks (APII,STARTAP, Sing AREM, ...)
2.3.1.1 Recursos Grid
Globus Toolkit 2
MPICH-G2: Data-parallel Programming
Ninf-G2: Task-parallel Programming
SCMSWeb: Resource monitoring
Nimrod-G: Parametric modeling system
Iperf: Network measurement
Grid Data Farm: Grid File System
42
Capítulo II: Estado del Arte Internacional
2.3.2 AUSTRIAN GRID (www.austriangrid.at)
Institución
Coordinadora
Miembros del consorcio de las instituciones participantes.
Países Participantes
Austria
Instituciones
participantes
• Institute of Graphics and Parallel Processing, Johannes Kepler
University
• Department of Computer Sciences, University of Salzburg
• Institute of Computer Science, University of Innsbruck
• RISC-Research Institute for Symbolic Computation, Johannes Kepler
University
• Department of Distributed Systems, University of Vienna
• Department of Telecooperation, Johannes Kepler University
• Research Lab Computational Technologies and Applications, University
of Vienna
• FAW, Johannes Kepler University
• Department of Distributed and Multmedia Systems, Universtiy of
Vienna
• Department of Informations Management, Johannes Kepler University
• Department of Knowledge and Business Engineering, Universtiy of
Vienna
• University of Applied Sciences Vorarlberg
• Kanzelhoehe Observatory for Solar and Environmental Research, Karl
Franzens University Graz
• Institute of Bioinformatics, Johannes Kepler University
• Core Unit for Medical Statistics and Informatics,Medical University of
Vienna
• Institute of Materials Chemistry,Vienna University of Technology
• Institute of Meteorology and Geophysics Innsbruck, University of
Innsbruck
• Institute of Computational Mathematics, Johannes Kepler University
• Institute for Mathematics and Scientific Computing, Karl Franzens
University Graz
• Institute for Informatics, University of Innsbruck
• Department of Scientific Computing, University of Vienna
• Institute of Astro- and Particle Physics, University of Innsbruck
Integración
Abierto a la comunidad científica austríaca
Área científica /
Aplicaciones
Investigación base en middleware grid; evaluación de grids a través de
diseño de aplicaciones científicas; establecer un centro de servicios
computacionales distribuido en Austria y sustentable en el tiempo; promover
desarrollo de proyectos entre la industria e investigadores.
Principalmente, hay proyectos del área de física de altas energías
Sitio web
www.austriangrid.at
43
Capítulo II: Estado del Arte Internacional
Ministerium
Eu
Projekt Management
Koordinator J. Volkert, B. Buchberger, D. Kuhn
Projektbüro
PAK
R. Kobler, W. Schreiner, T. Fahringer
AGFZ
Austrian Grid
Forschungszentrum
AGFZ
Austrian Grid
Entwicklungszentrum
AGFZ
Austrian Grid
Servicezentrum
Grudlagen
18 WP
Risc Software
GmbH
Leiter
Integrierte
Anwendungen
8 WP
Aufbau eines
Entwicklungszentrums
1 WP
Aufbau einer
nachhaltigen
Infrastruktur
3 WP
Sonstige
Anwendungen
Projektkoordinierungskomitee
Red nacional austriaca cuya investigación fundamental es en el ámbito de
los middleware de la red informática, además del establecimiento de un centro de
servicios que integre investigación y aplicaciones industriales. Austrian Grid está
financiada por BMWF (Federal Ministry of Science and Research).
La organización de la grid considera la siguiente estructura:
AGFZ: Centro de Investigación de la grid austriaca, realiza investigación
básica en grandes redes, desarrolla prototipos y apoya los investigadores
que utilizan la tecnología grid para sus proyectos.
AGEZ: Centro de Desarrollo; sirve como punto de encuentro para la industria
y la investigación. Su objetivo es el desarrollo de cooperaciones y servicios
para el uso industrial de la tecnología Grid.
44
Capítulo II: Estado del Arte Internacional
AGSZ: es el centro nacional de EGI (Iniciativa de Grid Europea). Ejecuta y
mantiene la infraestructura de la red austriaca.
2.3.2.1 Recursos Locales
Capacidad de Cómputo
722 cores
Almacenamiento
16 Tb
Software
Servicios
Heredados de EGEE
Redes
Otros
Site
Master
RAM
SI00
SF00
LRM
ALTIX-UIBK
altix1.uibk.ac.at
16
16
0
15026
1078
1942
torque
JKU
altix1.jku.austriangrid.at
64
57
7
65536
1078
1942
pbs
JKU
hydra.gup.uni-linz.ac.at
16
16
0
2025
667
633
pbs
JKU
lilli.edvz.uni-linz.ac.at
256
256
0
993322
1335
3020
Marvin
blade.labs.fhv.at
24
23
1
7971
1000
950
sge
dps-prod
karwendel.dps.uibk.ac.at
112
110
0
15401
1499
1861
sge
hc-cluster
hc-ma.uibk.ac.at
234
132
37
3899
877
833
sge
722
610
45
Total
CPUs
Free Jobs
(Fuente: http://agrid.uibk.ac.at/austriangrid/ )
45
Capítulo II: Estado del Arte Internacional
2.3.2.2 Recursos Grid
Middleware gLite, basado en EGEE.
2.3.3 BalticGrid II (www.balticgrid.org)
Institución Coordinadora
KTH - Royal Institute of Technology, Suecia
Países Participantes
Estados Bálticos
Instituciones participantes
Estonia, Latvia, Lithuania, Belarus, Polonia, Suiza, Suecia.
Integración
Miembros de BalticGrid solamente.
Área científica / Aplicaciones
High Energy Physics, Material Science and quantum chemistry,
framework for engineering modelling task, nano-sciences,
engineering sciencs, linguistics, bioinformatics and biomedical
imaging
Sitio web
http://www.balticgrid.eu/
BalticGrid tiene como propósito establecer una infraestructura de grid para
apoyar a científicos bálticos y bielorrusos a través del consorcio BG-II. Proyecto
financiado por la Unión Europea mediante el Séptimo Programa Marco, en el área
de actividad de “Infraestructuras para la Investigación”, FP7-INFRA-2007-1.2.3. Su
período de ejecución se extiende desde el 1 de mayo de 2008 hasta el 30 de abril
de 2010.
2.3.3.1 Recursos Locales
Capacidad de Cómputo
4200 CPU en total en 26 sitios
Almacenamiento
500 Tb
Software
Gamess, MPI
Servicios
Heredados de EEGE
Redes
Otros
46
Capítulo II: Estado del Arte Internacional
Según http://www.balticgrid.eu/Activities/SA1_Activity/resources :
Lituania:
* 32 nodos con procesadores Pentium Celeron, 100GB de almacenamiento,
apoyo de BalticGrid, DTeam VO-s. UI disponible para usuarios locales.
* 4 nodos Itanium 2, 20 GB de almacenamiento, apoya a la OV BalticGrid, UI
disponible.
Polonia:
* 34 nodos Itanium 2 1.3 GHz, 60GB de almacenamiento, apoya a las OV
de Alice, BalticGrid, Biomed, CompChem, DTeam y Voce. UI disponible para
usuarios locales.
* 50 nodos Itanium 2 1.3 GHz, 250GB de almacenamiento, apoya a las OV de
BalticGrid, DTeam y otras.
Estonia:
* 6 AMD Athlon MP, 2 TB de almacenamiento, apoya a las OV de BalticGrid,
CMS, Estonia, DTeam.
* 10 AMD Athlon64 3500+, 7 TB de almacenamiento, apoya a las OV de
BalticGrid, CMS, DTeam, UI disponible para usuarios locales
* 25 nodos (dual Opteron 275) cluster, 14 TB de almacenamiento.
Latvia:
* 21 AMD Opteron (146), 1.7 TB storage, supports BalticGrid, CMS, OPS,
GAMESS, LHCb, BGtut VO-s. UI available for local users.
* 5 nodes 20cores(Dualcore-Opteron 275)
* 1 node P4, 5GB storage
2.3.3.2 Recursos Grid
Interopreación entre UNICORE, ARC, gLite, integrado en BalticGrid.
Un sistema interesante es el de “Grupos de Soporte de Aplicaciones”, que,
conformado por un equipo de técnicos, brinda soporte a los usuarios, operando
como interfaz entre los científicos y los administradores de cada sitio. Estos
equipos se conforman en cada país para ayudar en los procesos de migración de
las aplicaciones al ambiente de grid.
47
Capítulo II: Estado del Arte Internacional
2.3.4 The Belgian Grid for Research (Begrid)
(www.begrid.be)
Institución Coordinadora
Belgian National Research Network (BELNET)
Países Participantes
Bélgica
Instituciones participantes
Hogeschool Antwerpen, Katholieke Universiteit Leuven, Universiteit
Antwerpen, Universiteit Gent, Université Libre de Bruxelles, Vlaams
Instituut voor de Zee, Vrije Universiteit Brussel
Facultés Universitaires Notre-Dame de la Paix (Namur)
En proceso de incorporación :
Faculté Polytechnique de Mons, Centre of Excellence in Information
and Communication Technologies y Vlaams Instituut voor
Technologisch Onderzoek
Integración
Abierta a miembros de BELNET
Área científica / Aplicaciones
Ciencia en general: física de altas energías, astrofísica, ciencias de
la Tierra, etc.
Sitio web
www.begrid.be
BEgrid es la infraestructura de grid de cómputo y datos de la grid belga para
la investigación.
2.3.4.1 Recursos Locales
Capacidad de Cómputo
1000+ cores
Almacenamiento
3 Tb
Software
Servicios
Heredados de EEGE
Redes
Otros
BEgrid cuenta con 1000 CPUs y 3 terabytes de capacidad de almacenamiento.
La capacidad de cálculo y almacenamiento se distribuye entre los distintos
participantes en el proyecto:
* Cluster BELNET: VOMS, broker de recursos, UI, BDII, LFC, no hay nodos de
trabajo
48
Capítulo II: Estado del Arte Internacional
* FUNDP: 3 nodos de trabajo (6 CPUs)
* HA: 4 nodos de trabajo
* K.U.Leuven: UI, 46 máquinas, 4 servidores, 42 nodos de trabajo (232 CPUs)
* UA: RB, UI, 81 máquinas, 5 servidores, 76 nodos de trabajo (160 CPUs)
* UGent: RB, UI, 79 máquinas, 8 servidores, 72 nodos de trabajo (230 CPUs)
* VLIZO: 6 nodos de trabajo (412 CPUs), 10 Tbyte de almacenamiento
* VUB/ULB: RB, UI, 71 máquinas, 20 servidores, 51 nodos de trabajo (232
CPUs)
2.3.4.2 Recursos Grid
BEgrid escogió a gLite como middleware. Esta elección fue motivada por el
estado avanzado del software y su aplicación en ambientes de investigación en
muchos países europeos.
49
Capítulo II: Estado del Arte Internacional
2.3.5 BiG Grid - Grid Holandesa de e-Ciencia
(http://www.nwo.nl)
Institución
Coordinadora
Países
Participantes
Instituciones
participantes
• Stichting Nationale Computer Faciliteiten
• Nederlands Bio-Informatica Centrum
• Nationaal Instituut voor Kernfysica en Hoge-Energie Fysica
Holanda
• DANS
• LHC Computing Grid : La misión de proyecto LHC Computing (LCG) es el
de construir y mantener un almacenamiento de datos y análisis de toda la
infraestructura para la comunidad de física de altas energías que utilizará
el LHC.
• LOFAR: Estudio de señales electrónicas
• Netherlands Bioinformatics Centre NBIC: Coordina la investigación
y actividades de apoyo para estimular el desarrollo del campo de la
bioinformática en los Países Bajos.
• Philips Research COS group,: Investigación Privada
• Virtual Laboratory for e-Science Application Programme: Ligado a la
investigación de ciencias ed datos intensiva, informática alimentaria,
imágenes biomédicas, biología de sistemas, ecología y tele-ciencia, entre
otros.
• Centrum voor Klimaat Onderzoek: El Centre for Climate Research
(CKO) es una cooperación entre el Institute for Marine and Atmospheric
Research (IMAU) de la Universidad Utrecht, el National Institute of Public
Health and Environmental Protection (RIVM), y el Royal Netherlands
Meteorological Institute (KNMI). El objetivo principal de CKO es mejorar
la coordinación y la cooperación entre las partes en el ámbito de la
investigación climática.
Integración
Área científica /
Aplicaciones
Comunidades de investigadores holandeses: ciencias de la vida, astronomíam
física de partículas, meteorología, e investigación en clima y manejo de aguas.
Sitio web
www.biggrid.nl
Big grid es un consorcio de instituciones que tiene como propósito realizar
una grid nacional como infraestructura para la e-Ciencia, que permita integrar y
mantener la continuidad de muchas comunidades de investigación holandesas,
que abarcan ámbitos tan importantes como las ciencias de la vida, astronomía,
física de partículas, meteorología, clima y gestión del agua, entre otros.
El consorcio nació en 2005, con un financiamiento de 30M euros para un período
de 4 años. La propuesta es un esfuerzo de colaboración de NCF, NBIC y NIKHEF.
50
Capítulo II: Estado del Arte Internacional
2.3.5.1 Recursos Locales
Capacidad de Cómputo
Almacenamiento
Software
Servicios
Redes
Otros
Los planes del 2005 para BiG Grid eran los que se muestran a continuación:
BIG GRID
capacity in 2009
In today’s (2005) technology
this would correspond to
27600 kSI2k
10530 processors
Mass storage on tape
7910 Terabyte
1700000 DVD’s
Fast disks
6190 Terabyte
1317000 DVD’s
Disk caches and data acquisition space
1670 Terabyte
20875 home PC disks
Total compute cluster capacity
Big Grid dispone de servicios de almacenamiento y procesamiento de datos,
distribuidos como se explica en los siguientes párrafos.
2.3.5.2 SARA Reken en Netwerkdiensten - Iniciativa Holandesa
de grid (www.sara.nl)
2.3.5.2.1 Recursos Locales
•CPU con alto flujo de información: 36 kSI2k (MATRIX), 460 kSI2k (GINA),
1875 kSI2k (LISA)
•Capacidad de cómputo de CPU: vía NCF
Procesamiento de Datos Nikhef
•CPU con alto flujo de información: 960 kSI2k (PRD)
•Almacenamiento: 86 Terabyte sólo disco de red
51
Capítulo II: Estado del Arte Internacional
Future housing: Philips Research: PHICOS
•CPU con alto flujo de información: - kSI2k ()
• Almacenamiento: - Terabyte sólo disco de red
Futuro sitio de albergue: Rijks Universiteit Groningen Centrum voor
Informatie Technologie (RUG-CIT)
• CPU con alto flujo de informaciónt: 300 kSI2k
Para el proyecto se consideran entre otros costos operacionales, dos system
managers por cuatro años, por un total de 800.000 € (100.000 € anuales cada
uno).
2.3.5.2.1 Recursos Grid
No se explica en detalle.
2.3.5.3 The Hungarian ClusterGrid Infrastructure (CG) (www.mgkk.hu)
Institución Coordinadora
Países Participantes
Hungría
Instituciones participantes
Eötvös Loránd University of Sciences (ELTE), Technical University of
Budapest (BME), Computer and Automation Research Institute of the
Hungarian Academy of Sciences (MTA-SZTAKI), Office for National
Information and Infrastructure Development (NIIF/HUNGARNET).
Integración
Abierto a miembros de NIIF/HUNGARNET
Área científica / Aplicaciones
Sitio web
www.clustergrid.iif.hu
El proyecto ClusterGrid aspira a integrar el procesador Intel basado en PC
en un conjunto de clusters único, amplio, de extensión nacional, interconectados.
Los PC son provistos por participantes de institutos húngaros, tales como colegios
secundarios, universidades o bibliotecas públicas; la infraestructura central y la
coordinación es provista por NIIF/HUNGARNET. Cada institución que contribuye
al proyecto usa sus PCs para sus propios propósitos durante las horas laborales,
por ejemplo para propósitos educacionales o de trabajo de oficina, y ofrece su
infraestructura para altos flujos de información cuando no están empleándola
para sus propósitos, durante las noches o los fines de semana que no se trabaja.
El uso combinado durante el día (modalidad individual) y la noche (modalidad
52
Capítulo II: Estado del Arte Internacional
grid), le permite a ClusterGrid emplear los ciclos de CPU (que de cualquier modo
estarían perdidos) para proveer de una fuerte infraestructura computacional a la
comunidad nacional de investigación.
El proyecto inició sus operaciones en el año 2003 y hasta el 2005 tuvo
participación activa de sus miembros. A partir de dicha fecha, la iniciativa pasó a
ser el Centro Húngaro de Competencias en Computación Grid (MGKK, su sigla en
húngaro) (www.mgkk.hu).
2.3.5.3.1 Recursos Locales
Capacidad de Cómputo
Almacenamiento
Software
Servicios
Redes
Otros
En su inicio (2003), se disponía de nodos de trabajo con procesadores Intel de
1,6 Ghz, destacando el buen rendimiento en I/O. Los PC son del tipo IBM Intellisation
E Pro o HP vectra.
En la actualidad, la configuración soporta tareas secuenciales y tareas paralelas
mediante la biblioteca PVM (Parallel Virtual Machine). Dispone de herramientas de
desarrollo de software basadas en GNU como compiladores (gcc, g++, g77) junto
con PVM, accesibles en la máquina de enterada. También dispone de herramientas
de software de desarrollo de Condor, tales como condor_compile.
53
Capítulo II: Estado del Arte Internacional
Recursos disponibles en enero de 2009
Institución
Ubicación
Ciudad
Número de
Nodos
Budapest Business School
Library
Budapest
40
Budapest Polytechnic
Tavaszmező str.
Budapest
100
Budapest Polytechnic
Bécsi str.
Budapest
62
Budapest Polytechnic
Népszínház str.
Budapest
20
Budapest University of Economic Science
Sóház Building
and Public Administration
Budapest
20
College of Dunaújváros
SZSZK
Dunaújváros
60
Eötvös Loránd University
Lovarda Center
Budapest
100
Eötvös Loránd University
DB Lab
Budapest
60
Eszterházy Károly College, Eger
Central Building
Budapest
80
Georgikon Faculty of Agriculture
Computer Lab 1
Keszthely
40
Hungarian University of Craft and Design Central Building Lab
Budapest
16
Kempelen Farkas Student Information
Kálvin sqr.
and Resource Center
Budapest
250
Pázmány Péter Catholic University
Práter street
Budapest
40
Kölcsey Ferenc College
Main Building
Debrecen
20
Semmelweis University
Computer Lab 1
Budapest
18
Semmelweis University
Student>s Center
Budapest
20
Szent István University
Library
Gödöllő
20
Szent István University
AOTK
Budapest
20
Széchenyi István University
Building B
Gyõr
130
Technical University of Budapest
HSZK
Budapest
60
University of Debrecen
Central Building
Debrecen
60
University of Kaposvár
ATK
Kaposvár
20
University of Miskolc
IIS Building
Miskolc
18
University of Pécs
Faculty of Technical
Sciences
Pécs
23
54
Capítulo II: Estado del Arte Internacional
University of Pécs
Faculty of Natural Sciences Pécs
20
University of Szeged
EFK
Szeged
40
University of Szeged
TIK
Szeged
160
University of Veszprém
Central Building
Veszprém
40
University of West Hungary
Library
Sopron
60
Zrínyi Miklós University of Defense
Library
Budapest
20
2.3.5.3.2 Recursos Grid
Los servidores de la grid-bone (GBone) son máquinas IBM X220, el punto
de entrada central es un computador Dell PowerEdge 2650 que incluye dos
procesadores 2.0 GHz Xeon. El sistema operativo generalmente es Linux: en los PC
hay distribuciones RedHat 7.3, en las máquinas en la GBone hay Debians y RedHats.
El planificador local es Conder. Cada laboratorio es tratado como un grupo Condor
individual y los distintos grupos están interconectados por un mecanismo de
agrupación Condor nativo. El punto de entrada es un conjunto Condor “singular”.
2.3.5.4 Croatian National Grid Infrastructure (CRO NGI) Iniciativa Nacional Croata de Infraestructura Grid (http://
www.cro-grid.hr)
Institución Coordinadora
University Computing Centre, Sarajevo, Croacia (SRCE)
Países Participantes
República de Croacia
Instituciones participantes
SRCE, FESB, IRB, ETFOS, GRADRI
Integración
Miembros de solamente.
Área científica / Aplicaciones
Cómputo científico en general
Sitio web
http://www.cro-ngi.hr/index.php?id=1334&L=1
La Iniciativa Nacional Croata de Infraestructura Grid es un entorno integrado
de cómputo y almacenamiento. Es un recurso compartido que sirve a la comunidad
académica y científica de Croacia. Su financiamiento es a través del gobierno croata.
El proyecto corresponde a la segunda fase de CRO-GRID, ejecutado entre 2004 y
2009.
55
Capítulo II: Estado del Arte Internacional
2.3.5.4.1 Recursos Locales
Capacidad de Cómputo
204 cores
Almacenamiento
5.1 Tb
Software
Sun Grid Engine (SGE) / Torque / Maui
MPICH
Compiladores Intel C y Fortran
Intel Math Kernel Library (MKL)
Gaussian
Librerías matemáticas NAG para Fortran
Servicios
Redes
Otros
En la fuente están disponibles los siguientes servicios centrales:
* MyProxy - sistema para almacenamiento, rescate y refrescamiento
automatic de credenciales de usuarios.
* Globus WS MDS - servicios centrales de sistemas de monitoreo WS MDS.
56
Capítulo II: Estado del Arte Internacional
Sitio
RAM
(por
nodo) Capaccidad e
almaccenammiento
(por
nodo)
SpecInt
(por
nodo)
Nodos
Uso
Modelo
Arquittectura
Proccesammientto o
cores
3
servidor
central
HP
ProLiant
DL385 G2
x86_64
2
Dual-Core
AMD Opteron
2.2 GHz
8 GB
70 GB
1
elemento
de
almacenammiento
HP
ProLiant
DL385 G2
x86_64
2
Dual-Core
AMD Opteron
2.2 GHz
8 GB
5.1 TB
1
frontend
HP
ProLiant
DL385 G2
x86_64
2
Dual-Core
AMD Opteron
2.2 GHz
8 GB
70 GB
12
nodo de
trabajo
HP
ProLiant
BL460c
G1
x86_64
8
Intel Xeon 2.3
GHz
16 GB
140 GB
10136
1
elemento
de
almacenammiento
i386
2
Intel Xeon 3.2
GHz (32-bit)
2 GB
1.2 TB
1
frontend
HP
ProLiant
DL385 G2
x86_64
2
Dual-Core
AMD Opteron
2.2 GHz
8 GB
70 GB
12
nodo de
trabajo
HP
ProLiant
BL460c
G1
x86_64
8
Intel Xeon 2.3
GHz
16 GB
140 GB
10136
1
frontend
i386
1
Intel Pentium
4 2.4 GHz
1 GB
80 GB
3
nodo de
trabajo
HP
ProLiant
BL20p G2
i386
2
Intel Xeon 2.8
GHz (32-bit)
2 GB
36.4 GB
2150
1
frontend
i386
1
Intel Pentium
4 2.8 GHz
1 GB
40 GB
3
nodo de
trabajo
HP
ProLiant
BL20p G2
i386
2
Intel Xeon 2.8
GHz (32-bit)
2 GB
36.4 GB
2150
Modelo del
procesados
Srce
FESB
IRB
ETFOS
GRADRI
57
Capítulo II: Estado del Arte Internacional
2.3.5.4.2 Recursos Grid
Globus 2.4 y Globus 4. Ganglia. Los sistemas están fuertemente influenciados
por EGEE, debido a proyectos anteriores.
2.2.5.5 Distributed European Infrastructure for Supercomputing
Applications (DEISA) (http://www.deisa.eu/science/)
Institución Coordinadora
Rechenzentrum Garching (RZG) of the Max Planck Society
Países Participantes
España, Francia, Reino Unido, Alemania, Italia, Holanda y
Finlandia
Instituciones participantes
Barcelona Supercomputing Center, IDRIS-CNRS, European
Centre for Medium-Range Weather Forecast, Edinburgh
Parallel Computing Centre, Jülich Forschungcetre, HLRS,
LRZ, RZG, CINECA, SARA, CSC
Integración
Abierto a miembros de instituciones del consorcio, asistentes
a talleres y afiliados a comunidades científicas virtuales
asociadas a DEISA.
Área científica / Aplicaciones
Dinámicas moleculares
Ciencias de los materials, Nanociencia
Biomédica, Ciencia de los Materiales
Biofísica
Modelamiento de sistemas terrestres
Astrofísica computacional
Dinámicas de fluidos computacionales, fluidos mecánicos,
turbulencia
Dinámicas de fluidos computacionales, aeroacústica
computacional, descomposición de dominios heterogéneos,
computación de ruido directo
Química física
Investigación de fusión, física de plasma
Flujo y control de volatilidad, fluidos dinámicos
computacionales
Física de partículas teorética, Cromodinámica de Quantum
Lattice
Investigación en clima computacional
Física de plasma, Conceptos de acelerador avanzados
Temblores Hazard, Sismología computacional
Física de partículas
Sitio web
www.deisa.eu
La Infraestructura Europea Distribuida para Aplicaciones de Supercomputación
(Distributed European Infraestructure for Supercomputing Applications - DEISA)
58
Capítulo II: Estado del Arte Internacional
es un consorcio de instituciones de investigación europeas que tiene por objetivo
reunir los mayores centros de HPC a través de una grid para e-Ciencia.
DEISA 1 comienza el año 2002 en el marco del Sexto Programa Marco de
la Comisión Europea, FP6, para el financiamiento de proyectos científicos de
integración y fortalecimiento de la colaboración entre los países de la Unión
Europea. El 2008 se activa DEISA 2, con un aporte del FP7 de 12.237.000 euros para
36 meses (éste se extiende hasta el 2011).
2.3.5.5.1 Recursos Locales
Capacidad de Cómputo
895,5 Teraflops/segundo en 134944 cores
Almacenamiento
218.1 Terabytes
Software
Servicios
Redes
A través de la red paneuropeaGÉANT se conectan las redes nacionales
SURFnet, FUNET, DFN, GARR, RedIRIS, RENATER y UKERNA.
Otros
59
Capítulo II: Estado del Arte Internacional
Beneficiario
Arquitectura
TeraFlop/s #Cores
Tbytes RAM
Horas CPU
comprometidas
BlueGene/ P
27.0
8,192
4.0
3,000,000
IBM Power6
120.0
6,4
20.0
2,400,000
62.3
9,728
39.0
4,000,000
IBM PowerPC
94.2
10240
20.0
3,000,000
IBM Blade Center
26.6
5120
10.0
2.000.000
IBM Power5
3.9
512
1.0
200.000
Cray XT4 dc
10.1
2,024
2.0
750
Cray XT4 qc
70.0
6,736
7.8
2,500,000
BlueGene/ P
223.0
65,536
32.0
23,000,000
8.9
1,312
5.0
460
> 50
n/a
n/a
n/a
6.7
1800
10
600.000
IBM p690+ successor
> 40
n/a
n/a
n/a
IBM Power5+
14.6
1920
7.7
750
IBM Power6
60.2
3328
15.6
1,250,000
UEdin-EPCC
Cray XT4
65.0
11,52
35.0
4,000,000
UStutt-HLRS
NEC SX-8
13.0
576
9.0
200
MPG-RZG
BAdW-LRZ
BSC
CINECA
CSC
SGI-Altix
Itanium
IBM p690 cluster JUMP
FZJ
JUMP
successor
IBM p690+
IDRIS-CNRS
SARA
Cluster
(fuente: http://www.deisa.eu/services/infrastructure )
De acuerdo a http://www.deisa.eu:
CINECA (Italia): arquitectura P5-575 incorporando 512 procesadores. El
rendimiento máximo es de 3.9 Teraflops.
ECMWF (organización internacional): Dos clusters P5-575+ incorporando
2276 procesadores cada uno. El máximo rendimiento agregado es de 33 Teraflops.
60
Capítulo II: Estado del Arte Internacional
EPCC/HPCx (Reino Unido): P5-575 (16 nodos de procesamiento) incorporando
2560 procesadores. El rendimiento máximo de desempeño es de 15.36 Teraflops.
FZJ (Alemania): arquitectura P690 (32 nodos de procesamiento), incorporando
1312 procesadores. El rendimiento máximo de desempeño es de 8.9 Teraflops.
IDRIS-CNRS (Francia): La arquitectura mezcla P690/P690+ (32 nodos de
procesamiento) y P655+ (4 nodos de procesamiento), incorporando 1024
procesadores. El rendimiento máximo de desempeño es de 6.7 Teraflops.
RZG (Alemania): arquitectura P690 incorporando 896 procesadores. El
rendimiento máximo de desempeño es de 4.6 Teraflops.
El super cluster AIX (CINECA, ECMWF, EPCC/HPCx, FZJ, IDRIS, RZG).
BSC (España): 10240 Power PC 970 con procesador IBM Linux system, 20 TB
de espacio en memoria, 370 TB de espacio en disco. El máximo desempeño alcanza
los 94.2 Teraflops.
CSC (Finlandia): Cray XT4 system, 2024 procesadores centrales, 2.6 TB de
espacio en memoria. El máximo rendimiento es de 10.5 Teraflops. La configuración
se actualizaba en la segunda mitad del 2008, con 6736 procesadores core y un
rendimiento máximo de más de 70 Teraflops.
HLRS (Alemania): supercomputador vector NEC SX8, 576 procesadores, 9.2 TB
de espacio en memoria, 180 TB de espacio en disco. El máximo rendimiento es de
12.7 Teraflops.
LRZ (Alemania): sistema SGI Altix Linux, 9728 procesadores centrales, 39 TB
de memoria principal, 660 TB de espacio en disco. El máximo rendimiento es de
62.3 Teraflops.
SARA (Holanda): IBM Power 5+ sistema Linux, 1920 procesadores centrales, 7.7
TB de memoria principal. El máximo rendimiento es de 14.6 Teraflops. A mediados
de 2008, el sistema debía ser extendido a una capacidad de memoria de más de 15
TB y a un rendimiento máximo de 60 Teraflops.
Capital humano con dedicación sólo a gestionar los recursos locales:
desarrolladores, científicos, estudiantes.
61
Capítulo II: Estado del Arte Internacional
2.3.5.5.2 Recursos Grid
El objetivo desde el punto de vista grid es habilitar un entorno de trabajo
que atraviese los centros de HPC de Europa y que permita la ejecución de trabajos
y acceso a datos de una forma similar a si se estuviera trabajando en uno sólo de
ellos. En particular, la forma de construir la grid se desglosa en las siguientes áreas:
Servicio de administración de datos: troncal IBM>s Multicluster General Parallel
File System (MC-GPFS), apoyada por la interconexión a través de la red GÉANT. Esto
permite un espacio de directorios único, transparente para cada sitio DEISA. Como
solución alternativa para casos especiales se utiliza GridFTP de Globus.
Servicio de administración de trabajos: están disponibles los middleware
UNICORE, DESHL y Globus. Las conexiones entre sitios son principalmente a través
de Globus y IBM Multicluster LoadLeveler, mientras que la interfaz de usuario suele
ser UNICORE.
Servicio de administración de usuarios: se basa en una red distribuida de
servidores LDAP que almacena usuarios, grupos y proyectos. También se cuenta
con un sistema de contabilidad unificado para monitorear el estado de consumo
de recursos a través de toda la grid.
Entorno de producción común: DEISA entrega una lista estandarizada de
software, compiladores y utilidades instaladas en todos los sitios.
Gateway científicos: facilitan el uso de recursos ocultando la complejidad al
usuario. Por ejemplo, el Portal Life Science permite ejecutar trabajos desde una
interfaz web.
2.3.5.6 Grid 5000 plataforma de investigación en informática
(http://www.grid5000.fr)
Institución coordinadora: Iniciativa francesa, liderada por CNRS e INRIA
además de universidades francesas asociadas. Es posible integrarse sólo a través
de las universidades asociadas. – Proyecto semi cerrado.
2.3.5.6.1 Proyecto grid:
GRID 5000 está formulado como iniciativa de grid de investigación informática
en computación de altas prestaciones. Se constituye como plataforma abierta a
múltiples aplicaciones provenientes de laboratorios de investigación en múltiples
disciplinas asociadas a las universidades participantes. La idea es soportar un grupo
62
Capítulo II: Estado del Arte Internacional
de investigación científica, al servicio de los asociados. El grupo directivo propone
realizar llamados de propuestas de investigación, en períodos de seis meses a estos
laboratorios de investigación. Las solicitudes debidamente priorizadas recibirán
sus tiempos de proceso en uno o varios bloques.
2.3.5.6.2 Aplicaciones que soporta:
Plataforma de uso general, las aplicaciones responden al resultado de las
propuestas presentadas cada seis meses por los investigadores asociados.
2.3.5.6.3 Recursos locales:
Capacidad de cómputo, almacenamiento, software, servicios, redes, etc. La
red está formada por diez centros de 500 nodos de proceso cada uno (de ahí el
nombre grid 5000). La arquitectura está formada por clusters locales, basados en
computadores de bajo costo (2.000 euros) con una red local de alta velocidad y una
red de interconexión global de 2Gbps.
2.3.5.6.4 Capital humano:
El personal local de manejo del recurso consiste en dos ingenieros de
planta. No hay mención al ambiente de investigadores que, como se mencionó,
corresponde a un llamado de concurso de proyectos de investigación.
2.3.5.6.5 Recursos grid:
Servicios grid, cómputo, datos, software, políticas. En definición e investigación,
ya que el proyecto incluye el diseño de middleware.
El financiamiento proviene de fondos europeos y los asociados tienen libre
acceso a la grid. El proyecto también financia los equipos locales. No están incluidos
los costos de tráfico de red global. El proyecto tiene una asignación de 1.500.000
euros en tres años.
Un elemento a destacar es que se trata de una plataforma de uso general; se
realian llamados para presentar propuestas de trabajo, con lo cual se benefician
todos los grupos de investigación asociados. Como el proyecto sólo provee
la plataforma, no se hace necesario invertir recursos en buscar aplicaciones
específicas.
63
Capítulo II: Estado del Arte Internacional
2.3.5.7 GRID.IT, Proyecto de computación Grid del Instituto
Nacional de Investigaciones de Italia (www.grid.it)
Institución coordinadora:
Instituto Nacional de Investigación de Italia, con la participación de los
siguientes centros:
•Information Science and Technologies Institute (ISTI-CNR) - Pisa;
•Institute for High Performance Computing and Networking (ICAR-CNR) Cosenza y Nápoles;
•Institute for Molecular Sciences and Technologies (ISTM-CNR) - Perugia;
•Italian Institute for Nuclear Physics;
•Italian Space Agency, Center for Space Geodesy - Matera;
•Photonic Networks Laboratory, CNIT Consortium, Pisa.
2.3.5.7.1 Proyecto grid:
La propuesta es de carácter interdisciplinaria, su objetivo es la definición,
implementación y aplicación de soluciones innovadoras, ejecutadas sobre
plataformas de red, orientadas a la creación de organizaciones virtuales, basadas en
el paradigma de la computación grid. Los tópicos de investigación abarcan desde
redes fotónicas de alto rendimiento, nuevos servicios middleware, ambientes de
programación de altas prestaciones, etc.
La propuesta incluye el desarrollo de algunos pilotos, seleccionados de los
campos de aplicación de máximo interés, no sólo por su ganancia científica, sino
también por actuar como “testbed” para plataformas de grid de alto rendimiento.
2.3.5.7.2 Aplicaciones que soporta:
Los pilotos provienen de algunos de los siguientes campos:
•Observación de la Tierra
•Geofísica
•Astronomía
•Biología y Genómica
•Química computacional.
64
Capítulo II: Estado del Arte Internacional
2.3.5.7.1 Recursos locales:
No especifica los recursos individuales, pero de las organizaciones
participantes, como ICAR-CNR, se desprende que disponen de equipamiento de
alto poder de cómputo.
2.3.5.7.2 Capital humano:
Cada uno de los centros que componen GRID.it corresponde a unidades de
investigación y coordinan la participación de investigadores de otras instituciones
y otros departamentos universitarios que mantienen los grupos de investigación
más calificados en Italia, así como un grupo seleccionado a partir de grupos de
investigación internacionales.
Este es un proyecto semicerrado, donde el acceso es a través de los institutos
participantes.
2.3.5.7.3 Recursos grid:
La arquitectura de GRID.it está basada en VOMS (Virtual Organization Membership
Service), Grid Policy Box y Data Accounting System. Los servicios se integran en una
grid gLite/LCG, y su uso se lleva a cabo mediante el sistema de administración de carga
(WMS) operando en EGEE (Enabling Grid for European E-science)
2.3.5.8 GRID-IRELAND (cagraidsvr06.cs.tcd.ie)
Institución coordinadora:
Autoridad de Educación Superior (Higher Education Authority); en Irlanda,
las universidades y otras instituciones de educación superior e investigación
están representadas en el gobierno a través de esta Autoridad. Los sistemas
informáticos en dichas instituciones están interconectados a travésde HEANet (red
de investigación y educación irlandesa). Grid-Ireland es una capa administrada
sobre HEAnet que provee servicios grid.
2.3.5.8.1 Proyecto grid:
El objetivo es habilitar comunidades de usuarios, por ejemplo astrofísicos,
genetistas o lingüistas, para construir organizaciones virtuales sobre Grid-Ireland.
El principio rector es que puede haber múltiples organizaciones virtuales, pero
sólo se requiere una grid. El beneficio es una plataforma de investigación para
científicos y un objeto de investigación para científicos del área de computación,
además de la simbiosis natural que se produce entre ellos.
65
Capítulo II: Estado del Arte Internacional
2.2.5.8.2 Aplicaciones que soporta:
Las aplicaciones están asociadas a las distintas organizaciones virtuales
activas en Grid-Ireland:
Cosmogrid: grid para el cómputo de fenómenos físicos.
WebCom-G: Cómputo distribuido, transparente para los usuarios.
Marine-Grid: minería de datos sobre recursos estratégicos para Irlanda.
Genegrid: Grid de bioinformática.
SoloVO: Organización virtual no alineada.
GITest: Organización virtual de prueba para investigación y desarrollo.
EireVO: Organización virtual para un Observatorio Virtual.
HESS: Sistema estereoscópico de alta energía.
2.3.5.8.3 Recursos locales:
Los recursos de la grid están administrados y localizados en el Centro de
Operaciones, que dispone de 17 gateways de conexión a los sitios de los clientes
de la grid. La gestión de recursos (brokerage), la administración de Organizaciones
Virtuales, la replicación de datos y el repositorio de software son administrados
localmente. El poder de cómputo reside sobre un cluster de 96 nodos quad-dual
core, totalizando 798 núcleos de cálculo conectado vía Gigabit Ethernet, con
capacidad de 130TB de almacenamiento en dispositivos RAID.
2.3.5.8.4 Capital humano:
GRID-Ireland funciona en el Centro de Operaciones con un total de 8
funcionarios de tiempo completo, a cargo de la administración e la infraestructura
y los pilotos. El personal científico está asociado a las Organizaciones Virtuales y
provienen de las instituciones de educación superior e investigación asociadas a
Grid-Ireland.
2.3.6 Recursos grid
El Centro de Operaciones provee los servicios necesarios para crear y soportar
organizaciones virtuales. Esto incluye a LCG como asignador de recursos, y a gLite
como sistema de administración de carga de trabajo.
66
Capítulo II: Estado del Arte Internacional
2.3.6.1 METACENTRUM (http://meta.cesnet.cz/cms/opencms/
en/about/meta/index.html)
Institución coordinadora:
Gobierno de la República Checa. Está disponible sólo para investigadores de
esa nacionalidad.
2.3.6.1.1 Proyecto grid:
METACENTRUM es una grid que une centros de supercómputo de la República
Checa, con el propósito de obtener un ambiente heterogéneo de computación de
altas prestaciones, disponible para investigadores del país.
El proyecto nace a mediados de la década de los 90, a partir de iniciativas
individuales. Se destaca la experiencia de los investigadores checos, quienes en
2002 obtuvieron dos de las tres distinciones en la Conferencia de Supercómputo
de aquel año, por la aplicación con mayor distribución geográfica, el mayor ancho
de banda sostenido y la distinción a la plataforma grid más heterogénea.
2.3.6.1.2 Aplicaciones que soporta:
METACENTRUM es en conjunto una institución de supercómputo
multipropósito. Se destacan algunas de las aplicaciones activas:
•Química computacional y modelamiento molecular.
•Simulación de técnicas y materiales. El proyecto dispone de un gran
rango de programas de máximo nivel para el desarrollo de simulaciones de
dinámica de fluidos, mecánica de sólidos y disciplinas asociadas.
•Modelamiento estadístico y matemático.
•Ambientes y herramientas de desarrollo.
2.3.6.1.1 Recursos locales:
METACENTRUM tiene una amplia variedad de hardware. Incluye máquinas
multiprocesadores con memoria compartida, clusters conformados por muchas
unidades de 2 a 4 CPU, comunicados por Gigabit Ethernet, Myrinet e INfiniband
(20GB/seg), con el propósito de crear un metacomputador virtual, haciendo uso de
clusters ubicados en las ciudades de Brno, Praga y Pilsen.
67
Capítulo II: Estado del Arte Internacional
2.3.6.1.2 Capital humano:
METACENTRUM es una grid muy cerrada. Para las reglas de uso se solicita
acceder a la página en idioma checo. Su propósito es servir de plataforma y no
informa sobre el recurso humano asociado a la red.
2.3.6.1.3 Recursos grid:
No proporciona información sobre la estructura interna y middleware
utilizado. Cuenta con una unidad de desarrollo de ambientes y herramientas.
2.3.6.2 NW-GRID (North Western Grid) (http://www.nw-grid.
ac.uk/)
Es una colaboración entre el Laboratorio de Daresbury y las universidades
de Lancaster, Liverpool y Manchester de Inglaterra. Esta grid está compuesta por
sistemas de cómputo de alto rendimiento acoplados por una red de fibras de
alta velocidad entre los sitios. Los servicios que se ofrece son de clase mundial
en el despliegue y explotación de tecnologías middleware grid, llevando a cabo
aplicaciones de ingeniería y de ciencias de la computación. www.nw-grid.ac.uk.
Institución coordinadora: Daresbury Laboratory y las universidades de
Lancaster, Liverpool y Manchester.
2.3.6.2.1 Proyecto grid:
Es una grid cerrada con fines de lucro para socios comerciales e industriales,
proveyendo horas de núcleos de CPU; también se cobra por el uso de sus códigos
de programas. Otras instituciones del mundo que deseen aportar a la investigación
pueden incorporarse como aplicaciones de proyectos académicos.
2.3.6.2.2 Aplicaciones que soporta:
•Biología y Bioinformática
•Modelamiento Biológico
•Propiedades ópticas de materiales
•Geometría computacional
•Simulación computacional de materiales
•e-Minerales
•Modelamiento del océano y de la costa
68
Capítulo II: Estado del Arte Internacional
•Sismología
•Monitoreo de inundaciones
•Nanotecnología
•Simulación física de múltiples partículas para el diseño de acelerador de
partículas
•Simulación cosmológica de N-cuerpos
•Modelos de procesos estocásticos eficientes
•Minería de texto
2.3.6.2.1 Recursos locales:
Los clusters están basados en multi core, nodos multi procesadores AMD
Opteron con al menos 8Gb de memoria por nodo y, para nodos más grandes, con
16 y 32Gb. Los nodos en cada sitio son:
•Daresbury: 96 nodos 2.4 GHz twin dual-core CPU
•Lancaster: 48 nodos 2.6 GHz twin dual-core CPU
•Lancaster: 67 nodos 2.3 GHz twin quad-core CPU
•Liverpool: 104 nodos, 2.2 GHz twin dual-core y 2.3 GHz twin quad-core
CPU
•Liverpool: 108 nodos, 2.4 GHz twin dual-core y 2.3 GHz twin quad-core
CPU y red InfiniPath
•Manchester: 25 nodos 2.4GHz twin dual-core CPU
Daresbury, Lancaster y Liverpool tienen 8 TB de almacenamiento accedido
por servidores de archivos Panasas. Además, hay arreglos de discos RAID de 2.8 TB
en Manchester y 24 TB en Lancaster y Liverpool. Los nodos están conectados por
Gigabit Ethernet separando los datos de la comunicación y los 108 nodos en el
cluster Liverpool están conectados con InfiniPath.
Además de estos núcleos hay otros sistemas de cómputos que están
conectados al NW-GRID.
•Daresbury: IBM BlueGene-L (2048 cores)
•Daresbury: IBM BlueGene-P (4096 cores)
•Daresbury: 2560-nodos IBM 1.5 GHz Power5
•Daresbury: 32-nodos Harpertown cluster
•Daresbury: 32-nodos Woodcrest cluster con aceleradores ClearSpeed
•Lancaster: 124-nodos Streamline/Sun cluster 2.4 GHz twin dual-core
(HPCF)
69
Capítulo II: Estado del Arte Internacional
•Liverpool: 96 node, 196 core Xeon x86 cluster con 5.7 TB de
almacenamiento
•Liverpool: 960-nodos Dell cluster, Pentium IV processors
•Manchester: 44 nodos dual-processor Opteron cluster, 2.5 TB RAID de
almacenamiento basado en 2 GHz Opterons con 2 GB RAM.
•Manchester: SGI Prism con 8 Itanium2 processors y 4 ATI FireGL X3 graphics
pipes.
2.3.6.2.1 Capital humano:
En cada centro existe a lo menos un técnico y un operador de la grid, más un
director del proyecto. Existe un directorio a cargo de la organización del NW-GRID
en el laboratorio de Daresbury.
2.3.6.2.2 Recursos grid:
e-Ciencia y ciencias de cómputo aplicado, son las fortalezas particulares en
el North West de Inglaterra. Más abajo se describe el trabajo en el middleware
y las tecnologías empleadas para desplegar y administrar infraestructuras
computacionales distribuidas (las grid).
La infraestructura NW-GRID usa el núcleo middleware adoptado por el
programa de e-Ciencia del Reino Unido: Globus, Condor y SRB (Intermediario de
Recursos de Almacenamiento); es compatible con el servicio nacional de grid. El
trabajo en proyectos NW-GRID se enfoca a dar valor agregado a su infraestructura
entregando un middleware amistoso para el usuario. Las salidas de este trabajo, en
desarrollo, incluyen lo siguiente.
• GROWL: Recursos grid en la librería de estaciones de trabajo
• GROWL Scripts: Comandos scripts para acceder y monitorear recursos grid
y para la instalación de middleware
• Multar: Acceso grid usando el lenguaje R para cómputo estadístico y bioinformático, basado en GROWL.
• RMCS: Sistema de tres capas que implementa un flujo e trabajo simple
para cargar datos y aplicaciones grid pre-compiladas, ejecutar trabajos grid
y descargar la salida.
• RCommands: Conjunto de comandos para crear y administrar meta datos
a través de aplicaciones grid.
• Agentx: Conjunto de herramientas y librerías para la interoperabilidad
de datos entre aplicaciones de ciencia computacional. Usa tecnologías
semánticas tales como OWL y RDF.
70
Capítulo II: Estado del Arte Internacional
• G-R-Toolkit: Nuevo grupo de herramientas que combina GROWL, GROWL
Scripts, RMCS y RCommands en un solo paquete.
• GridKit: Middleware Grid de nueva generación
2.3.6.3 NorGrid (www.norgrid.no)
Iniciativa grid noruega que persigue establecer y mantener una infraestructura
de grid nacional en Noruega. El proyecto provee servicios basados en grid que
realzan la utilización de los recursos en la infraestructura nacional para la ciencia
de la computación y aplicaciones transparentes desarrolladas para compartir datos
entre grupos de usuarios. El objetivo de esta grid es hacer de Noruega un socio
atractivo para colaboraciones grid internacionales. www.norgrid.no.
Institución coordinadora: UNINETT Sigma (operador de la infraestructura de
red en Noruega). Los socios del NorGrid son la Universidad de Ciencia y Tecnología
de Noruega (NTNU), la Universidad de Bergen (UiB), la Universidad de Oslo (UiO), la
Universidad de Tromso (UiT) y UNINETT.
2.3.6.3.1 Proyecto grid:
NorGrid es un proyecto abierto a todas las investigaciones en Noruega,
tratar de unir los esfuerzos grid operacionales del país y reducir la administración
y la sobrecarga organizacional de la cooperación internacional en proyectos de
infraestructura grid.
2.3.6.3.2 Recursos locales:
Los recursos de hardware están localizados en las distintas universidades del
consorcio noruego NOTUR. Entre los sistemas más importante se encuentran:
Hexagon: basado en Cray XT4, tipo MPP, con 1388 nodos y 5552 núcleos,
basados en la arquitectura Opteron, con un total de 6064 GB en memoria y 288 TB
en capacidad de disco; se ubica en la Universidad de Bergen.
Njord: sistema de memoria compartida distribuida; consiste de 65 nodos IBM
p575+, con 944 núcleos interconectados con una red de switch de baja latencia
(HPS), con un total de memoria de 2272 GB y 120 TB de espacio en disco. Se
encuentra en la Universidad de Ciencia y Tecnología de Noruega (NTNU).
Stallo: cluster de cómputo con 704 servidores blade HP BL 460c, cada uno con
dos procesadores Quad CoreXeon de 2,66 Ghz con un total de 5632 núcleos. 384
71
Capítulo II: Estado del Arte Internacional
nodos están interconectados con InfiBand. Memoria total de 12064 GB y 128 TB de
espacio en disco. Este sistema está localizado en la Universidad de Tromso.
Titan: emplazado en la Universidad de Oslo, consiste en un cluster de cómputo
Sun X2200, con 304 nodos y 2432 núcleos Sun/Opteron.
2.3.6.3.3 Capital humano:
El soporte técnico lo aporta cada institución. Los científicos pueden postular
para recibir el soporte de usuarios avanzados, el que los ayuda a mejorar o
extender el rendimiento y las capacidades de sus aplicaciones, ya sea incluyendo
paralelización del código, portabilidad, optimización, benchmarking, mejora de las
interfaces de usuario y desarrollo de software. La postulación se realiza mediante
UNINETT Sigma.
2.3.6.3.4 Recursos grid:
El recurso de software para grid se fundamenta en los distintos paquetes de
software requeridos para dar soporte a las aplicaciones, entre ellas:
•BioCiencia: Blast, ClustalW, EMBL data bank, EMBOSS, FAMHAP, Fasta, FSL,
GenBank, GROMACS, HT-BLAST, mpiBLAST, MEME, NPMLE, PAUP, etc
•Dinámica de fluidos computacional: cfx, COMSOL, FLUENT
•Geociencias: BOM, CAM, COMSOL, CWP/SU, ECLIPSE, GrADS, HYCOM,
MICOM, MITgcm, ROMS.
•Ciencias de Materiales: Abaqus, COMSOL, vasp
•Matemáticas e Informática: ACML, AMPL, ATLAS, CPLEX, Diffpack, ESSL,
FFTW, GMP, gotoBLAST, GSL, MAGMA, Maple, Math/Sci, MATLAB, Netlib,
Newmat, Newran, NTL, Octave, PMDR, R, WSMP, XT-libsci
•Física: COMSOL, GOTM
•Las áreas que soporta son:
•Economía
•GeoCiencia
•Ciencia de materiales
•Matemáticas y Física Informática
72
Capítulo II: Estado del Arte Internacional
2.3.6.4 NGS (Servicio de Grid Nacional para el Reino Unido)
(http://www.ngs.ac.uk/)
El objetivo del proyecto es proveer a los investigadores del Reino Unido
acceso, en forma coherente, a todos los recursos y facilidades computacionales
y datos requeridos para llevar a cabo sus investigaciones, independiente de la
localización de los recursos o del investigador. www.grid-support.ac.uk.
Institución coordinadora: La institución coordinadora está conformada
por cuatro instituciones principales o de núcleo del NGS: Consejo de Facilidades
de Ciencia y Tecnología (STFC), Universidad de Oxford, Universidad de Leeds, y
Universidad de Manchester. También se integran socios y afiliados, los que tienen
roles disminuidos en el NGS.
2.3.6.4.1 Proyecto grid:
NGS integrará servicios para acceder a un número creciente y diverso de
recursos, abarcando espacios completos desde facilidades de tiempo real, como
synchrotrones y telescopios a través de complejas queries de datos históricos
almacenados en centros de datos nacionales o institucionales.
NGS es gratuito para los académicos del Reino Unido, y el uso de los recursos
se establece a través de la obtención del certificado de seguridad y del envío de
una postulación para una cuenta NGS.
2.3.6.4.2 Recursos locales:
Sitio STFC:
•48 Dual AMD Opteron 280 (192 Núcleos) con 8GB de memoria
•8 Quad AMD Opteron 280 (64 Núcleos) con 32GB de memoria
•Red de interconexión Gigabit
•Interconexión de paso de mensajes de alta velocidad Myrinets
•72 TB SAN, Infortrend, Qlogic 5200
•8 Dual AMD Opteron 280 (32 Núcleos) con 8GB de memoria, Myrinet, Fibre
HBA
Sitio Oxford:
Oxford NGS2:
•48 nodos de cómputo dual CPU/dual core con AMD Opteron 285 2.6GHz
con 8Gb RAM y 8 nodos quad CPU/dual core con AMD Opteron 885 2.6 GHz
con 32Gb RAM.
73
Capítulo II: Estado del Arte Internacional
•30TB RAID SAN y 3 nodos de almacenamiento dual.
•Un nodo front end con quad CPU/quad core con AMD Opteron 885 2.6GHz
con 32Gb RAM.
•Red de interconexión Gigabit.
•Red de interconexión Myrinet de alta velocidad de paso de mensajes.
•Oxford NGS1:
•64 nodos de cómputo con dual Intel Xeon 3.06 GHz CPUs, 2 GB RAM.
•Un nodo servidor de disco con 2 x 3.06 Ghz procesadores, 2 GB de memoria,
2 x 2TB RAID.
•Un nodo front end con 2 x 3.06 Ghz procesadores, 4GB de memoria.
•Red de interconexión Gigabit.
•Red de interconexión Myrinet de alta velocidad de paso de mensajes.
Sitio Leeds:
•Nodo maestro/interactivo con 4 dual-core Opteron 64-bit procesadores,
32GB RAM.
•48 nodos con 2 dual-core Opteron 64-bit procesadores, 8GB RAM.
•8 nodos con 4 dual-core Opteron 64-bit procesadores, 32GB RAM.
•3 nodos servidores de archive
para proveer directorios home,
almacenamiento SRB y espacio de archivo temporal.
Sitio Manchester:
•Nodo maestro/interactivo con 4 dual-core Opteron 64-bit procesadores,
32GB RAM.
•48 nodes con 2 dual-core Opteron 64-bit procesadores, 8GB RAM.
•8 nodes con 4 dual-core Opteron 64-bit procesadores, 32GB RAM.
•80TB espacio en disco.
2.3.6.4.3 Capital humano:
No se menciona el recurso humano en el sitio Web, pero hay diversas
facilidades de soporte para los investigadores que deseen unirse al NGS, tales
como el curso de inducción, donde se introducen los conceptos de grid, se enseña
la e-Infraestructura del Reino Unido, se entrega una orientación al Servicio de Grid
Nacional, y se generan experiencias prácticas en el uso de los servicios de cómputo
y de administración de datos del NGS. También existen cursos para desarrolladores
de aplicaciones, los cuales pueden usar los servicios de datos y de cómputos para
crear el software de dominio de la aplicación.
74
Capítulo II: Estado del Arte Internacional
Otro beneficio son los servicios de datos grid, los que ayudan a explorar cómo
los recursos de datos pueden ser expuestos como servicios para los usuarios del
NGS.
Finalmente, existen cursos de actualización de tecnologías, que introducen a
usuarios establecidos del NGS en nuevos servicios que han sido desplegados.
2.3.6.4.4Recursos grid:
Globus es el middleware principal de NGS. No obstante se utilizan otros
recursos grid que dan un valor agregado a éste, entre ellos destacan:
OpenCA: Autoridad de certificación de e-Ciencia que provee certificados
estándares X.509 para la comunidad de e-Ciencia del Reino Unido.
GSI-SSH Term Application: Este software le permite al usuario acceder
fácilmente a la grid, usando GSISSH.
Repositorio de Aplicaciones NGS: Portal de acceso abierto, usado para
describir y listar las aplicaciones y sus artefactos asociados, todos disponibles como
recursos en NGS.
Oracle10G: NGS ofrece el almacenamiento de grandes cantidades de datos,
habilitando la realización abierta de consulta.
SRB (Intermediario de Recursos de Almacenamiento): Servicio de
almacenamiento de datos que permite almacenar datos en localizaciones
geográficas distribuidas, y acceder a ellos usando solamente el nombre del archivo
lógico. La confiabilidad y la eficiencia son dramáticamente mejorados con SRB.
OGSA-DAI: La Arquitectura Abierta de Servicios Grid y La Integración de
Acceso a Datos provee un middleware que ayuda a los usuarios accesar e integrar
datos a través de fuentes de estructuras de datos separadas tales como XML o
bases de datos Oracle.
Servidor de Información BDII: Rescata datos desde los sitios NGS, consultando
el servicio de información de recursos grid (GRIS) en cada sitio; el que está disponible
mediante un servidor LDAP.
Servicio de Monitoreo Ganglia.
75
Capítulo II: Estado del Arte Internacional
Servicio de Monitoreo Inca NGS: Marco de trabajo flexible para el testeo,
benchmark, y monitoreo automatizado de sistemas grid. Incluye mecanismos para
asignar la ejecución de los scripts que reúnen información, coleccionan, archivan,
publican y despliegan datos.
GridSAM: Servicio Web de monitoreo y envío de trabajos, usa una variedad de
administradores de recursos distribuidos.
Registro de Servicios Nacional: Usa GRIMOIRES. Servicio de registros Web que
permite metadatos arbitrarios siempre que estén asociados con entidades UDDI.
Servicio VOMS: Es un servicio de membresía para Organizaciones Virtuales;
provee herramientas para ayudar a administrar la grid con la autorización de sus
usuarios.
Soporta diversas aplicaciones dependientes de la disponibilidad de
la institución que provee los servicios VOMS. Por ejemplo, en el Sitio STFC,
se encuentran las siguientes aplicaciones: Análisis, Análisis de Imágenes,
Bioinformática, Química, Biomedicina eIngeniería.
2.3.6.5 NAREGI (Iniciativa Grid de Investigación Nacional de
Japón) http://www.naregi.org)
Provee un ambiente de cómputo de gran escala para la investigación y
educación ampliamente distribuida. Fue creada en el 2003 por el Ministerio de
Educación, Cultura, Ciencia y Tecnología del Japón (MEXT). www.naregi.org.
Institución coordinadora: Instituto Nacional de Informática (NII) e Instituto
de Ciencia molecular (IMS).
Participan:
- Centro de Investigación de Tecnología GRID
- Centro de Información Científica Global y de Cómputo del Instituto de
Tecnología de Tokio
- Laboratorio Matsuaka
- Centro de Cibermedia de la Universidad de Osaka
- Centro de Cómputo y Comunicación de la Universidad de Kyushu
- Instituto de Tecnología de Kyushu
- Universidad Utsunomiya
- Universidad de Tsukuba
76
Capítulo II: Estado del Arte Internacional
- Fujitsu
- NEC
- Hitachi
2.3.6.5.1 Proyecto grid:
La grid de ciencia tiene el potencial de hacer grandes cambios en el
desarrollo de la tecnología científica y generar nuevos productos en áreas como
nanotecnología y biotecnología. El objetivo del programa NAREGI de Ciencia Grid
es avanzar en el desarrollo del middleware para la grid, el cual es usado para crear el
ambiente de Ciencia Grid. Éste permite compartir recursos de cómputo, incluyendo
recursos de supercómputo, para que sean usados más eficientemente y, por tanto,
construir conexiones de investigación y una comunidad de investigación.
Este ambiente permite simulación acoplada de multi-escala/multi-física,
muy importante en el campo de ciencia computacional. La asignación de recursos
es adaptada a cada aplicación de tal manera que el análisis acoplado pueda ser
realizado fácilmente.
Las Organizaciones Virtuales (Vos), separadas de las organizaciones reales
a las que pertenecen los investigadores y cuerpos de investigación, pueden ser
formadas dinámicamente en la grid de acuerdo a las necesidades de la comunidad
de investigación, compartiendo datos y recursos.
2.3.6.5.2 Aplicaciones que soporta:
BioGRID: Aplicaciones en Biotecnología.
JVO: Organización Virtual Japonesa para Telescopios utilizando tecnologías
de minería de datos.
2.3.6.5.3 Recursos locales:
No hay mención sobre este recurso.
2.3.6.5.4 Capital humano:
No hay mención sobre este recurso.
2.3.6.5.5 Recursos grid:
Administración de recursos en el ambiente grid:
- Super Scheduler
77
Capítulo II: Estado del Arte Internacional
- GridVM
- Servicio de Información Distribuida
Ambiente de programación grid:
- Sistema RPC Grid
- Sistema MPI Grid
Ambiente de aplicación grid:
- PSE Grid
- Herramienta workflow grid
- Sistema de visualización grid
Ambiente de datos grid:
- Sistema de administración de acceso
- Sistema de administración de recursos de datos
- Sistema de construcción de metadatos
Alto rendimiento y red grid segura:
- Infraestructura de comunicación de red
- Infraestructura de autenticación de seguridad
Aplicaciones nano grid:
- Grid compatible con aplicaciones nano paralelas y distribuidas
Investigación en la utilización del middleware grid:
- Programación de interfaces de aplicaciones
- Utilización de la grid heterogénea
78
Capítulo III: Estado del arte en Latinoamérica
3 Capítulo III: Estado del arte en
Latinoamérica
3.1 Introducción
América Latina no podía ser la excepción en el auge de la tecnología grid. Pero
si en los países desarrollados la computación grid está en formación, en los países
latinoamericanos apenas está en gestación, por ello se vienen adelantando varios
proyectos y alianzas con instituciones que tienen experiencia en la implementación
de éstas tecnologías. En la actualidad se cuenta con CLARA (Cooperación Latino
Americana de Redes Avanzadas), organización no gubernamental sin fines de
lucro, que estimula la cooperación regional en actividades educativas, científicas y
culturales, además promueve la integración directa con las comunidades científicas
de Europa [CLARA (2006)13], esta organización trata de integrar una red regional de
telecomunicaciones de la más avanzada tecnología para interconectar a las redes
académicas nacionales de la región; hasta el momento cuenta con los siguientes
miembros:
•Argentina – Innova|Red
•Bolivia – Agencia para el Desarrollo de la Sociedad de la Información en
Bolivia- ADSIB
•Brasil – Red Nacional de Enseñanza e Investigación – RNP
•Colombia – Red Nacional Académica de Tecnología Avanzada – RENATA
•Costa Rica – Red Nacional de Investigación – CR2Net
•Cuba – RedUniv
13
http://www.redclara.net/
79
Capítulo III: Estado del arte en Latinoamérica
•Chile – Red Universitaria Nacional – REUNA
•Ecuador – Consorcio Ecuatoriano para el Desarrollo de Internet Avanzado
– CEDIA
•El Salvador – Red Avanzada de Investigación, Ciencia y Educación
Salvadoreña – RAICES
•Guatemala – Red Avanzada Guatemalteca para la Investigación y Educación
– RAGIE
•Honduras – Universidad Tecnológica Centroamericana – UNITEC
•México – Corporación Universitaria para el Desarrollo de Internet – CUDI
•Panamá – Red Científica y Tecnológica – RedCyT
•Paraguay – Arandu
•Perú – Red Académica Peruana – RAAP
•Uruguay – Red Académica Uruguaya – RAU
•Venezuela – Red Académica de Centros de Investigación y Universidades
Nacionales – REACCIUN
Otro proyecto importante para el trabajo en grid en la región es EELA-214 (Escience grid facilityfor Europe and Latin America), suscesor de EELA (E-infrastructure
Shared between Europe and Latin America). El objetivo de EELA-2 es construir una
estructura grid escalable de alta capacidad y calidad de producción, suministrando,
día y noche, acceso global a computación distribuida y recursos de red y de
almacenamiento, requeridos por un alto espectro de aplicaciones provenientes de
la colaboración científica entre Europa y América Latina, con especial atención en:
•ofrecer un conjunto completo de servicios versátiles que cumplan con los
requerimientos de las aplicaciones;
•asegurar la sostenibilidad a largo plazo de la e-Infraestructura aun después
de haberse completado el proyecto.
La infraestructura está basada en 16 Centros de Recursos (RCs), sumando
más de 730 núcleos de CPU y 60 Terabytes de espacio de almacenamiento. En
este proyecto participan 10 países latinoamericanos con sus redes académicas y
diferentes instituciones entre universidades y centros de investigación; la meta es
llevar las e-Infraestructuras de los países latinoamericanos al nivel de explotación
de los países Europeos. EELA-2 se beneficia del estado maduro del proyecto ALICE2
(América Latina Interconectada Con Europa) y de la red de la Cooperación Latino
Americana de Redes Avanzadas, CLARA, denominada RedCLARA.
14
80
http://applications.eu-eela.eu
Capítulo III: Estado del arte en Latinoamérica
Ahora bien, ¿por qué es importante para los países de Latinoamérica el tratar
de evolucionar en la tecnología de grids computacionales? Está claro que parte de
la respuesta a esta pregunta tiene que ver con la obtención de los beneficios que
en general se pueden lograr con esta tecnología:
1) Mejorar la relación eficiencia/costo.
2) Explotar convenientemente los recursos sobre-utilizados.
3) Permitir la colaboración.
4) Crear VOs en diferentes dominios.
5) Incrementar la capacidad de procesamiento paralelo.
6) Dar soporte a sistemas heterogéneos.
7) Proveer realidad/disponibilidad.
8) Reducir el tiempo de obtención de resultados.
Muchos de estos beneficios tienen mayor relevancia en países en desarrollo
como los de América Latina, específicamente en el área académica y científica, ya
que:
1) Ofrece poder computacional y otras capacidades relativas a la tecnología
de información que suele ser insuficiente en centros de investigación e
instituciones académicas.
2) Permite el intercambio de conocimiento entre organizaciones,
particularmente con las que se encuentran en los países desarrollados.
3) Es una infraestructura ideal para implementar e-Learning.
4) Es un campo amplio y joven para hacer investigación en esta área.
81
Capítulo III: Estado del arte en Latinoamérica
3.2 Avances en computación grid en
Latinoamérica
A continuación se presentan los avances de computación grid de algunos
países líderes en la materia en la región latinoamericana, con la excepción de Chile,
el cual será tratado en el siguiente apartado.
3.2.1 Computación grid en Colombia:
La iniciativa Grid Colombia ha logrado generar la articulación y compromiso
de varias universidades con un fin común, la conformación de la grid nacional.
Para alcanzar esta meta se ha generado una organización con las siguientes
características:
Visión: lograr que en un año Grid Colombia se constituya en la primera
alternativa en computación distribuida en el país, que en dos años todas las
universidades conectadas a RENATA que estén desarrollando proyectos de
computación distribuida hagan parte de Grid Colombia y que en cuatro años Grid
Colombia sea visible, reconocida y certificada como una alternativa de Grid a nivel
internacional.
Objetivo general: constituir una grid de escala nacional en Colombia que
reúna clusters y grids de universidades e instituciones haciendo uso de las redes
de tecnología avanzada.
Objetivos específicos: fomentar el uso de grids computacionales como
herramientas para solucionar problemas que necesiten alto nivel de cómputo;
ofrecer servicios de grid y participar en proyectos a nivel nacional e internacional;
promover la colaboración de grupos de interés, estudiantes y docentes; desarrollar
aplicaciones de alta carga computacional para resolver problemas de alto impacto
para el país.
Membresía: pueden ser actores de Grid Colombia los grupos y centros de
investigación, no sólo los que centran en las áreas de la computación de alto
desempeño sino también los que requieren usar este tipo de tecnología; también
se espera poder contar con la participación de entidades gubernamentales como
RENATA y Colciencias y asociaciones como ACOFI. Los miembros deben estar en
disposición de aportar recursos para la conformación del grid nacional.
Con el fin de coordinar y aunar las contribuciones y esfuerzos de la comunidad
82
Capítulo III: Estado del arte en Latinoamérica
Grid Colombia se ha planteado una organización en cuatro frentes de trabajo:
Frente de infraestructura: encargado de preparar, diseñar, implementar
y configurar una Grid de Cómputo Nacional que permita agrupar recursos
computacionales de las instituciones participantes en el proyecto, la interconexión
de los nodos se realizará a través de la Red Nacional de Tecnología Avanzada
RENATA.
Frente de formación y capacitación: propende por el desarrollo de la
formación de estudiantes, docentes y especialistas en computación de alto
desempeño, además para la integración de un servicio de cómputo avanzado
interdisciplinario en Grid Colombia.
Esta formación incluye capacitación en las tecnologías de clusters y grids,
programación concurrente y paralela, y desarrollo de aplicaciones.
Frente de promoción y divulgación: el objetivo es plantear y realizar
estrategias de promoción y divulgación del proyecto Grid Colombia para difundir
y ampliar el uso de las tecnologías de grid y obtener un reconocimiento nacional
e internacional.
Frente de seguridad: su función es proponer y analizar los aspectos
concernientes a la seguridad informática para la implantación de una infraestructura
de computación grid a nivel nacional, garantizando el cumplimiento de estándares
para esta tecnología.
Actualmente, Grid Colombia se encuentra en proceso de consolidación; en
esta etapa se busca desarrollar las siguientes actividades:
- Levantar un censo nacional de plataformas de computación intensiva e
identificar las aplicaciones de computación en grid de mayor relevancia en
el contexto colombiano.
- Probar, configurar y evaluar un middleware operativo para la administración
de recursos y la programación de trabajos en la primera grid de alcance
nacional.
- Realizar pruebas sistemáticas de rendimiento y estabilidad de la red
apuntando especialmente a la determinación de sus propiedades en
relación con los retos que ofrece la computación en grid en Colombia.
- Desarrollar las primeras aplicaciones que permitan simular, evaluar y validar
la utilidad de la tecnología grid para la solución de problemas científicos y
tecnológicos de interés para el país.
83
Capítulo III: Estado del arte en Latinoamérica
- Establecer relaciones institucionales formales propicias para la
colaboración en el establecimiento de la grid nacional, generando las
bases y recomendaciones para la operación del mismo en el marco de la
organización académica Grid Colombia15.
3.2.2 Computación grid en Argentina:
Hoy en día, ciertas tareas de investigación, como la prospección sísmica o la
simulación de la circulación atmosférica, por ejemplo, requieren de computadoras
muy poderosas y costosas. Pero, si las computadoras están en red, el costo se
comparte y se potencia la capacidad del conjunto.
Precisamente, con este propósito se creó una red informática que conectará
a la Universidad de Buenos Aires (UBA) y a la Universidad Nacional de Cuyo (UNCu).
Este emprendimiento permitirá que ambas instituciones puedan compartir el
poder de procesamiento de sus respectivos clusters (grupos) de computadoras,
para ser aplicado a la resolución de problemas científicos complejos. Esta novedosa
infraestructura conformará una red de última generación, llamada grid.
“Esta red nos permitirá contar con una herramienta de cálculo poderosa para
trabajar en temas que están en la frontera del conocimiento, como la simulación
numérica en problemas de interconexionado eléctrico por medios electroquímicos
y en el tratamiento electroquímico de tumores, mediante el pasaje de corriente
eléctrica a través de un tejido vivo”, asegura Guillermo Marshall, profesor de la
Facultad de Ciencias Exactas y Naturales (FCEyN) de la UBA16.
Marshall, director del Laboratorio de Sistemas Complejos (LSC) en el
Departamento de Computación de la FCEyN, y el profesor Carlos García Garino,
del Instituto Tecnológico Universitario (ITU) de la UNCu, son los responsables de
esta novedosa red que será financiada con un subsidio otorgado por la Agencia
Nacional de Promoción Científica y Tecnológica (ANPCyT).
La idea es formar un centro de Computación de Alto Rendimiento con dos
nodos: uno en Buenos Aires, en el LSC, y otro en Mendoza, en el Laboratorio de
Investigación y Desarrollo para la Producción Integrada por Computadora (LAPIC),
que dirige García Garino.
15
http://www.unired.edu.co/eventos/unired/2009/noticias/grid%20colombia.pdf
16
http://portal.educ.ar/noticias/educacion-y-sociedad/la-tecnologia-griddesembarca.php
84
Capítulo III: Estado del arte en Latinoamérica
Cada universidad en Argentina integrará el Grid con un cluster de
computadoras que estará conectado con su par a través de la red pública Internet,
pero mediante un enlace seguro llamado túnel IP. “Un túnel consiste en encapsular
tráfico privado dentro de otro tipo de tráfico más general como el de una red
pública, con el fin de facilitar que se compartan recursos distribuidos en sitios
lejanos”, agrega el ingeniero.
En principio este Centro de Computación de Alto rendimiento se destinará a
usos académicos, tanto en lo que se refiere a enseñanza como a investigación. “De
esta manera se podrán potenciar acciones de grado y posgrado tanto en la UBA
como en Mendoza, y además nos permitirá avanzar en nuestras investigaciones
en dos frentes. Por un lado, podremos profundizar el conocimiento acerca de la
tecnología de clusters, investigando en aspectos como el hardware de los nodos,
la red que los interconecta, los protocolos de red utilizados y los sistemas de
administración de los mismos –se entusiasma García Marino–. Por otra parte nos
permitirá trabajar, entre otros temas de interés, en dinámica molecular, prospección
sísmica y en simulaciones numéricas de reservorios y trazado de oleoductos en la
industria del petróleo”.
3.2.3 Computación grid en Brasil
El gobierno del Brasil y la Xunta de Galicia han empezado a establecer las bases
de un convenio de colaboración que se prevé que se firme antes de final de año17.
El convenio tiene como objetivo que las dos administraciones colaboren en
implementar aplicaciones libres mediante grid y cluster a varios ámbitos como la
radioterapia, la gestión ambiental o en sistemas de gestión de nóminas en áreas de
recursos humanos.
La primera parte de contacto lo han hecho mediante videoconferencia el
director-gerente del Centro de Supercomputación de Galicia (CESGA), Javier García
Tobio, el Secretario Nacional de Tecnología de la Información del Gobierno del Brasil,
Rogério Santanna dos Santos, y el Director de Innovación del SLTI Gobierno brasileño,
Corinto Meffe. En esta colaboración, Galicia prevé aportar sus conocimientos de
supercomputación y la experiencia del Brasil en la implementación a gran escala
de varias aplicaciones de código libre.
Las dos administraciones, el gobierno del Brasil y el gobierno de Galicia,
forman parte de la Red Internacional de Administraciones Públicas por el Software
17
http://georeferencias.wordpress.com/2006/09/11/brasil-y-galicia-empiezan-acolaborar-en-proyectos-de-grid-y-cluster-con-software-libre/
85
Capítulo III: Estado del arte en Latinoamérica
Libre. El coordinador de la Red, Marcelo D’Elia Branco (Fundación Observatori para
la Sociedad de la Información en Catalunya) es quien dinamiza las reuniones entre
las dos administraciones, desde Barcelona.
Eugenio Sper de Almeida, doctorado en Computación Aplicada del Instituto
Nacional de Investigaciones Espaciales INPE, Brasil, trabaja en el Centro de Previsión
del Tiempo y Estudios Climáticos, donde se intenta mejorar los modelos numéricos
de clima y medio ambiente, promoviendo los avances científicos en esa área, a
través de programas con supercomputadores que recogen datos satelitales. En
este lugar trabajan con la Red IPE de la Red Nacional de Enseñanza e Investigación,
RNP, de Brasil, desde donde han logrado generar proyectos grid como GBRAMS,
y SAEMC, este último para proveer datos sobre emisiones y cambio climático
para América del Sur, la que realiza operaciones sobre la red de Alta Velocidad de
América Latina, RedCLARA, que conecta a las redes RNP, REUNA e Innova|Red de
Argentina. La idea, según Sper de Almeida, es lograr ampliar el alcance de estos
proyectos para incorporar a otras instituciones18.
18
http://apc-clara.reuna.cl/canal1.shtml?http://apc-clara.reuna.cl?AA_SL_Sessi
on=1b784166a5d7775d7330766f5ab45a03&x=12432
86
Capítulo IV: Estado del Arte Nacional
4 Capítulo IV:
Estado del Arte Nacional
4.1 Iniciativa articulada por REUNA
Chile cuenta desde 1992 con REUNA, la red nacional de educación e
investigación, que hoy conecta a instituciones nacionales entre sí y, mediante
RedCLARA, con Europa y toda América. La Corporación REUNA es una iniciativa de
colaboración que posee la única infraestructura tecnológica de red de naturaleza
académica, dedicada a la investigación y al desarrollo en Chile.
La misión de la Corporación REUNA es proveer a la comunidad de educación
superior, innovación e investigación del país, servicios en materias de Tecnologías
de Información y Comunicaciones; apoyada por un equipo humano altamente
calificado y comprometido, la institución promueve el trabajo colaborativo entre
universidades y centros de investigación, mediante el uso de su Red Académica,
infraestructura que conecta a los científicos, académicos e investigadores de Chile
con sus pares en todo el mundo.
REUNA comenzó su trabajo en proyectos de grid –infraestructura tecnológica
que opera sobre las redes académicas para posibilitar el desarrollo de la e-Cienciaen el año 2004, y desde el 2006, promueve intensamente el desarrollo de la eCiencia en Chile y la región latinoamericana19.
El primer Congreso Nacional de e-Ciencia: «e-Ciencia para el Chile del
Bicentenario: Experiencias, Procesos y Políticas», fue realizado el 6 y 7 de septiembre
19
http://www.reuna.cl/index.php/es/e-ciencia/eventos
87
Capítulo IV: Estado del Arte Nacional
del 2006. Este evento, que contó con el patrocinio de la Academia Chilena de
Ciencias y el apoyo del Programa Bicentenario de Ciencia y Tecnología, fue
antecedido por la I Conferencia EELA (4 y 5 de septiembre), y corrió en paralelo con
el Tutorial EELA (para uso de grids). El 23 y 24 de mayo de 2007, en la Universidad
de Santiago de Chile (USACH), REUNA (Red Universitaria Nacional) llevó a cabo el
1er Taller de Articulación de e-Ciencia: «Cimentando el camino para el desarrollo
de la e-Ciencia en Chile».
El segundo Congreso Nacional de e-Ciencia: “e-Ciencia para el Chile del
Bicentenario” fue organizado en los días 12 y 13 de Septiembre del 2007 y
financiado por el programa Bicentenario y Tecnologías del CONICYT. El objetivo
de este Congreso era el de contribuir a una discusión nacional sobre la tendencia
y desarrollo mundial de la e-Ciencia, que sirviera como una estrategia de apoyo al
avance de la investigación científica y académica en Chile, y difundir las primeras
iniciativas que, en esta línea, se estaban llevando a cabo en el país. Como contraparte
también se llevó a cabo el «II Taller de Articulación para La Vinculación de Ciencia
y Empresa: e-Ciencia e Industria: Hacia una Infraestructura de Grid Nacional», el 7 y
8 de mayo del 2008. Mediante la constitución de un foro interdisciplinario públicoprivado, éste persiguió definir y establecer una estrategia para la implementación
sustentable de una infraestructura nacional colaborativa de mallas computacionales
(grids), a fin de acelerar la adopción de estas tecnologías en el país. Este Taller fue
cerrado el 13 y 14 de enero de 2010 con la participación de invitados nacionales e
internacionales quienes establecieron las propuestas definidas en el Taller anterior.
Se presentaron, en esta última sesión, diversas aplicaciones en grid, entre ellas
UCRAV y otras referidas a Clima, Grid y Biociencias.
La primera intención de colaborar y compartir recursos a través de una red
nacional en Chile se inició con la institución REUNA (Red Universitaria Nacional) en
el 2007 a través del proyecto UCRAV20 el que consiste en una grid de instrumental
científico que le permite visualizar en línea y en tiempo real, en forma segura y fiable,
privada y con dedicación exclusiva de recursos (instrumentales, tecnológicos y
humanos). UCRAV es un proyecto pionero de colaboración y creación de una grid
nacional de instrumentos científicos -especializados en el análisis de muestras
orgánicas e inorgánicas-, conectados de norte a sur del país, a través de la Red
Académica, REUNA.
La estructura de UCRAV está formada por instrumental científico distribuido
en los laboratorios de las universidades que integran la grid, interconectados por
la red de Internet Avanzada a un servidor central ubicado en REUNA. Básicamente
UCRAV está compuesto por:
20
88
http://www.ucrav.cl/ucrav2/
Capítulo IV: Estado del Arte Nacional
•el instrumental científico –Espectrómetro de Resonancia Magnética
Nuclear, Difractómetro de Rayos X, Microscopio Analítico, PCR en Tiempo
Real y PCR Cuantitativo, y Microscopio Confocal de Barrido Láser- dispuesto
por los laboratorios de las universidades integrantes del proyecto;
•una plataforma tecnológica que permite la visualización en línea de
los análisis de muestras generados por los instrumentos, el acceso a la
documentación por ellos emanada durante el proceso de comunicación
e interacción entre el usuario o cliente (quién envió la muestra para ser
analizada al laboratorio) y el prestador del servicio (quién opera en el
laboratorio el instrumento que realiza el estudio de la muestra), y que facilita
la logística previa a la realización del análisis; y
•una grid nacional, construida por UCRAV para permitir la interacción real y
en línea del usuario y el laboratorio mientras se lleva a cabo la visualización
de los resultados de los análisis.
REUNA es, también, la entidad emisora de certificados de seguridad para visar
la entrada segura al mundo de las grid computacionales21. Acreditada por TAGPMA
(The Americas Grid Policy Management Authority), REUNA es la única Autoridad
Certificadora (CA) para grid en Chile; ella puede emitir certificados -para usuarios y
recursos - válidos en la comunidad académica global, y reconocidos por todas las
entidades miembros de la IGTF (International Grid Trust Feredaration).
La Autoridad Certificadora, REUNA-CA, refuerza el uso de los servicios PKI
(Public Key Infraestructures – Infraestructuras de Llave Pública) que permiten el envío
de datos en forma segura mediante técnicas de encriptación, garantizando el
contenido vía legitimación del emisor. REUNA-CA emite certificados para personas,
investigadores, estudiantes (certificado de usuario), computadores (certificado de
servidor) y servicios (certificado de aplicaciones); los que permiten a los suscriptores
validarse para usar infraestructuras grid.
4.1.1 Iniciativas Centro de Modelamiento Matemático
CMM, Universidad de Chile
Hoy en día, muchas instituciones en Chile están tratando de participar
en iniciativas de computación grid, asociándose y formando comunidades
con objetivos comunes: hacer computación grid. Con el pasar del tiempo, estas
comunidades han entendido que para lograr una plataforma de e-Ciencia común
y operativa, es necesario lograr uniformidad, tanto a nivel de sistemas como de
21
http://www.reuna.cl/index.php/es/servicios/red/certificados-grid
89
Capítulo IV: Estado del Arte Nacional
aplicaciones, lo que presenta un desafío no menor al momento de dejar atrás viejas
costumbres y superar el miedo al cambio. En este sentido, es que el grupo de HPC
del Centro de Modelamiento Matemático, con el apoyo de REUNA, PRAGMA (Pacific
Rimm Applications and Grid Middleware), la Universidad de Puerto Rico Mayagüez
(UPRM) y el Centro de Predicción del Tiempo y Estudios Climáticos (CPTEC, Brasil)
está desarrollando una forma poco acoplada para compartir recursos empleando
tecnologías grid encapsuladas a nivel de middleware, acoplándose a los entornos
de ejecución, sin requerir grandes cambios a configuraciones ya operativas.
Este middleware encapsulado se compone de un software de interconexión
de bajo nivel, como Globus GT4 (que implementa estándares OGF WS*), sobre el
que se monta un middleware de DataFarm, como GFarm, que utiliza todas las
características incluidas por GT4 (como autentificación y ubicación de recursos)
y, además, esto se complementa con portlets que permiten la coordinación
administrativa entre los clusters.
El mismo grupo de HPC del CMM de la Universidad de Chile, a partir del año
2007 lidera CLGRID (Red Nacional Grid en Chile); marcando el inicio de una serie de
talleres de computación grid, donde participan universidades de todo el país.
El Centro de Modelamiento Matemático de la Universidad de Chile, dependiente
de la Facultad de Ciencias Físicas y Matemáticas, se encuentra equipado con 16
servidores HP integrity RX1600; operativo desde el 2005, esta infraestructura le ha
permitido integrarse a otros centros a través de una grid computacional de última
generación para la realización de proyectos de investigaciones de modelamiento y
cálculo distribuido, en colaboración con los principales centros de investigación en
el mundo. Esta grid permite que en el Centro de Modelamiento Matemático (CMM)
se logren resolver problemas de modelamiento de alta complejidad en áreas y
tareas diversas, en aplicaciones que serán importantes para el desarrollo del país
en minería, energía, telecomunicaciones y medioambiente.
El 7 de Marzo del 2008, la presidenta Bachelet realizó la presentación de ocho
Centros Científicos en el país, a través del programa de Financiamiento Basal para
Centros Científicos y Tecnológicos de Excelencia, el cual plantea incrementar el
capital científico y tecnológico de alto nivel existente en el país. De esta manera
las actividades de investigación, formación de capital humano y transferencia
tecnológica realizados por los centros seleccionados contribuirán a aumentar
decisivamente la competitividad de la economía y el desarrollo social del país.
El programa ofrece recursos para la operación básica de estos centros por
períodos de cinco años, prorrogables por una vez, hasta por otros cinco, de manera
de crear las condiciones para formar masas críticas de científicos de alto nivel, que
le permitan a Chile estar en la frontera del conocimiento en áreas específicas.
90
Capítulo IV: Estado del Arte Nacional
Este instrumento permite otorgarles a estos Centros Científicos y Tecnológicos
de Excelencia un financiamiento basal que garantiza que la investigación –básica
y aplicada- de alto nivel nacional e internacional que llevan a cabo, se enfoque
directamente a aumentar la competitividad de nuestra economía y, con ello, a
mejorar la calidad de vida de los chilenos; porque este instrumento apoya líneas
de investigación de mayor envergadura, con mayor financiamiento, por un mayor
plazo y con una mayor vinculación con los requerimientos de nuestro sistema
productivo.
4.1.2 Iniciativas Universidad Católica del Norte
La Universidad Católica del Norte (UCN) ha tenido una participación
fundamental en el aspecto de Computación grid en Chile. A través de un grupo
de HPC ha fomentado la colaboración grid a través del CLGRID. Hoy cuenta con un
laboratorio de alto desempeño que en el futuro será parte del Centro de Informática
Aplicada, conformando un cluster HPC de cuatro nodos, integrado a CLGRID.
El principal aporte científico de la UCN está potenciado por el Centro de
Biotecnología, donde se estudian los procesos asociados a la biominería, con
el objetivo de mejorarlos, lo que implica la reducción de costos de operación
y/o un aumento en la producción de cobre a partir de un mineral de cobre
de baja ley, considerado hasta no hace mucho, como desecho. El trabajo del
centro de biotecnología consiste en estudiar la dinámica de las poblaciones de
microorganismos asociados a la extracción de cobre, su relación con los datos
operacionales de la pila de lixiviación y la identificación de los genes involucrados
en cada etapa del proceso de biolixiviación.
La generación de modelos que permitan explicar y, eventualmente simular,
los procesos que ocurren en una pila de extracción de cobre son metas que están
asociadas al centro. La generación de este tipo de resultados, involucra tareas que
son costosas desde el punto de vista computacional, en procesos de estudios de
expresión de genes se consume gran cantidad de espacio de almacenamiento
en datos, se hace necesario una potencia de cálculo importante asociada a la
generación y procesamiento de esos datos. La identificación de microorganismos
y genes de los mismos, requieren consultar bases de datos de gran tamaño, las
cuales deben estar cargadas en la memoria de un equipo computacional de forma
de poder realizar una búsqueda exitosa. Se debe considerar, en este punto, que el
margen de error “aceptable” en el proceso de identificación es del orden del 1%,
una cantidad mayor y los microorganismos identificados pueden no ser realmente
los existentes.
91
Capítulo IV: Estado del Arte Nacional
Estos problemas son solo algunos de los que se abordan en procesos de
biotecnología y requieren el uso de tecnologías HPC para su resolución. Si a lo
anterior se agrega el hecho que para lograr un modelo más preciso es necesario
considerar los problemas de flujo y transporte que se dan en el interior de la pila, la
complejidad asociada a los modelos crece de manera muy significativa.
El uso de tecnologías HPC permite minimizar tiempos necesarios para la
obtención de resultados, ya sea en el procesamiento de datos de expresión de
genes, en la generación de resultados a partir de simulación del comportamiento
de la pila y en la identificación de genes y microorganismos, considerando en este
último punto que se puede mejorar la precisión de la identificación, pudiendo
levantar bases de datos de mayor tamaño (alrededor de 25 Gbytes, cargados
directamente en memoria), por nombrar sólo algunas posibilidades.
Dentro de los retos que tiene el centro es la generación de modelos que
permitan simular el comportamiento de los microorganismos en una pila, el cual es
un proceso complejo y costoso, por que se deben aunar esfuerzos multidisciplinarios:
matemáticos, biológicos, metalúrgicos, químicos e informáticos, siendo estos
últimos los encargados de implementar los modelos generados para que puedan
ser ejecutados en la plataforma HPC y además que los demás científicos e ingenieros
no deban lidiar con la complejidad inherente a un proceso de paralelización de
algoritmos o de administración de una plataforma, estos deben ser transparentes
para ellos en todo momento.
La selección de los mecanismos, lenguajes y técnicas de programación debe
ser cuidadosa, dado que esto influye directamente en el rendimiento y exactitud
de los resultados, lo cual requiere un alto nivel de especialización por parte de los
informáticos.
Otras áreas de interés del uso de computación grid en la UCN se ve en
Astronomía, donde se cultiva esta ciencia a través del uso de distintos instrumentos
(telescopios) ubicados en Cerro Armazones. La adopción de la grid supondrá la
creación de nuevos estándares de interoperación e intercambio de datos de
datos astronómicos, la consolidación del concepto de Observatorio Virtual, la
integración de modelos astrofísicos y Observatorios Virtuales, la definición de
“observación” como servicio de Internet, y la extensión del concepto Internet
interplanetario. La grid tendría un gran impacto en las formas de colaboración y
de producción científica. Así, permitiría la explotación eficiente de los recursos
observacionales existentes, la posibilidad de establecer centros de excelencia en
servicios especializados que complementen las funciones y los servicios de los
observatorios terrestres y espaciales existentes, coordinados con centros similares
en otros países, la definición de líneas de investigación en la “Nueva astronomía”,
92
Capítulo IV: Estado del Arte Nacional
basada en el análisis masivo de datos e integración de modelos y datos, y el trabajo
en redes de investigación con infraestructura común y nuevas formas de compartir
conocimiento.
Otra área de alto interés tiene relación con problemas de flujo y transporte que
está desarrollando el departamento de Ingeniería Química. Estas investigaciones
son realizadas en conjunto con el Ceitsaza y tienen como objetivo determinar
la mecánica de la dispersión de las aguas, así como de los contaminantes que
eventualmente pueden ser vertidos en ellas. Además, otra línea dentro del mismo
tipo de problemas tiene relación con el comportamiento en medios microporosos,
esto dice directa relación con los fenómenos hidrodinámicos en conjunto
con la mecánica de los gases que se dan al interior de una pila de lixiviación.
La simulación de estos fenómenos requiere una gran cantidad de tiempo y
recursos computacionales. En algunos casos simulaciones de pequeño tamaño
en problemas de flujo y transporte relacionados a superficies microporosas, han
demorado hasta seis meses en una estación de trabajo tradicional. El uso de
tecnologías HPC apoya directamente la disminución de tiempo en la generación
de las simulaciones y aumenta el tamaño de las mismas, pudiendo, en algunos
casos, no tan solo ejecutar de manera más veloz, sino que también tener variantes
corriendo en forma simultánea
4.1.3 Iniciativas CEAZA, Universidad de La Serena
Otro centro de investigación que ha hecho aportes en el uso de Computación
grid en Chile es el CEAZA de la Universidad de La Serena, que reúne a cerca de medio
centenar de investigadores formados en destacadas instituciones científicas del
mundo. Estos especialistas desarrollan sus estudios en todos los ambientes desde
la Cordillera de Los Andes hasta el Océano Pacífico, para generar conocimiento
acerca de la Región de Coquimbo, Atacama y de otras aledañas. La institución
intenta comprender los procesos oceanográficos, atmosféricos e hidrológicos
asociados al Cambio Climático Global (CGC) y al fenómeno del Niño – Oscilación
del Sur (ENOS), sus efectos sobre los sistemas bióticos naturales o bajo cultivo. A
su vez, busca aportar soluciones a los desafíos que imponen estos fenómenos,
desarrollando ciencia y tecnología regional, aunando las voluntades del sector
público y privado. Su misión es contribuir a la comprensión de los efectos de las
oscilaciones climáticas/oceanográficas sobre el ciclo hidrológico y la productividad
biológica (natural y bajo cultivo) en las zonas áridas y marinas del centro-norte de
Chile. También busca promover el desarrollo científico tecnológico de alto nivel
en la Región de Coquimbo, a través de la investigación científica-tecnológica y de
la gestión en este ámbito. Además, aspira a colaborar en la formación de capital
humano de alto nivel en ciencia y tecnología. Asimismo se pretende aportar al
progreso y calidad de vida de los habitantes de la Región de Coquimbo, mediante
93
Capítulo IV: Estado del Arte Nacional
la aplicación del conocimiento a la productividad regional, la protección del
ambiente y la educación
Por un total aproximado a los 65 millones de pesos, el proyecto de
equipamiento potenciará el área de teledetección del CEAZA, con un laboratorio
computacional de avanzada provisto con clusters o megaprocesadores, los que
aumentarán las capacidades de análisis de datos para la generación de modelos
matemáticos en diferentes áreas de investigación tanto terrestres como marinas.
El método de la teledetección permite el cruce de información científica de
diversos tipos con información geográfica obtenida en forma satelital, por medio
del Sistema de Información Geográfica (SIG).
Con estas nuevas herramientas y su pronta incorporación al grupo de
Computación Grid en Chile, se analizará con rapidez los datos que proporciona la
Red CEAZA MET para contar con el pronóstico meteorológico en tiempo real, lo cual
apoyará gran parte de las actividades productivas de la región. Hoy se tienen los
datos para realizar este trabajo, sin embargo, no se cuenta con equipos de análisis
suficientemente veloces para tener la información a tiempo. Además, a través de
este sistema se estudiarán informaciones relevantes para el riego, la conservación,
la climatología, la hidrología, entre muchas otras áreas del saber y la producción.
4.1.4 Iniciativas de la Universidad de La Frontera
La Universidad de La Frontera (UFRO) participó del proyecto Fondef D02I1054
Servicios y Aplicaciones de Alto Rendimiento sobre Redes de Tercera Generación,
liderado por REUNA, entre los años 2003 y 2005. En dicho proyecto se realizaron
pruebas de instalación de Globus 4 para ejecutar trabajos paralelos con mpiexec
de Bioinformática entre un nodo en la UFRO y un nodo en REUNA. Luego, ha
participado de la comunidad CLGRID en sus cinco versiones, organizando el
CLGRID4 en marzo de 2007. Ese mismo año comenzó su trabajo de pruebas de
UNICORE. Recientemente se ha acercado a EELA-2 para participar activamente en
el proyecto.
4.1.5 Iniciativas de la Universidad Técnica Federico Santa
María
La Universidad Técnica Federico Santa María ha tenido dos líneas de desarrollo.
Por el lado académico, se han efectuado tres tesis de Ingeniería informática en el
área grid: 2005 y 2006 en instalaciones de plataformas Globus, y en enero de 2009,
en plataforma UNICORE. Por el lado científico, la UTFSM participó en el proyecto
94
Capítulo IV: Estado del Arte Nacional
HELEN - High Energy Physics Latinamerican European Network el año 2005.
Como parte de la integración al proyecto EELA, el 2006, junto a la Universidad de
Concepción, la UTFSM instaló un cluster para luego hospedar el 5° tutorial EELA en
tecnologías grid. Esto les permitió capacitar recurso humano y continuar trabajando
en EELA-2 en temas de física de altas energías, computación grid y HPC, mecánica
de fluidos y neurociencias, reuniendo a más de 20 profesores, postdoctorados y
alumnos de postgrado. En la actualidad participa en el proyecto ATLAS del CERN
junto a la Pontificia Universidad Católica de Chile (PUC).
UTFSM ha desarrollado iniciativas en el proyecto ALMA y AGIS_CERN. Además
participa de la comunidad CLGRID y organizó el quinto encuentro, en septiembre
2008.
4.1.6 Iniciativas de la Universidad de Talca
La Universidad de Talca ha participado esporádicamente del CLGRID y está
participando en el proyecto FONDEF TIC-EDU Sistema de Aprendizaje Colaborativo
Basado en Infraestructura Grid: Aplicaciones en Ciencias Biológicas y Biotecnología,
aprobado en el 2008 y liderado por la PUC, donde también participa la Fundación
Ciencia para la Vida.
4.1.7 Iniciativas de la Universidad del Bío-Bío
La Universidad del Bío-Bío participó por primera vez en el año 2005 en el
proyecto UCRAV, como usuario de instrumentación en grid. Luego, participó del
taller EELA 2006, llevado a cabo en el marco del Primer Congreso Nacional de eCiencia realizado ese año por REUNA, y en el Segundo Congreso, en 2007, también
a cargo de la Red Universitaria Nacional. En lo académico, recientemente se ha
realizado una tesis en plataformas grid.
4.1.8 Iniciativas de la Universidad Austral
La Universidad Austral de Chile integra la comunidad CLGRID, participando
en CLGRID2 y CLGRID3 y en experimentos de plataformas grid. Después de una
ausencia de un año, se unió al proyecto ATLAS, desarrollado en Chile por la UTFSM
por un ex postdoctorado de Física quien fue contratado como investigador en la
UACH para realizar una transferencia de la colaboración grid.
95
Capítulo IV: Estado del Arte Nacional
4.1.9 Iniciativas de la Universidad de Valparaíso
La Universidad de Valparaíso también participó de CLGRID2 y colabora con la
UTFSM en el proyecto EELA-2.
4.1.10Computación grid de apoyo a la Astronomía
Como parte de la iniciativa de los talleres de e-Ciencia desarrollados por
REUNA a partir del año 2006 y las reuniones KAWAX, se trató la necesidad de usar
tecnología grid en Astronomía, como imperante a corto plazo, para facilitar a los
astrónomos hacer ciencia más rápida y de modo más confiable22.
La conclusión era que con la llegada de nuevos telescopios que generarán
masivas cantidades de datos, se demandará un nuevo enfoque para desarrollar
ciencia en el área. También está la necesidad de integrar los telescopios creando
un Observatorio Virtual, lo que le permite al astrónomo tener en su computadora
personal el conjunto de datos astronómicos que él desee investigar.
El desarrollo del Observatorio Virtual permitirá hacer uso de una gama de
nuevas tecnologías de cómputo distribuido que provienen del mundo del grid
computing, como se está haciendo en diferentes centros astronómicos en el
mundo.
Distintos centros de astronomía en el país, que cuentan con instrumentación
idónea (tales como telescopios), ven la necesidad imperiosa de estar al día con
la tecnología grid para sostener la docencia y la investigación en esta área de la
ciencia, y contribuir al desarrollo de un Observatorio Virtual.
22
96
http://www.reuna.cl/documentos/DOC2008/KawaxAstronomia_nov2008.pdf
Clima
Capítulo V: Estado del Arte Internacional
5 Capítulo V:
Estado del Arte Internacional
5.1 Tendencias de investigación en clima
El estudio del clima tiene un gran reto al cual hacer frente durante el siglo XXI
y es cómo abordarlo a nivel mundial, tanto hoy como a futuro23. Este reto adquiere
una relevancia mayor cuando el amplio consenso alcanzado por científicos de
prestigio, tal y como quedó de manifiesto en el cuarto informe de evaluación del
Grupo Intergubernamental de Expertos sobre el Cambio Climático, establece que
el clima está cambiando y que cambiará significativamente aún más y, para peor,
siendo más probable que afecte principalmente a países en vías de desarrollo (los
con menor capacidad de adaptación).
Para hacer frente a este reto, se están explorando la colaboración entre los
distintos países, el establecimiento de ciertos “estándares” de procedimientos
científicos y un conjunto de actividades relacionadas con las necesidades de
información climática. Trataremos en este capítulo los desafíos aquí descritos, así
como también la tendencia en modelación climática.
5.1.1 Desafíos para el registro climático global
Según la Organización Meteorológica Mundial (OMM)24 y las evidencias con
que se dispone, el clima seguirá cambiando de forma importante, producto de las
23
William Wrigth. Observando el Clima: Desafíos para el siglo XXI. Boletín
OMM. Enero de 2008.
24
World Climate Conference-3.
99
Capítulo V: Estado del Arte Internacional
actividades humanas de estas últimas décadas; esto hace de la adaptación algo
esencial.
Un primer paso imprescindible y fundamental, es crear un sistema que se
encargue de informar qué está ocurriendo, por qué está sucediendo y qué se
espera de forma inmediata.
En términos generales, lo que se necesita son observaciones (que satisfagan
los principios de observación climática), un sistema de seguimiento del
rendimiento, la adquisición, archivo y administración de datos, la gestión integral
de dichos datos, y el análisis y re-análisis de las observaciones y de la obtención de
productos, incluyendo, en particular, los registros de datos climáticos, la evaluación
de lo que sucedió y del porqué (atribución), incluyendo posibles impactos sobre
los seres humanos y los ecosistemas, la predicción de cambio climático a corto
plazo durante varias décadas y la receptividad de los encargados de la toma de
decisiones y de los usuarios25.
Lo señalado en el párrafo precedente, implica reunir información relativa a los
cambios en el clima, para desde allí llegar, en lo posible, a entender el porqué ha
tenido lugar el cambio. Esta mutación se ha producido en muchos ámbitos, no sólo
en clima, donde primero se deben recopilar los datos de lo que está por ocurrir, para
luego recurrir a la historia y entender la razón del suceso. Con esta metodología
podríamos ser capaces de utilizar el conocimiento existente para mejorar el
realismo de los modelos y la técnica de predicción, para después traspasar este
conocimiento a los usuarios y al público que puede emplear los datos, registros
y el proceso de atribución obtenidos de los fenómenos climáticos, para generar
nuevos conocimientos.
En resumen, según señala Kevin E. Trenberth, este proceso de atribución podría
contar con dos fases. La primera consistiría en utilizar los modelos atmosféricos y
ver hasta dónde se podrían prever las condiciones recientes, a partir de las distintas
variables. En la segunda etapa, se podría afirmar por qué éstas variables son de
la forma que son. Es de este modo que los modelos han ido mejorando, ya que
muchos fenómenos climáticos que antes no tenían atribución a ninguna causa en
el pasado, ahora si pueden ser variables de un modelo26.
A pesar de lo anterior, los modelos siguen muy lejos de la perfección y muchas
veces no toman en cuenta la importancia del proceso de atribución. Aquí radica
la necesidad de tomar en consideración los defectos de los modelos, sobre todo
25
Kevin E. Trenberth. Necesidades de observación para la protección y
adaptación climáticas. Boletín OMM. Enero de 2008.
26
100
Kevin E. Trenberth. Obra citada. Enero 2008.
Capítulo V: Estado del Arte Internacional
cuando las estadísticas pueden resultar más convincentes. A futuro se necesitarán
recursos informáticos muy amplios para llevar a cabo simulaciones de conjunto y
con resolución suficiente para las áreas a estudiar.
¿Cómo realizar este proceso de forma eficaz?
“En el área de las estadísticas, aunque resulte complicado generalizar
cuándo un registro de datos es suficiente, la tendencia apunta que se necesitan
aproximadamente 30 años de registro en un número suficiente de estaciones para
poder representar las principales zonas climáticas y regiones vulnerables de un país.
Para corroborar que los extremos estén debidamente registrados, los datos deben
ser como mínimo, diarios. Estos datos deben ser homogéneos e ir acompañados
de una buena información complementaria, metadatos (datos que describen otros
datos)”27.
Estas series temporales28 no pueden contener lagunas significativas en
el registro, puesto que eso podría desmoronar la información obtenida de los
metadatos.
La variabilidad del clima y el cambio climático son fenómenos globales, los
cuales no respetan fronteras, por lo tanto, es de suma importancia que el registro
sea de alcance mundial. Lamentablemente, existen naciones que cuentan con un
número reducido o inexistente de observaciones, mermando la capacidad global
de comprensión y predicción: esta falta de datos disminuye las posibilidades de
predecir correctamente el clima a nivel mundial, lo que aumenta la complejidad al
considerar un futuro calentamiento global.
Uno de los lugares con difícil acceso y bajo nivel de observaciones es la
Antártica, hoy, tema obligado para las instituciones de Servicio Meteorológico (SM)
y para aquellas que estudian el cambio climático y cómo éste afecta la Glaciología.
En Chile el Centro de estudios Científicos (CECS, www.cecs.cl), ubicado en Valdivia,
previendo esta situación, creó el departamento de Glaciología y Cambio Climático,
dentro del cual se desarrolló un grupo de nivel mundial que completó exitosamente
expediciones Antárticas de gran escala, incluyendo una exploración aérea de los
glaciares del Mar de Amundsen, en Antártica Occidental, en 200229.
27
William Wrigth. Obra citada. Enero 2008
28
Una Serie temporal es una secuencia de datos, medidos en determinados
momentos del tiempo, espaciados entre sí de manera uniforme y por tanto ordenados
cronológicamente.
29
Exploración aérea de los glaciares del Mar de Amundsen y la Península
Antártica (http://www.cecs.cl/web/cecs_index.php?area=cecs&dep=glaciologia&idioma=
es&pagina=proyecto&id=1), última visita 09-06-09.
101
Capítulo V: Estado del Arte Internacional
“Lamentablemente, en el momento en el que las redes de alta calidad
destinadas a la observación del clima y a propósitos de previsión son más necesarias,
existiendo además un reconocimiento cada vez mayor de este hecho, los factores
económicos se están desplazando en el sentido contrario”30.
5.1.2 La observación, base de la investigación climática
El clima está cambiando. En términos generales se está experimentando un
aumento de las temperaturas como consecuencia de los cambios de la atmósfera
inducidos por el ser humano. A pesar de esta generalidad, no existe una uniformidad
en el cambio climático, por lo cual los desafíos son a nivel regional.
Para el desarrollo de investigaciones y proyecciones climáticas futuras,
son necesarias las observaciones, las cuales pueden provenir de distintas
fuentes (satélites, redes de observación manuales, estaciones meteorológicas
automáticas, etc.). En muchos países los presupuestos destinados al Servicio
Meteorológico se ven cada vez más limitados; durante los últimos 10-15 años la
tendencia nos indica que las redes de observación manuales (que necesitan gran
cantidad de recursos) están siendo desplazadas por estaciones meteorológicas
automáticas (EMA) en casi la totalidad de los países. Estas EMA ofrecen muchas
características clave que aportan a la conformación de esta tendencia, como son:
mayor rentabilidad, mayor frecuencia de datos y mejor capacidad para detectar
los extremos -pudiendo utilizarse en lugares remotos, entregan rápido acceso a
los datos y garantizan la coherencia y objetividad de la medición-. Sin embargo, a
pesar de los beneficios que brindan las EMA, en cualquier sistema de observación,
la continuidad y calibración de los registros climáticos representan un proceso
crítico, más aún si agregamos que el clima está cambiando y es imprescindible
registrar las pequeñas variaciones que ocurren, éstas deben reconocerse en el
momento que surgen para, de esta manera, identificar cuáles son las perspectivas
para el futuro.
Por lo tanto, según el punto de vista de la OMM los desafíos que se deben
superar son:
No debe existir pérdida de datos, fallos en la comunicación o copia de
seguridad de los datos inadecuada, ya que éstos provocan importantes lagunas en
la continuidad de los datos.
30
102
William Wrigth, Obra citada, Enero 2008.
Capítulo V: Estado del Arte Internacional
Los instrumentos se degradan (sobre todo en el caso de los satélites) y, por lo
tanto, el registro climático puede corromperse.
Debido a una gestión inadecuada del cambio y, otras veces, al deficiente
mantenimiento, se ha introducido una heterogeneidad en las series temporales.
Las EMA tienden a sobreestimar las temperaturas mínimas y subestimar las
temperaturas máximas, según un reciente estudio llevado a cabo en Rumania31.
Las precipitaciones pudieran presentar dudas en su exactitud, derivando,
nuevamente, en la homogeneidad e influyendo negativamente en importantes
decisiones.
Los procesos de mantenimiento requieren técnicas especializadas que
pueden no estar disponibles en algunos países.
Se necesita de equipamiento específico en la utilización de las EMA, de lo
contrario suele ocurrir la pérdida de observaciones visuales.
Estos desafíos a superar hacen necesaria una sólida puesta en marcha de
procesos de gestión del cambio y de un mantenimiento regular. El inconveniente
es que estas mejoras comportan y se traducen como incrementos en los costos.
Para que el registro climático general no se vea en peligro, es necesario que el
valor de los registros sea reconocido y diseñar redes para que las estaciones
meteorológicas convencionales actúen de forma complementaria con las EMA. Es
de prioridad fundamental crear un sistema basado en estas observaciones con el
fin de informar a los responsables de la toma de decisiones sobre qué es lo que está
ocurriendo y por qué.
5.1.3 Gestión y administración de datos derivados de la
observación
Los registros climáticos tienen un gran valor si se quiere lograr cualquier
investigación climatológica de calidad, es por esto que, además de contar con las
redes adecuadas para la obtención de los mismos, es necesario garantizar que se
respalden de forma adecuada y que el sistema de acceso a ellos sea lo más sencillo
posible. Si no se cumplen estas condiciones, y sólo se cuenta con los registros
en papel y/o se crean sistemas complejos, se hace prácticamente imposible
realizar cualquier predicción futura o utilizar los datos en modelos climatológicos.
31
William Wrigth, Obra citada, Enero 2008.
103
Capítulo V: Estado del Arte Internacional
Lamentablemente esta situación aun se presenta en muchos países en vías de
desarrollo.
A continuación se presenta una lista de tareas necesarias -evidenciadas en
documentos de la OMM32- para lograr registros de calidad; tienen como sustrato
base condicionante el compartir los datos.
Recuperar y digitalizar datos
En muchos países los datos se encuentran respaldados únicamente en
papel, esto restringe el acceso a ellos y, lo que es peor, el peligro de su pérdida es
latente, ya sea por robo, incendio, inundación o cualquier tragedia que pudiera
ocurrir. Es por ello que debe existir una inversión en los procesos de recuperación
como digitalización. Existen proyectos como RECLAIM33 (Recuperación de cuadernos
de bitácora y de datos marinos internacionales) que fomentan la recuperación de
los diarios abordo de los barcos, como un nuevo elemento de ayuda a la hora de
interpretar las condiciones climáticas de los océanos en el mundo.
Utilizar la tecnología para el respaldo
Una forma de contar con los datos eficazmente respaldados es utilizar los
distintos formatos electrónicos, de forma que puedan ser fácilmente introducidos
en hojas de cálculo, paquetes de análisis y modelos climáticos. Para estos fines, se
desarrolló –bajo el auspicio de la Organización Meteorológica Mundial- el software
Climsoft34 que, de carácter abierto, trabaja la gestión de datos y tiene la facilidad de
ser adaptable a las necesidades propias de cada país y/o institución.
Garantizar calidad a través del control
Para asegurar que los datos sean absolutamente fiables, debe existir un
control de calidad que detecte los errores y, posteriormente, proceda a corregirlos,
eliminarlos o simplemente señalarlos. En el pasado, el control de calidad era realizado
manualmente por el personal, dejando frecuentemente ese trabajo a la experiencia
subjetiva del operador. Hoy en día las pruebas se realizan en forma automatizada,
con controles predeterminados, los cuales deben poseer, por ejemplo, controles
frente a los extremos climáticos y controles de coherencia interna (¿el punto de
rocío supera la temperatura?, fluctuaciones temporales improbables).
Existen muchas variables que influyen a la hora de establecer cuál será el tipo
de control de calidad a utilizar, éstas pueden ser el tipo de variable, la frecuencia de
los datos, recursos humanos, y los equipos utilizados por el Servicio Meteorológico.
32
Organización Meteorológica Mundial, Directrices sobre la gestión de datos climáticos, Marzo 2007.
33
http://icoads.noaa.gov/reclaim, última visita 08-06-09.
34
http://www.ssc.rdg.ac.uk/climsoft.
104
Capítulo V: Estado del Arte Internacional
Un gran beneficio de los controles de calidad es que al garantizar la
identificación de los diferentes tipos de errores, se puede, si estos son recurrentes,
señalar posibles sensores defectuosos, prácticas de observación pobre, localización
inadecuada, incorrecto mantenimiento o un problema de mensajería como ha
ocurrido con las EMA.
“Esta garantía de calidad de principio a fin, debería ser un objetivo
primordial para cada uno de los servicios meteorológicos respectivos: resulta obvio
que la mejor forma de garantía de calidad es asegurarse que los datos originales se
acercan lo más posible a la perfección”35.
5.1.4 Otras problemáticas
Gran cantidad de países en vías de desarrollo tienen que luchar con muchos
problemas que las naciones desarrolladas no poseen o aparecen con muy baja
severidad. Aquí nos referimos a la restricción de los recursos, movimiento de
personal elevado o a la inexistencia de planes de perfeccionamiento para los
funcionarios del SM y al hecho que ellos sean llevados únicamente por la iniciativa
individual de dichos funcionarios (no tienen al alcance beneficios que ayuden a
solventar los gastos de un magíster/doctorado; incluso, cuando obtienen becas,
muchos estudiantes no tienen la seguridad de encontrar fuente laboral en su
país, porque las estructuras o recursos para su contratación no alcanzan). También
están los problemas con lo inadecuado del equipamiento y las instalaciones, las
estaciones que frecuentemente son remotas, pueden ser de difícil acceso por lo
limitado de las infraestructuras, ofreciendo como resultado comunicaciones de
baja calidad.
También es una problemática que los recursos humanos no estén a la altura de
la infraestructura disponible o viceversa. Esto produce que los recursos disponibles
(humanos o tecnológicos) pierdan parte de su capacidad, significando un costo
que no se incluye en los libros de finanzas de las instituciones, mas bien pueden
traducirse en pérdidas de participaciones en proyectos, capacidad ociosa o en falta
de tiempo. Lamentablemente, esta situación es recurrente y su incidencia depende
de la cultura de cada organización. El llamado es a que tanto recursos humanos como
tecnológicos crezcan a la par, el futuro de una organización depende de ello.
Si bien la falta de recursos (tecnológicos o humanos) es un gran problema,
también lo es que no existan los canales de comunicación entre universidades
35
William Wrigth. Obra citada. Enero 2008
105
Capítulo V: Estado del Arte Internacional
e instituciones encargadas del estudio meteorológico, ya sea para compartir
recursos o para emprender iniciativas en conjunto. Esta situación es aún más grave,
al considerarse que es un hecho que la meteorología sólo figura en los lugares
bajos en el posicionamiento de las prioridades de los gobiernos.
El problema está en que sin tener las observaciones necesarias, resulta muy
difícil generar prestaciones de nivel para gestionar los servicios climáticos y así
tomar medidas para gestionar el riesgo del clima; aparejado a este problema, se
presentaría la imposibilidad de esbozar una imagen del clima mundial, de sus
variaciones y cambios.
La colaboración se vuelve fundamental ya que en muchos lugares se presentan
fenómenos que necesitan ser estudiados, conocimiento que nos interesa a todos
pues el clima y sus futuros cambios no respetan fronteras.
El proyecto ACT-1936 es, en Chile, un ejemplo claro de cómo la unión de distintas
instituciones puede rendir buenos dividendos; en él se reunieron la Dirección
Meteorológica de Chile, Universidad de Concepción y Universidad de Chile, en la
búsqueda de la variabilidad climática (atmósfera/océano) del país, realizando una
evaluación e interpretación para, por último, ver las proyecciones. El Proyecto tiene
un significativo impacto socioeconómico al interior de las fronteras nacionales,
ya que Chile basa fuertemente su desarrollo en una explotación intensiva de sus
recursos naturales.
Cualquier emprendimiento que quiera regirse por estándares internacionales,
debe contar con manuales de procedimientos que muestren en forma básica
las distintas actividades que son realizadas en el puesto, lamentablemente las
investigaciones tienen pocas diligencias rutinarias, por lo tanto, el investigador se ve
envuelto en la disyuntiva de elaborar manuales o seguir con sus investigaciones.
¿Qué motivaría a un investigador a invertir su tiempo en elaborar complejos
manuales de procedimiento si su labor no es reconocida?
Lamentablemente el no contar con estas “guías”, ni con un plan de reemplazo
ante la salida o la ocurrencia de alguna desgracia de algún participante, crea una
dependencia muy alta de la institución con el trabajador, provocando que en
muchos proyectos los representantes de una universidad y/o institución no sean
más de uno, y que si éste deja sus funciones no exista un reemplazo que pueda
cubrir las actividades generales.
36
106
http://www.dgf.uchile.cl/ACT19/
Capítulo V: Estado del Arte Internacional
¿Cuál es el punto de dependencia que puede tener una institución de sus
trabajadores?
5.1.5 Los modelos matemáticos como aporte al estudio
del clima y el tiempo
Se debe dejar en claro que “Tiempo y Clima son dos conceptos diferentes. El
primero se refiere a condiciones atmosféricas dadas que resultan de la evolución
de un conjunto específico de condiciones iniciales (CI). El segundo se apunta a las
condiciones características dado un conjunto de forzamientos o condiciones de
borde (CB). Los modelos que se usan para esto resuelven ecuaciones similares pero
en un caso se pone atención especial a las CI y en el otro a las CB. Los primeros
se integran por unos pocos días y los segundos por años, llegando decenas o
centenios. En el primer caso, los modelos numéricos y estadísticos se ejecutan en
modo operacional de modo de tener el mejor pronóstico. En el otro caso, se hacen
simulaciones ocasionalmente para determinar escenarios posibles”37.
Es así como los modelos matemáticos son sistemas de ecuaciones que
intentan reproducir el comportamiento del mundo real, simulando las interacciones
de la atmósfera, océanos, superficie terráquea, y hielo. El uso de modelos es
imprescindible para hacer pronósticos meteorológicos y para intentar prever las
consecuencias de los posibles cambios climáticos a mediano y largo plazo. Su
gran desventaja es que la realidad es tan compleja que aun cuando se desarrollen
modelos con gran cantidad de variables, no estará al alcance un supercomputador
que sea capaz de soportarlo. Es por esto que se utilizan modelos que sólo describan
el medio analizado (atmósfera, aire, mar). En la búsqueda del perfeccionamiento
de estos modelos se van agregando nuevas variables que simulen mejor lo que
está ocurriendo, es así como se están dando nuevos desafíos en la modelación38,
tales como:
Pronóstico de conjunto (Ensemble forecast)
El pronóstico de conjunto supone la “producción” de muchos pronósticos
de manera de reflejar la incertidumbre en el estado inicial de la atmósfera (debido
a los errores de la observación y el insuficiente muestreo). Su aporte es que la
incertidumbre en el pronóstico puede ser calculada por el rango de diferentes
pronósticos producidos.
37
Laura Gallardo Klenner, apunte crítico.
38
Rodrigo Delgado Urzúa. Implementación computacional de modelos
atmosféricos.
107
Capítulo V: Estado del Arte Internacional
Los pronósticos de conjunto están siendo cada vez más usados para las
operaciones del pronóstico del tiempo (ejemplos variados en European Centre for
Medium-Range Weather Forecasts (ECMWF), National Centers for Environmental
Prediction (NCEP), y el Canadian Forecasting Center).
Pronósticos extendidos de alta confiabilidad
Se define como pronóstico extendido al período que va entre el tercer y el
quinto día a partir del cual se realizó el análisis, aquí se busca desarrollar la más alta
precisión. A ésta se agrega una nueva tendencia denominada “Accurate Seasonal
Forecast”, en ella se apunta mucho más allá, pretendiéndose entregar pronósticos
mucho más precisos en el lapso de semanas y meses.
Ciertamente, desarrollar este tipo de pronósticos entregará grandes
beneficios a la humanidad, en muchas actividades productivas (por ejemplo
en agricultura, silvicultura, pesca, minería, etc.). Hoy en día muchos gobiernos
piden informes a sus servicios meteorológicos para ver qué medidas preventivas
desarrollar en la búsqueda de mejores rentabilidades.
Pronósticos de alta resolución
Cada día se desarrollan resoluciones más altas, esto es debido a que:
•Existe una mayor cantidad, poder y disminución en el precio de los
computadores.
•A diario se dispone de mayor precisión y cantidad de datos topográficos y
meteorológicos.
•Su importancia viene dada porque las acciones que se deben tomar son
de carácter regional la gran mayoría de las veces, y, para esto, es necesario
tener resoluciones donde se puedan detectar las variables en un punto
dado.
Todas estas tendencias en la modelación tienen en común un alto
requerimiento de capacidad de cómputo, como grandes espacios donde guardar
los datos que estos modelos proporcionan. Un punto fundamental con los datos
proporcionados aquí, es no sólo almacenar los resultados, sino cómo lograr que
esos datos sean compartidos y útiles para otras investigaciones, sin importar el
lugar donde se encuentre la persona que los solicite.
Modelos Acoplados
Además de los modelos que analizan un área en especial (atmósfera, aire,
mar), también se están implementando modelos “especiales” que incluyen tanto el
mar como el aire, estos son los denominados “modelos acoplados”.
108
Capítulo V: Estado del Arte Internacional
Un modelo acoplado considera que los cambios en la atmósfera causan
cambios en el océano, a su vez, los cambios en la parte del modelo del océano
pueden causar cambios en la parte de la atmósfera. De manera que si se lleva gran
cantidad de dióxido de carbono de la atmósfera hacia océano, el océano podría
llegar a estar «completamente lleno» de CO2, no contener tanto, o, quizás, estar en
una posición intermedia.
Si bien los modelos acoplados pueden ser más realistas, lamentablemente
poseen una complejidad mayor que los que son de un medio en específico,
además, toma trabajo cerciorarse que las respuesta que originan son correctas y
tardan mucho en funcionar incluso en las supercomputadoras.
Modelos del tiempo químico (Chemical weather forecast)
Estos nuevos tipos de modelos buscan pronosticar la calidad del aire
y cómo ésta influye en las condiciones climáticas (cantidad gases o material
particulado), para generar acciones preventivas. El pronóstico del tiempo químico
es una “nueva variable” en los modelos de pronosticación climática (WRF/Chem,
CCATT-BRAMS, etc.), la cual aumenta de sobremanera los costos en tiempo y en
términos computacionales.
¿Las instituciones dedicadas a la investigación, están reconociendo la
importancia que tienen los especialistas en computación en sus trabajos?
¿La búsqueda de modelos con cada vez más variables y precisión, es
acompañada de una infraestructura acorde?
5.1.6 Esfuerzos existentes en Chile
Hoy en día, en la Dirección Meteorológica de Chile se utiliza un cluster en el
cual se incorporan 8 CPU exclusivamente para el pronóstico operacional para el
país. No se guardan los pronósticos a largo plazo, salvo en un marco de cinco días,
aproximadamente.
Para el proyecto ACT-19, llevado a cabo por Universidad de Chile, Universidad
de Concepción y la Dirección Meteorológica de Chile, se utilizó un cluster Linux
con 16 CPU AMD Optaron. Con este equipo se consiguieron aproximadamente 10
TB (terabytes). Estos datos recrean posibles escenarios del clima en Chile, entre los
años 2070 y 2100.
109
Capítulo V: Estado del Arte Internacional
¿En Chile, se está obteniendo un rendimiento óptimo con los resultados de
los diferentes proyectos?
¿Se podrían guardar todos los datos obtenidos sin necesidad de eliminar
resultados por falta de espacio?
¿Qué tan beneficiosos pueden llegar a ser los datos que son desechados?
5.1.7 Fenómenos climáticos
Los fenómenos climáticos siempre han existido e impactado de distintas
maneras en los lugares en los cuales se presentan, ya que pueden beneficiar al
medio ambiente como devastarlo por exceso. Lo anterior se ve reflejado en los
distintos sectores de la actividad económica. Por estas razones y dada la importancia
que tiene la ocurrencia de estos fenómenos para el bienestar de la sociedad,
es que prácticamente todos los países del mundo poseen su propio Servicio
Meteorológico, el que les permite obtener información sobre el comportamiento
de tales fenómenos.
Lamentablemente estos fenómenos poseen una gran complejidad al
momento de estudiarlos, lo que dificulta predecir su comportamiento. Entre los
fenómenos climáticos destacados, tenemos:
Fenómeno del Niño39:
Actualmente se sabe que corresponde a todo un fenómeno natural de
interacción océano-atmósfera que ocurre en la región del Pacífico intertropical
cada cierta cantidad de años y que se caracteriza por presentar condiciones de
la temperatura del mar más cálidas que lo normal, en una extensa área entre las
costas sudamericanas y de Oceanía.
¿Qué ocurre en la atmósfera en presencia del Niño? Los vientos alisios, que
normalmente soplan en la región intertropical desde América hacia Oceanía, se
debilitan y pueden llegar a cambiar de sentido, facilitando así el transporte de aguas
calientes, características del sector de Indonesia, hacia las costas intertropicales
sudamericanas y, posteriormente, hacia el istmo de Panamá y las costas del norte
de Chile. En la atmósfera media y alta del Pacífico ecuatorial, los vientos del este
también se debilitan, permitiendo que la nubosidad convectiva del sudeste
asiático se desplace hacia Sudamérica, produciendo intensas precipitaciones en
Ecuador y Perú. Estas alteraciones atmosféricas, también hacen que la zona de altas
39
110
Información obtenida desde sitio web de la Dirección Meteorológica de Chile.
Capítulo V: Estado del Arte Internacional
presiones que se ubica sobre el Océano Pacífico, frente a la parte norte y central de
Chile (anticiclón del Pacífico), se desplace hacia el oeste, debilitando sus efectos
en Chile y permitiendo así que los sistemas frontales que provienen del Pacífico
sur, alcancen la zona central y norte chico del país, incrementándose la cantidad e
intensidad de las precipitaciones en estos sectores.
La Niña:
Término empleado para describir un fenómeno natural de interacción océanoatmósfera, que ocurre en la región del Pacífico ecuatorial cada ciertos años y que se
caracteriza, principalmente, por presentar condiciones de la temperatura del mar más
frías que lo normal en una extensa área, entre las costas de Sudamérica y Oceanía.
¿Qué ocurre en la atmósfera en presencia de La Niña? Los vientos alisios,
que en condiciones naturales se encuentran en la región intertropical del océano
Pacífico, soplando desde las costas americanas hacia el sector asiático, comienzan
a ser más intensos, favoreciendo, de esta manera, el arrastre de aguas superficiales
más frías que existen en la región oriental del Pacífico hacia la parte occidental. En
la atmósfera media y alta del Pacífico ecuatorial central, bajo estas condiciones frías,
aparece una intensificación de la circulación de las masas de aire que descienden
desde la alta atmósfera (15 km de altura) hasta la superficie. Esto origina que la
zona de altas presiones, ubicada en la parte norte y central de Chile y área oceánica,
aumente en intensidad y extensión espacial, impidiendo el ingreso de sistemas
frontales y el desarrollo de nubosidad asociada a precipitaciones en la zona central
y sur de Chile.
El Monzón40:
Un monzón se define como un cambio estacional en la dirección del viento.
El término se deriva de la palabra árabe «mausim», que significa «estación».
Originalmente el término era aplicado por marineros árabes para referirse a los
vientos cambiantes estacionalmente en el Océano Índico y regiones circundantes,
incluyendo el Mar de Arabia.
Estos vientos soplan desde el suroeste, durante una mitad del año, y desde
el noreste, durante la otra. Por lo tanto, hay cambios estacionales que se observan
claramente como vientos del noreste que prevalecen durante el invierno en el
subcontinente de la India y del suroeste, en el verano. Otros monzones ocurren en
Australia y África.
Debido a una mejor comprensión de los monzones, la definición ahora denota
sistemas climáticos dondequiera que la humedad aumente dramáticamente en la
40
http://www.jmarcano.com/varios/desastre/monzon.html. Consultado 24 de
Mayo de 2009.
111
Capítulo V: Estado del Arte Internacional
estación cálida. El caso mejor conocido es el monzón asiático, que afecta al sureste
de Asia y al subcontinente indio, pero también existe un clima monzónico en el
norte de Australia, África Occidental y otras partes. La presencia Norte a Sur de los
Andes impide la aparición de fenómenos similares tanto en América del Sur como
del Norte.
El monzón es uno de los fenómenos climáticos más dramático en el planeta.
Las grandes superficies envueltas en los monzones y la gran escala del clima dentro
de ellos, sugieren que juegan un papel significativo en la modelación del clima
global. Cuando ocurren fuertes precipitaciones monzónicas en una región, en las
regiones opuestas se presentan sequías.
Un cambio monzónico estacional se caracteriza por una diversidad de
mecanismos físicos que producen fuertes vientos estacionales, un verano húmedo
y un invierno seco. Todos los monzones comparten tres mecanismos físicos
básicos: diferencia en el calentamiento entre la tierra y los océanos, las fuerzas
de Coriolis, debido a la rotación de la Tierra, y el papel del agua que almacena y
libera energía a medida que cambia de líquido a vapor y viceversa (calor latente).
El efecto combinado de estos tres mecanismos es el que determina las inversiones
monzónicas características de los fuertes vientos y la precipitación.
En el caso del Monzón del Océano Índico, el primer y el tercer mecanismo
producen efectos más intensos que en cualquier otra parte del mundo. De
interés particular es la fase «verano húmedo» de Junio a Septiembre con vientos
prevalentes del suroeste y fuertes lluvias.
Ciclón Tropical:
Es un sistema de tormentas caracterizado por una circulación cerrada
alrededor de un centro de baja presión, que produce fuertes vientos y abundante
lluvia. Los ciclones tropicales extraen su energía de la condensación de aire húmedo,
produciendo fuertes vientos. Se distinguen de otras tormentas ciclónicas, como las
bajas polares, por el mecanismo de calor que las alimenta y convierte en sistemas
tormentosos de «núcleo cálido». Dependiendo de su fuerza y localización, un ciclón
tropical puede llamarse depresión tropical, tormenta tropical, huracán, tifón o
simplemente ciclón.
Afortunadamente los ciclones que causan destrucción masiva no son
frecuentes pero cuando suceden pueden causar daño en un rango de miles de
millones de dólares y destrozar o acabar con miles de vidas.
El Ciclón Bhola, el más mortífero registrado, golpeó la zona altamente poblada
del Delta del Ganges en el Pakistán Oriental (ahora Bangladesh), el 13 de noviembre
112
Capítulo V: Estado del Arte Internacional
de 1970, como un ciclón tropical de Categoría 3 (se refiere a vientos entre 178–209
km/h). Se estima que acabó con la vida de más de 300.000 personas41 .
En la región atlántica, a lo menos tres tormentas han matado a más de 10.000
personas. En 1998, el Huracán Mitch, durante la Temporada de huracanes en el
Atlántico, provocó severas inundaciones y deslizamientos de barro en Honduras,
matando a 18.000 personas y cambiando de tal manera el aspecto del terreno,
que fue preciso realizar nuevos mapas del país42. El Huracán de Galveston (1900),
que hizo entrada en tierra en Galveston (Texas) con una estimación de Categoría
4 (vientos entre 210-249 km/h), acabó con la vida de 8.000 a 12.000 personas, y
sigue siendo el desastre natural más mortífero en la historia de Estados Unidos43.
La tormenta más letal registrada en el Atlántico fue el Gran Huracán de 1780, que
mató a 22 mil personas en las Antillas44.
Entre las tormentas destacadas están el Tifón Nancy (1961) que tuvo un
registro con vientos de hasta 345 km/h, pero investigaciones recientes indican que
las velocidades medidas entre 1940 y 1960 eran más elevadas de lo que en realidad
debían ser, y, por tanto, no se considera a ésta comola tormenta con vientos más
potentes registrados45. De forma similar, una racha de viento medida a nivel de
superficie, causada por el Tifón Paka, en Guam, con una intensidad de 380 km/
h, que había sido confirmada y hubiera sido la racha de viento no tornádica más
fuerte registrada en la superficie de la Tierra, tuvo que ser rechazada ya que el
anemómetro fue dañado por la tormenta46.
Tip es también el ciclón más grande registrado, con una circulación de vientos
de fuerza tropical en un campo de 2.170 km. El tamaño medio de un ciclón tropical
es de «sólo» 480 km. La tormenta más pequeña registrada fue el Ciclón Tracy, que
en 1974 devastó Darwin (Australia), con tan sólo 100 km de tamaño47.
41
Major Hurricanes, Typhoons, Cyclones, and other Storms since 1900. Encarta.
Consultado el 24 de Mayo de 2009.
42
Guiney, John L.; Lawrence, Miles B. (28 de enero de 1999). Hurricane Mitch 22
October - 05 November 1998. National Hurricane Center. Consultado el 24 de Mayo de 2009.
43
The Deadliest Atlantic Tropical Cyclones, 1492-1996. National Hurricane
Center - National Weather Service. Consultado el 24 de Mayo de 2009.
44
National Hurricane Center - National Weather Service, artículo citado.
45
Landsea, Chris. Which is the most intense tropical cyclone on record?. Atlantic
Oceanographic and Meteorological Laboratory, Hurricane
46
Super Typhoon Paka>s (1997) Surface Winds Over Guam. Office of the
Federal Coordinator of Meteorological Services (17 de agosto de 1998). Consultado el
24 de Mayo de 2009.
47
Landsea, Chris. Artículo citado.
113
Capítulo V: Estado del Arte Internacional
El Huracán Iniki (1992) es la tormenta más poderosa que ha golpeado a
Hawái en la historia, entrando en Kauai como huracán de categoría 4, matando a
seis personas y causando tres mil millones de dólares en daños48. Otros huracanes
destructivos en el Pacífico incluyen al Huracán Pauline49 y al Huracán Kenna50.
El 26 de marzo de 2004, el Ciclón Catarina se convirtió en el primer huracán
del Atlántico Sur. Otros ciclones anteriores en esa misma región, en 1991 y 2004,
alcanzaron sólo fuerza de tormenta tropical. Es posible que antes de 1960 se
formasen ciclones tropicales allí, pero no fueron observados hasta el comienzo de
la era de los satélites atmosféricos en aquel año.
Un ciclón tropical no necesita ser especialmente fuerte para causar un daño
difícil de olvidar. La Tormenta Tropical Thelma, en noviembre de 1991, mató a
miles de personas en Filipinas y nunca llegó a ser tifón; el daño de Thelma se debió
principalmente a las inundaciones y no a los vientos o marejada ciclónica. En 1982,
la depresión tropical sin nombre, que posteriormente se convertiría en el Huracán
Paul, causó la muerte de unas 1.000 personas en América Central, debido al efecto
de sus lluvias torrenciales.
El 29 de agosto de 2005, el Huracán Katrina hizo entrada en tierra en Luisiana
y Misisipi. El Centro Nacional de Huracanes de EE.UU., en su revisión de agosto de
la temporada de tormentas tropicales, aseguró que Katrina era, probablemente, el
peor desastre natural en la historia del país51.
Actualmente se le asignan 1.604 muertes, principalmente producto de las
inundaciones y sus consecuencias en Nueva Orleans, Luisiana. También se estima
que causó daños por un valor de 75 mil millones de dólares. Antes de Katrina,
el sistema más costoso en términos monetarios fue el Huracán Andrew(1992),
que causó unas pérdidas estimadas de 39 mil millones de dólares por los daños
ocasionados en Florida52.
48
Hurricane Inikiki Natural Disaster Survey Report. Central Pacific Hurricane
Center - National Weather Service. Consultado el 24 de Mayo de 2009.
49
Lawrence, Miles B. (7 de noviembre de 1997). Hurricane Pauline 5 - 10 October
1997. National Hurricane Center - National Weather Service. Consultado el 24 de Mayo
de 2009.
50
Hurricane Kenna 22 - 26 October 2002. National Hurricane Center - National
Weather Service. Consultado el 24 de Mayo de 2009.
51
Tropical Weather Summary. National Hurricane Centre - National Weather
Service. Consultado el 24 de Mayo de 2009.
52
Knabb, Richard D.; Rhome, Jamie R.; Brown, Daniel P. (20 de diciembre de
2005). Tropical Cyclone Report - Hurricane Katrina 23-30 August 2005 (PDF). National
Hurricane Center - National Weather Service. Consultado el 24 de Mayo de 2009.
114
Capítulo V: Estado del Arte Internacional
5.2 Iniciativas Internacionales: e-infraestructuras
para el desarrollo de la e-ciencia en Clima
5.2.1 Tipos de e-Infraestructura
Dependiendo del tipo de proyecto, las necesidades varían, éstas son:
capacidad de cómputo, almacenamiento y traspaso de información. Así también lo
es el tipo de infraestructura que el proyecto utilizará. A continuación describiremos
de qué forma aportan cada uno de estos elementos a los proyectos:
e-Ciencia
Capacidad de Cómputo
La relevancia en la capacidad de cómputo viene dada, dependiendo del
tiempo necesario para la obtención de los resultados, del tipo de modelo de tiempo
o de clima utilizado.
Ciertos proyectos pueden trabajar con simples computadoras de escritorio
Dual-Core, clusters y otros, con la más alta tecnología de High-performance
computing (HPC, computación de alto rendimiento).
Almacenamiento
Como todo, también, el tipo de almacenamiento depende del proyecto en
cuestión, así dependiendo de la distribución de los recursos (si el proyecto es para
entregar datos a la comunidad) se evalúa si los datos almacenados deben quedar a
disposición del público vía Internet, o si es necesario ir físicamente al lugar donde
éstos se encuentren.
Normalmente, un proyecto de importante tamaño y generador de varias
publicaciones, crea necesidades de almacenamiento del orden de Terabytes
(1 Terabyte = 1024 Gigabytes), agregando que la mayoría de las ocasiones
simplemente no se guardan datos de segundo orden (aún importantes) para no
tener una base de datos muy amplia.
Un ejemplo de esto es el proyecto ACT-1953, que llegó, después de la
eliminación de los datos de 2do orden, a una base de datos de más de 5 Terabytes,
los cuales son compartidos gracias al software OpenDAP54.
53
http://www.dgf.uchile.cl/ACT19
54
http://opendap.org
115
Capítulo V: Estado del Arte Internacional
Redes de alta velocidad para el traspaso de información
Normalmente cada país tiene su propia Red de Alta velocidad, en Chile la
entidad encargada de esto es la Red Universitaria Nacional (REUNA), que puede
entregar hasta 15 Mbps. También existen Redes de Redes, en América Latina
está RedCLARA (Cooperación Latino Americana de Redes Avanzadas; REUNA es
integrante de ésta).
Comunitarias
Computación grid (grid computing)
La computación grid, es una tecnología innovadora que permite utilizar de
forma coordinada todo tipo de recursos (entre ellos cómputo, almacenamiento y
aplicaciones específicas) que no están sujetos a un control centralizado.
Según Ian Foster y Carl Kesselman“un grid computacional es una infraestructura
de hardware y software que provee acceso confiable, constante, omnipresente
y barato a sofisticadas capacidades computacionales” 55; “la computación Grid
consiste en una infraestructura de hardware y software la cual entrega un acceso
confiable y consistente a los recursos computacionales localizados en diferentes
lugares geográficos”56.
En otras palabras, la computación grid es una aplicación que se encarga de
resolver un problema con muchos computadores al mismo tiempo, usualmente de
carácter científicos o técnicos, que requieren un gran número de computadores
procesando una y otra vez, o acceder a una gran cantidad de datos.
La computación grid depende de un software que se encarga de dividir y
repartir la tarea en muchas partes, para enviarlas para su ejecución a la cantidad de
computadores disponibles, muchas veces varios cientos.
Su punto fuerte es que al contar con una gran cantidad de computadores
(los cuales tienen una estructura de nodos controlada y jerarquizada en centros
científicos), la potencia que pudieran llegar a generar es prácticamente ilimitada,
ya que siempre se podrán ir incorporando nuevos equipos a la infraestructura.
Además, ofrece una perfecta integración de sistemas y dispositivos heterogéneos,
por lo que las conexiones entre diferentes máquinas no generarán ningún
problema. Se trata de una solución altamente escalable, potente y flexible, ya que
evita problemas de falta de recursos (cuellos de botella), pues al sumarse nuevos
55
Kesselman e Ian Foster (1998). «The Grid: blueprint for a New Computing
Infrastructure».
56
I. Foster, C. Kesselman, S. Tuecke (2001). “The Anatomy of the Grid: Enabling
Scalable Virtual Organizations”
116
Capítulo V: Estado del Arte Internacional
equipos, aumenta la potencia de la infraestructura sin necesidad de reemplazar
el equipo antiguo por uno nuevo; vale decir, nunca queda obsoleta, debido a la
posibilidad de modificar el número y características de sus componentes.
Estos recursos están distribuidos en la red de forma que cualquier usuario
los pueda ver, claro que siempre se siguen pautas de seguridad y políticas en la
gestión, tanto en el tema técnico como económico. De esta forma, queda como
principal objetivo el compartir una serie de recursos (infraestructura, datos, etc.)
en la red de manera uniforme, segura, transparente, eficiente y fiable, entregando
un único punto de acceso (generalmente un portal web) al conjunto de recursos
distribuidos en distintos puntos geográficos de la administración. Podemos concluir
que la computación grid facilita la creación de empresas virtuales.
Sus principales características:
•Capacidad de balanceo de sistemas: no habría necesidad de calcular la
capacidad de los sistemas en función de los puntos altos de trabajo, ya que la
capacidad se puede reasignar desde la granja de recursos a donde se necesite.
•Alta disponibilidad: con la nueva funcionalidad, si un servidor falla, se
reasignan los servicios en los servidores restantes.
•Reducción de costos: con esta arquitectura los servicios son gestionados
por "clusters de recursos". Ya no es necesario disponer de "grandes servidores"
y podremos hacer uso de componentes de bajo costo. Cada sistema puede
ser configurado siguiendo el mismo patrón.
Sobre Data Grid
Cabe destacar que existen otros sistemas de infraestructuras que se encargan
de desarrollar tareas más específicas, los cuales están dentro de la computación grid.
Bajo este concepto tenemos la grid de datos (data grid), que se dedica a trabajar
exclusivamente el contenido de la gran cantidad de datos que son compartidos y
manejados. A menudo, pero no siempre, éste pasa a ser un sistema que funciona
combinado dentro de otro de computación grid.
¿Cuál es la importancia de un data grid?
Como se ha dicho, muchos científicos y aplicaciones ingenieriles requieren
acceso a grandes cantidades de datos, los cuales se encuentran de forma distribuida,
desde terabytes hasta petabytes. El tamaño y número de esta colección de datos
ha crecido rápidamente en los últimos años, y lo continuará haciendo, debido a
los nuevos experimentos y sensores que funcionan por medio de Internet, a la
disminución del costo de cómputo y almacenamiento de datos, al aumento del
rendimiento, y al desarrollo de nuevas aplicaciones para la e-Ciencia; el resultado,
ya se dijo: cada vez más datos.
117
Capítulo V: Estado del Arte Internacional
Principios del diseño del data grid57
El hecho de que las aplicaciones frecuentemente son operadas desde
áreas lejanas, multi-institucionales, en ambientes heterogéneos en los cuales
normalmente no se pueden asumir los mismos criterios, uniformidad en sus
comportamientos o políticas, condiciona el desarrollo de los siguientes principios:
• Mecanismo de neutralidad: La arquitectura del data grid es diseñada para
ser tan independiente como sea posible de los mecanismos de bajo nivel utilizados
para almacenar, transferir datos, metadatos, etc. Este objetivo es conseguido a
través de la distinción de los accesos a los datos, movimiento de datos por terceras
personas, acceso al catálogo, y otras interfaces que encapsulen peculiaridades de
sistemas de almacenamientos específicos, catálogos, transferencia de algoritmo de
datos, y cosas por el estilo.
• Neutralidad Política: La arquitectura del data grid es estructurada tanto
como sea posible, el diseño de decisiones con implicaciones significativas en
el desempeño son expuestas a los usuarios, en vez de ser encapsuladas en una
implementación de “caja negra”. De este modo, mientras el movimiento de
datos y el catalogado de copias son siempre operaciones básicas, las políticas
de duplicación son implementadas por medio de procedimientos de alto nivel,
los cuales son siempre por defecto, pero pueden ser fácilmente sustituidos con
códigos de aplicaciones específicas.
- Compatibilidad con la infraestructura grid: se intenta superar las
dificultades de un área amplia, multi-institucional, funcionando por la
explotación subyacente de la infraestructura grid, que entrega servicios
básicos tales como autentificación y gestión de recursos e información. Para
el final, se estructuró la arquitectura del data grid, así más herramientas grid
especializadas son compatibles con el bajo nivel de los mecanismos grid.
Esta propuesta también simplifica la implementación de estrategias que
integran, por ejemplo, almacenamiento y cómputo.
- Uniformidad de la infraestructura de información: como en la grid
subyacente, uniformidad y acceso conveniente para información acerca de
estructura de recursos y estado, son destacados como medios que posibilitan
la adaptación a los tiempos de ejecución para condiciones del sistema. En la
práctica, esto significa que se usa el mismo modelo de datos e interface grid
para acceder a los datos, metadatos, copias, y, por ejemplo, catálogos, como
son usados en la infraestructura grid de información subyacente.
57
Ann Chervenak, Ian Foster, Carl Kesselman, Charles Salisbury and Steven
Tuecke (2000). “The Data Grid: Towards an Architecture for the Distributed Management
and Analysis of Large Scientific Data Sets”. Journal of Network and Computer Applications:
Special Issue on Network-Based Storage Services, vol. 23, no. 3, p. 187-200.
118
Capítulo V: Estado del Arte Internacional
Principales desafíos de la computación grid en la investigación del clima58:
•Desarrollar un código computacional capaz de correr eficientemente en la
nueva generación de computadores de alto rendimiento.
•Diseño y desarrollo de la Web basada en interfaces que asistan
eficientemente las simulaciones de tiempo/clima para la mayoría de las
necesidades de la comunidad meteorológica.
•Localización de datos meteorológicos aconsejables.
•El almacenamiento de la enorme cantidad de datos meteorológicos/
climáticos.
•Construir, analizar y visualizar herramientas capaces de trabajar con la gran
asignación de datos -del orden de Terabyte (1024 Gigabyte) hasta Petabyte
(1024 Terabyte)- generados por la simulación de modelos regionales y
globales.
Impactos en el clima59:
•La computación grid es capaz de entregar acceso a recursos
computacionales significativos para investigadores de instituciones que no
tienen suficiente poder computacional en sus proyectos.
•Al adaptar la Web en base a interfaces para los modelos numéricos, se
podría incrementar la productividad porque su uso es sencillo.
•Estas interfaces Web ayudan a la gente que no está familiarizada con
modelos numéricos, a correr sus experimentos de clima y tiempo, para lo
cual están familiarizados, logrando incrementar la productividad.
•Los portales Web podrían desarrollar vínculos entre los investigadores
y las comunidades de modelación operacional, además de fomentar la
colaboración entre las comunidades de modelación de clima y tiempo.
•Se comporta como un recurso para un marco de desarrollo a largo plazo
para aproximaciones sistemáticas de los cambios climáticos, modelos de
evaluación climática y del tiempo, y estudio de impactos.
“Los Grids no son buenos para el análisis de datos, su fuerte es tomar los
datos y correr varios modelos distintos ocupando esos datos. Es por eso que los
Grids son tan populares en servicios financieros, porque no tienen muchos datos,
pero sí varios tipos de escenarios”60.
58
Eugenio S. Almeida. Entrevista.
59
Eugenio S. Almeida. Entrevista.
60
Rob Batchelder, industry analyst and president of Relevance.
119
Capítulo V: Estado del Arte Internacional
Esta última cita hace referencia al buen aporte que pudiera generar una
infraestructura grid en el campo de las investigaciones climáticas, tal como ya lo
está haciendo en el área de las finanzas.
Infraestructura Abierta de Berkeley para la Computación en Red (BOINC, por
sus siglas en inglés)
Es una infraestructura para la computación distribuida, específicamente va
más con el concepto de “volunteer computing”, que es un tipo de computación
distribuida en la cual los dueños de computadores donan sus recursos
computacionales (tales como poder de procesamiento y almacenaje) para uno o
más “proyectos”. Hoy en día este concepto se está utilizando tanto para física, como
para medicina nuclear, climatología y otras actividades de investigación científica.
Sus Objetivos61:
•Reducir las barreras de entrada para los recursos informáticos públicos.
Compartir recursos entre proyectos autónomos.
•Incluir diversas aplicaciones.
•Recompensar a los participantes.
•Proyectos del área Clima-Tiempo que estén utilizando BOINC:
Climatepredicttion.net
El objetivo de este proyecto (basado en la Universidad de Oxford) es cuantificar
y reducir la incertidumbre de largo plazo de la predicción climática basada sobre
simulaciones computacionales.
Climate@home
Ésta es una colaboración entre investigadores de NCAR, MIT, UCAR, Rutgers,
Lawrence Berkeley Lab, y U.C. Berkeley. Sus objetivos científicos son similares a los
de Climateprediction.net, pero utilizan a la Comunidad de Sistemas de Modelación
Climática (CCSM, su sigla en inglés) de NCAR.
El denominador en común que tienen los proyectos que utilizan BOINC es
que necesitan gran capacidad de cálculo, lo cual es la intención de BOINC, obtener
una capacidad de computación enorme utilizando ordenadores personales. Es
así como todos los cálculos complejos son llevados a cabo por ordenadores que
tienen el software de BOINC instalado.
61
David P. Anderson (2004). “BOINC: A System for Public-Resource Computing
and Storage”. 5th IEEE/ACM International Workshop on Grid Computing. Pittsburgh,
USA.
120
Capítulo V: Estado del Arte Internacional
En el caso de la climatología su impacto va en correr distintos modelos
climatológicos que modelen los fenómenos que ocurren en esta área, o bien su
comportamiento individual o su interrelación con otros medios.
5.2.1 Proyectos Internacionales de e-Infraestructuras para
la e-Ciencia en Clima
Actualmente se están realizando iniciativas y proyectos que hacen uso de
las llamadas e-Infraestructuras, aquí se presenta un listado con su descripción y
objetivos.
Esquema de ejemplo:
Nombre del proyecto
Institución Coordinadora, Instituciones y Países Participantes, Abierta o
Cerrada (posibilidad de integrarse)
Descripción
Aplicaciones que soporta o sub-área científica que apoya
Recursos Locales:
• Capacidad de Cómputo, Almacenamiento, Software, Servicios, Redes, etc.
• Capital Humano con dedicación sólo a gestionar los recursos locales, Desarrolladores,
Científicos, Estudiantes.
Recursos Grid:
· Grid Services, Cómputo, Data, Software, Políticas.
· Capital Humano dedicado al Grid, gestionar Recursos Físicos, Servicios, Desarrollar
Aplicaciones, Científicos, Estudiantes
121
Capítulo V: Estado del Arte Internacional
a)
Grids Americanas con aplicaciones climáticas
Nombre del proyecto:
Infraestructura Grid para el Proyecto de Predicción Meteorológica y Alertas
Tempranas de Eventos Extraordinarios (Maracaibo, 10 de Agosto 2007)
Disponible en: http://www.cmc.org.ve/documentos/GridONE2.pdf
Instituciones Participantes:
Observatorio Nacional de Eventos Extraordinarios (ONE2), fundado por el
Centro de Modelado Científico (CMC, http://www.cmc.org.ve) de La Universidad
del Zulia y el Servicio de Meteorología de la Fuerza Armada (Venezuela).
Actualmente, el Centro de Modelado Científico (CMC) de La Universidad
del Zulia y el Servicio Nacional de Meteorología poseen estrechas relaciones de
trabajo con el Centro Internacional para la Investigación del Fenómeno del Niño
(CIIFEN), con el Instituto Internacional de Investigaciones Climáticas y Sociales (IRI)
y con la Universidad de Guayaquil. Es el parecer de quien escribe que no habría
inconveniente en generalizar los acuerdos preexistentes para incluir a todos los
nodos e instituciones que deseen colaborar con investigaciones como las aquí
planteadas 62.
Descripción:
Proyecto de estructuración y dotación de los nodos Grid involucrado en el
Observatorio Nacional de Eventos Extraordinarios (ONE2), cuyo objetivo principal
es el de generar pronósticos fidedignos y alertas tempranas para todo el territorio
venezolano, empleando redes avanzadas de tecnologías de información y
redes de conocimiento. La dotación consiste de 3 subsistemas intrínsecamente
relacionados: cómputo, almacenamiento y visualización científica, todos sobre
la correspondiente plataforma para garantizar la ubicuidad necesaria para un
proyecto del alcance y envergadura previstos. El middleware necesario y las
aplicaciones de cómputo y visualización se consideran aquí de código abierto
(particularmente gLite, MM5, WRF, MER-NCEP, PRECIS, etc.). Este proyecto sentará
las bases -en términos de infraestructura, recursos humanos, experiencia, etc.de la componente venezolana de lo que podría llamarse el OLE2, Observatorio
Latinoamericano de Eventos Extraordinarios. El cronograma establecido se plantea
en tres fases, con una duración total de 12 meses.
Aplicaciones que soporta o sub-área científica que apoya
Defensa nacional, modelamiento científico.
62
122
http://www.cmc.org.ve/documentos/GridONE2.pdf
Capítulo V: Estado del Arte Internacional
Recursos Locales:
Para llevar a cabo lo presentado en las páginas anteriores será necesario, en
todos los casos, una conexión que permita la transferencia de datos, intercambio
de resultados e interacción entre nodos (videoconferencias, por ejemplo, para
discusión de aspectos relacionados con el proyecto) en tiempo real63.
Se entiende que tal requerimiento está cubierto de entrada por el marco
preexistente de la Red Académica de Centros de Investigación y Universidades
Nacionales (REACCIUN2, http://www.reacciun2.edu.ve) 64”.
RR.HH. en lo local
Tres personas. Un científico (Profesor Ángel Muñoz) y dos estudiantes
avanzados.
Recursos grid:
Un nodo maestro para la grid (el UI, que en este caso corresponde a un PC),
al que se le instalará el middleware necesario (gLite, Globus Toolkit, Condor, etc)
y estará conectado directamente con REACCIUN2. Éste es el elemento frontal
(frontend) de cada nodo de REACCIUN2, que se encarga de la distribución de
las faenas en los nodos locales de trabajo (worker nodes) y de almacenamiento
(storage nodes), pero también de interactuar con los demás nodos de las otras
instituciones participantes en el proyecto.
Un nodo de trabajo maestro (master worker node), en este caso un X4100
M2 de 4Gb, que tendrá a su cargo un determinado número de nodos secundarios
(esencialmente X2100 M2 con 2 Gb) para llevar a cabo el cómputo necesario.
Un subsistema de almacenamiento (storage nodes), controlado en la presente
propuesta por un servidor Sun Fire X4500, que funge como SRM.
RR.HH. en la grid
Las mismas tres personas se encargan tanto de los recursos locales como de
la grid. Existe una falta de computistas en este apartado, por lo cual los talleres
destinados a grid siguen siendo necesarios para la capacitación de funcionarios en
las distintas instituciones donde se instala este sistema.
Nombre del proyecto
Earth System Grid (http://www.earthsystemgrid.org)
63
http://www.cmc.org.ve/documentos/GridONE2.pdf
64
http://www.cmc.org.ve/documentos/GridONE2.pdf
123
Capítulo V: Estado del Arte Internacional
Instituciones participantes:
Earth System Grid fue fundado por el Departamento de Energía de
Estados Unidos, hoy tiene un número importante de colaboradores, entre los
que destacamos: Argonne National Laboratory (1), Lawrence Berkeley National
Laboratory, Lawrence Livermore National Laboratory (2), Los Alamos National
Laboratory, National Center for Atmospheric Research (3), y Oak Ridge National
Laboratory, University of Southern California/Information Sciences Institute.
El proyecto ESG también está en cercana colaboración con otras instituciones,
“donde sea necesario, desarrollamos herramientas ESG y servicios en colaboración
con grupos nacionales e internacionales”.
Sus principales investigadores son:
Ian T. Foster (1)
Dean N. Williams (2)
Don E. Middleton, (3)
Descripción:
Earth System Grid (ESG) es uno de los proyectos más grandes en el manejo de
modelos y datos atmosféricos en un ambiente grid. En su resumen señala la importancia
de la salida de datos de los distintos modelos climáticos y cómo éstos, para ser útiles,
deben ser accesibles para los investigadores de los impactos del cambio climático, ya
sean de laboratorios nacionales y universidades, u otro tipo de institución.
En una de sus múltiples publicaciones se destaca que: “Los modelos
climáticos globales son usados para simular el pasado, presente, y futuro
climático, y experimentos son ejecutados continuamente sobre variedad de
supercomputadoras distribuidas. El archivo de datos resultante, se esparce en
muchos sitios, que actualmente contienen arriba de 100 Terabytes (1 TB = 1024
Gygabytes) de datos de simulación y sigue creciendo rápidamente”. Cita resumen
Supporting the Next Generation of Climate Modeling Research.
Para entregar estos datos, ESG propone crear un sistema colaborativo
virtual, que enlace centros, usuarios y datos de forma distribuida. ESG proveerá a
los científicos con un acercamiento virtual a datos distribuidos y recursos que se
requieran para el desarrollo de la investigación. El punto de vista de ESG es que
con la creación de este sistema/ambiente incrementará la productividad de los
investigadores gracias a que compartiría este conjunto de datos climáticos dentro
de una comunidad de recursos.
Este proyecto ha logrado un número importante de publicaciones, entre las
que destacamos:
124
Capítulo V: Estado del Arte Internacional
- High-Performance Remote Access to Climate Simulation Data: A Challenge
Problem for Data Grid Technologies (2001)65
- Turning Climate Datasets into Community Resources (2002)66
- Supporting the Next Generation of Climate Modeling Research (2005)67
- Enabling worldwide access to climate simulation data (2006)68
- Data management and analysis for the Earth System Grid (2008)
- The Earth System Grid: Enabling Access to Multi-Model Climate Simulation
Data (2009)
Aplicaciones que soporta o sub-área científica que apoya69:
Dentro de sus servicios y aplicaciones soportadas están:
El Manejo de Recursos Almacenados (SRM, por sus siglas en ingles), por medio
de un middleware (software de computador que conecta aplicaciones) es usado
para recuperar archivos de profundidad y transferirlos (via GridFTP) hacia el portal
de datos NCAR, donde quedan disponibles para las peticiones HTTP.
El Servicio de Localización de Replicas (RLS), es un sistema de actualización
de las bases de datos que tiene un seguimiento de las copias de los ficheros
almacenados en cualquier punto de la grid. El RLS es usado cuando los datos son
editados por el sistema.
El servidor OpenDaPg es usado cuando se solicitan un subconjunto del
conjunto de datos virtuales. Los datos son extraídos desde múltiples ficheros,
almacenados dentro de un único archivo, y dejados a disposición para peticiones
HTTP.
Arquitectura de ESG:
A continuación, presentamos una descripción general de la arquitectura ESG,
mostrando la mayoría de los componentes involucrados en el sistema ESG, el cual
es, desde abajo hacia arriba, el siguiente (Fotografía 1):
• Base de datos, almacenamiento, y servidor de aplicaciones: Estos son los
recursos básicos sobre los cuales ESG está construido e incluye recursos
65
http://datagrid.ucar.edu/esg/about/docs/ewa.esg_sc01_chervenak_final.pdf
66
http://datagrid.ucar.edu/esg/about/docs/ESGAMS_final.pdf
67
http://arxiv.org/pdf/0712.2262
68
http://www.iop.org/EJ/article/1742-6596/46/1/070/jpconf6_46_070.
pdf?request-id=eb75c3ad-2c5e-4e0f-a54a-f601d1ba4716
69
“Acceso y Gestión del conjunto de datos de los modelos climáticos, entregando
también servicios de colaboración”.- Paper Supporting the Next Generation of Climate
Modeling Research
125
Capítulo V: Estado del Arte Internacional
computacionales para la creación de datos virtuales, caché de discos y
sistemas de memoria de gran capacidad, usados para mantener el recurso de
datos, servidores de base de datos, empleados para almacenar metadatos, y
servidores de aplicación, para mantener los servicios del portal ESG.
• Globus/Grid infrastructure: Éste provee la componente remota: acceso
autentificado para compartir recursos ESG, habilitando acceso para
credenciales, datos, y metadatos, localización de servicios replicados (RLSs),
y la propuesta y manejo de trabajos computacionales.
• Nivel alto y servicios específicos de ESG: Estos servicios abarcan los
recursos ESG y proveen habilidades tales como movimiento de datos de
sitio a sitio, acceso a metadatos distribuidos y de confianza, y agrupación y
filtro de datos.
• Aplicaciones ESG: Lo más importante de éstos es el portal ESG, el cual
provee una conveniente interface vía navegador para los servicios ESG.
Otras aplicaciones incluyen herramientas de nivel usuario para publicación
de datos, como también clientes para análisis y visualización de datos.
Figura 6. Esquema de la arquitectura de ESG mostrando la mayoría de los
CLIENT APPLICATIONS
PUBLISHING
APPLICATION
ANALISIS CLIENTS
(CDAT NCL)
WEB PORTAL
search browse download aggregate subset
HIGHER LEVEL/ESG SPECIFIC SE RVICES
OPeNDAP-g
SRM &
DATA MOVER
CATALOG
SERVICES
(THREDDS)
DESCRIPTION
& ACCESS
METADATA
DATA
AGGREGATION
& SUBSETTING
GLOBUS/GRID INFRASTRUCTURE
GSI
GridFTP
GRAM
MYRPOXY
RLS
OGSA-DAI
DATABASE AND APPLICATION SEVERS
REMOTE
STORAGE
ONLINE
STORAGE
CPU
DB
componentes 70
70
Publicación “The Earth System Grid: Supporting the Next Generation of Climate
Modeling Research”
126
Capítulo V: Estado del Arte Internacional
Nombre del proyecto:
Open Science Grid (http://www.opensciencegrid.org)
Instituciones Participantes
National Science Foundation y el Department of Energy>s Office of Science
de EE.UU.
Consorcio de miembros y asociados71
Según Open Science Grid (OSG), el número de socios siempre está cambiando
y creciendo, todos los miembros contribuyen con esfuerzo y recursos para obtener
una infraestructura común. Dentro de este consorcio de miembros se puede
encontrar una amplia cantidad de centros de investigación y universidades de
EE.UU.
También se señala que OSG tiene un grupo de “asociados” con los cuales
trabaja activamente. Dentro de éste, se encuentran organizaciones grid y red, de
carácter internacional, nacional, regional y de grids universitarias.
Los principales asociados son:
APAC National Grid
Data Intensive Science University Network (DISUN)
Enabling Grids for E-SciencE (EGEE)
Grid Laboratory of Wisconsin (GLOW)
Grid Operations Center at Indiana University
New York State Grid
Nordic Data Grid Facility (NorduGrid)
Northwest Indiana Computational Grid (NWICG)
Oxford e-Research Centre (OxGrid)
São Paulo Regional Analysis Center (SPRACE)
TeraGrid
Texas Internet Grid for Research and Education (TIGRE)
TWGrid (from Academica Sinica Grid Computing)
Worldwide LHC Computing Grid Collaboration (WLCG)
Descripción
La principal misión de este proyecto apunta a promover el descubrimiento
y colaboración en las investigaciones que tengan una alta demanda de datos,
entregando las facilidades computacionales y los servicios para que se integren
de forma distribuida y fiable, y se compartan recursos para apoyar al cómputo en
todas las escalas.
71
http://www.opensciencegrid.org/About/Learn_About_Us/OSG_Organization/
Members_and_Partners
127
Capítulo V: Estado del Arte Internacional
Dentro de los alcances destacados de este proyecto encontramos 72:
• Un compromiso de ayuda a las comunidades que no estén familiarizadas
con la computación grid, para modificar sus aplicaciones de tal forma que puedan
implementarlas en los recursos de OSG.
• Actividades para las comunidades de grid, las cuales buscan asistir a las
universidades y a otros campos de enseñanza o investigación para planear una
infraestructura local compartida que satisfaga las necesidades de sus investigadores
y departamentos.
• Actividades educacionales, organizadas e implementadas en escuelas de
grid nacionales e internacionales, entregando material para cursos en línea.
• La amplia cantidad de software de OSG están disponibles para ser
descargados y usados sin restricciones por los investigadores y proyectos que no
sean parte de OSG.
• Una actividad interoperable ha trabajado con muchos grupos grid para
utilizar servicios comunes que permitan la compatibilidad entre la OSG y las otras
grid.
• El OSG colabora con otros proyectos por medio de sus socios, destacamos a
los investigadores desde la Universidad de Buenos Aires quienes están reutilizando
material de la escuela de grid de OSG para actividades de entrenamiento local.
Grid y Aplicaciones que soporta
Dentro de las investigaciones destacadas se señalan el incremento de la
precisión con el uso de múltiples modelos en el área del clima, los cuales pueden
ser utilizados gracias al poder que entrega la infraestructura de OSG., en esta
investigación participa Brian Etherton juntos a sus colegas, quienes pertenecen
al Departamento de Meteorología de la University of North Carolina (UNC)
Charlotte.
El articulo nos señala que73:
“El equipo de Etherton analiza individualmente las pasadas del modelo
Weather Research and Forecasting (WRF) y los ‘pronósticos de conjunto’ (ensembles)
de las múltiples pasadas, comparando lo generado con los resultados observados
de la vida real y, así, variando los parámetros de valores para cada pasada. La
precisión de los resultados producidos por los ensembles son comprobados de
manera insuperable, si solamente se los compara con los modelos individuales”.
72
http://www.opensciencegrid.org/About/Learn_About_Us/Outreach
73
Stormy weather: grid computing powers fine-scale climate modeling, publicado
en http://www.opensciencegrid.org/About/What_We%27re_Doing/Research_Highlights/
Stormy_Weather
128
Capítulo V: Estado del Arte Internacional
La forma que se están llevando a cabo:
“Los ‘ensembles’ se aplican hasta ahora, consistiendo en 16 pronósticos por
día, diferenciados por la hora de comienzo y una variedad de parámetros físicos
tales como los cambios aire/superficie de calor y humedad”.
Todo esto ayuda a que las probabilidades de determinar un pronóstico
usando los 16 ensembles sean bastante más precisas que los de aquellos basados
en un único modelo.
“El modelo WRF facilita los pronósticos en tiempo real de precipitaciones,
temperatura de la superficie, velocidad del viento, señales de huracanes, potenciales
tormentas, humedad y más. Todo esto combinado con el pronóstico de conjunto
(ensambles) de estos modelos, puede producir incluso mayor precisión en los
resultados”.
Figura 7. El modelo de investigación y pronostico del tiempo (WRF)74
74
Imagen obtenida de http://wrf-model.org/plots/realtime_hurricane4km.php
129
Capítulo V: Estado del Arte Internacional
Nombre del proyecto
Portal de Ambientes Enlazados para los Descubrimientos Atmosféricos
(Linked Enviroments for Atmospheric Discovery, “LEAD” Portal, https://portal.
leadproject.org)
Instituciones participantes
Este proyecto se encuentra patrocinado por la National Science Foundation
de los EE.UU.
Dentro de las instituciones destacadas que participan en él están:
Colorado State University, Howard University, Indiana University, Millersville
University, University of Alabama in Huntsville, University Corporation for
Atmospheric Research (UCAR), University of Illinois at Urbana-Champaign,
University of Oklahoma y University of North Carolina - Chapel Hill.
Descripción
“LEAD logra que los datos meteorológicos, modelos de pronósticos, y las
herramientas de análisis y visualizaciones estén disponibles para cualquiera que
quiera interactivamente explorar tanto el tiempo como su evolución. El Portal
LEAD brinda todos los recursos necesarios, en un conveniente punto de acceso,
mantenido por un sistema de computación de alto rendimiento (HPC, su sigla
en inglés). Con LEAD, meteorólogos, investigadores, profesores, y estudiantes
ya no son más espectadores pasivos o que estén limitados por datos estáticos o
imágenes pre-generadas, en vez de eso, ellos son participantes activos que pueden
adquirir y procesar sus propios datos. El software de LEAD realza los procesos de
experimentación automatizando muchas de las tareas asociadas con la ciencia
meteorológica, que son complicadas y consumen tiempo. La herramienta de flujo
de trabajo conecta las aplicaciones de gestión de datos, asimilación, pronóstico
y verificación, dentro de un único experimento. Los resultados del experimento
también incluyen descripciones detalladas del producto, también llamadas
‘metadatos’”75.
“LEAD es un esfuerzo multidisciplinario que involucra a nueve instituciones
y más de 100 científicos, estudiantes y personal técnico. LEAD se dirige al desafío
fundamental de las investigaciones en tecnologías de información (IT, su sigla en
inglés) y al desarrollo necesario para crear un marco de trabajo integrado y escalable,
para identificar, acceder, preparar, asimilar, predecir, manejar, analizar, realizar
minería de datos, y visualizar una colección amplia de datos meteorológicos y de
los resultados de los modelos independientes del formato y la localización física. En
75
130
https://portal.leadproject.org/gridsphere/gridsphere?cid=intro
Capítulo V: Estado del Arte Internacional
términos prácticos, este proyecto tendrá un impacto de manera espectacular en la
capacidad de proveer alertas oportunas de muchos eventos del tiempo, por medio
del desarrollo de computación dinámica y la infraestructura de redes de trabajo
requeridas para la detección a petición, simulación y predicción de un fenómeno
de alto impacto en el tiempo local tal como una tormenta eléctrica”76.
Recursos Grid:
“Localizados en seis de las nueve instituciones participantes (Alabama,
Illinois, Indiana, North Carolina, Oklahoma, and Unidata), LEAD Grid es un conjunto
de sistemas de computación distribuida que representa una ‘habitación limpia’ en
un ambiente grid, o una red de trabajo controlada que está libre de ‘contaminación’
externa. La grid es operada por LEAD, para asegurar una estricta compatibilidad
de software y servidores, como un banco de pruebas para desarrollar, integrar, y
testear todos los componentes de LEAD. Una función principal de LEAD Grid es
recibir el conjunto de datos de relevancia para la meteorología de mesoescala”77.
Nombre del proyecto:
E-science grid facility for Europe and Latin America (http://www.eu-eela.eu)
Descripción:
EELA-2 apunta a construir una instalación de grid escalable de alta capacidad
y con producción de calidad, entregando acceso a través de la red a computación
distribuida, almacenamiento y recursos de la red necesarios para el amplio espectro
de aplicaciones de las colaboraciones Europeas-Latino Americanas, con principal
atención en:
Ofrecer un completo set de servicios versátiles, satisfaciendo los
requerimientos de las aplicaciones.
Asegurar la sustentabilidad a largo plazo de la e-Infraestructura más allá del
término del proyecto.
Aplicaciones que soporta:
EELA-2 soporta una amplia variedad de aplicaciones en el área de la
investigación, lamentablemente en lo que respecta a investigación climática
existen sólo dos aplicaciones actualmente en funcionamiento, éstas son:
76
https://portal.leadproject.org/gridsphere/gridsphere?cid=purpose
77
https://portal.leadproject.org/gridsphere/gridsphere?cid=lead-grid
131
Capítulo V: Estado del Arte Internacional
Global and Regional Climate Simulation78, sus creadores pertenecen a la
Universidad de Cantabria, el Servicio Nacional de Meteorología e Hidrológica del
Perú y la Universidad de Chile.
Nombre Paper: (Climate modelling on the GRID: Experiences in the EU-project
EELA)
Disponible en http://www.grid.phys.uvic.ca
Descripción:
Este trabajo es una aplicación grid que consiste en una secuencia de dos
modelos climáticos de punta (uno global y otro regional), operable por medio
de un portal Web. El objetivo principal de la aplicación es proveer un conjunto de
pronósticos basados en predicciones regionales.
Este trabajo es aplicable para estudiar el fenómeno de El Niño, ya que simula
un año de El Niño con diferentes condiciones forzadas, y analiza la respuesta en
precipitaciones sobre los países de Sudamérica sujetos al riesgo de inundaciones.
Brazilian Regional Atmospheric Modeling System79, sus creadores pertenecen
a la Universidad Federal de Campina Grande, Brasil.
Descripción:
BRAMS es un modelo desarrollado por INPE, llevado a la grid por SegHidro80,
proyecto que fue creado para ayudar en la toma de decisiones para un mejor
manejo de los recursos hídricos, pieza de suma importancia en el proyecto dado
que en SegHidro los investigadores están geográficamente distribuidos y a veces
tienen diferentes horarios para complementar sus experiencias. Esta aplicación
es particularmente útil en el Noreste de Brasil, una región semi-árida, donde las
irregulares lluvias causan muchos problemas a la población.
Nombre del proyecto
Climatology studies using BRAMS in a GRID computing enviroment
Sitio Web: http://www.cptec.inpe.br/brams/gbrams.shtml
78
CAM-WRF, http://applications.eu-eela.eu/application_details.php?ID=5
79
BRAMS,http://applications.eu-eela.eu/application_details.php?ID=19
80
http://seghidro.lsd.ufcg.edu.br
132
Capítulo V: Estado del Arte Internacional
Instituciones participantes
BRAMS (Brazilian Regional Atmospheric Modeling System), la organización
coordinadora, es producto de la unión de proyectos de ATMET81; IME/USP82; IAG/
USP83 y CPTEC/INPE84, fundado por FINEP85, Brazilian Funding Agency. Su principal
objetivo es producir una nueva versión de modelo RAMS86.
Descripción
CPTEC/INPE está entregando datos de modelos globales para unos diez años
de climatología. La climatología regional, por lo tanto, puede obtener un promedio
usando un conjunto de pronósticos (ensemble). Llevando BRAMS a la grid, esperan
lograr diez años de datos climatológicos para las tres diferentes áreas en que han
divido a Brasil (N, NE, SE).
Recursos locales (requerimientos de almacenamiento y procesamiento):
- Para lograr diez años de integraciones en tres áreas distintas, es necesario
una cantidad total de datos en condiciones límites, cercano a 58 Gb.
- Cluster con procesador 16 Xeon 3 Ghz.
Grid computing:
- Además de la máquina descrita arriba, la grid también cuenta con dos
GRAY/XD1 cluster con doce procesadores dual-core (Optaron 2.6 GHz).
- Como middlewares, tres soluciones fueron estudiadas y elegidas,
dependiendo de su usabilidad, para ejecutar simulaciones meteorológicas
de meso-escala: Globus, OurGrid y OAR/CIGRI. Cada uno de los grupos
de investigación involucrados en este trabajo (LAC/INPE, CPTEC/INPE y II/
UFRGS) brindó un cluster para probar un middleware específico en la grid.
Arquitectura de la grid:
La interacción entre los meteorólogos y la grid es lograda a través de un
portal web, cuyo objetivo es permitir la creación de trabajos y la recuperación de
resultados.
81
http://www.atmet.com
82
http://www.ime.usp.br/
83
http://www.iag.usp.br/
84
http://www7.cptec.inpe.br
85
http://www.finep.gov.br
86
http://www.atmet.com
133
Capítulo V: Estado del Arte Internacional
b)
Grids Europeos con aplicaciones climáticas
Nombre del proyecto
Enabling Grids for E-science (EGEE)
Sitio web: http://www.eu-egee.org
Instituciones Participantes
The European Organization for Nuclear Research
La Comisión Europea de Investigación
Los proyectos destacados que se encuentran en colaboración directa con
EGEE son:
- BalticGrid-II
- Belief-II
- D4Science
- DORII
- EDGeS
- Edutain@Grid
- EGI DS
- ETICS 2
- EUAsiaGrid
- GENESI-DR
- GridTalk
- Health-e-Child
- KnowARC
- OGF-Europe
- OMII-UK
- SEE-GRID-SCI
- UK National Grid Service
Descripción87
EGEE es un proyecto donde cualquier organización virtual puede ser usuario
final o proveedor de infraestructura, aceptando los certificados correspondientes.
87
134
http://project.eu-egee.org/index.php?id=104
Capítulo V: Estado del Arte Internacional
Junto a expertos de más de 50 países, EGEE comparte el objetivo común de
construir avances sobre la más reciente tecnología en grid y desarrollar un servicio
de infraestructura grid, disponible para los científicos la 24 horas del día.
El proyecto entrega, a los investigadores en las academias y negocios, acceso
para el nivel producción en la infraestructura grid, independiente de su localización
geográfica. EGEE también se enfoca en atraer un amplio rango de nuevos usuarios
a la grid.
El enfoque principal del proyecto es:
- Expandir y optimizar la vasta infraestructura grid de Europa, concretamente
la de EGEE, por medio de operaciones continuas en la infraestructura, apoyada
por comunidades de usuarios, y sumando más recursos computacionales y
de datos.
- Preparar la migración de la ya existente Grid Europea desde un modelo
basado en proyectos hacia una infraestructura sustentable federada, basada
en iniciativas de Grid Nacionales para usos multidisciplinarios.
Aplicaciones climáticas88
Las aplicaciones de las Ciencia de la Tierra (ES, por si siglas en inglés), están
diseminadas en varias organizaciones virtuales. Algunas de las principales son:
• Earth Science Research (ESR).
• South Eastern Europe GRID (SEEGrid)
• Cyber infraestructure for Civil protection – Operative Procedures
(Cyclops).
• Expanding Geosciences On Demand (EGEODE).
Aquí se pueden encontrar muchas aplicaciones que están basadas tanto en
la modelación atmosférica como en el transporte de contaminantes en el aire, de
largo alcance sobre Europa, El fenómeno del Niño, pronósticos meteorológicos, y
el ozono en regiones polares.
Recursos Grid89
La infraestructura grid de EGEE consiste en un conjunto de servicios
middlewares90 desarrollados, a través de todo el mundo, en una colección de
88
http://technical.eu-egee.org/index.php?id=255
89
http://technical.eu-egee.org/index.php?id=134
90
El Middleware es un software de conectividad que ofrece un conjunto de
135
Capítulo V: Estado del Arte Internacional
recursos computacionales y de almacenamiento, además de las estructuras de
servicios y de soporte, se dispone tener:
- Las infraestructuras de Servicios al Desarrollo91, es una gran infraestructura
Grid para múltiples actividades en la ciencia, federando cerca de 250 centros
de recursos a lo largo del mundo, entregando aproximadamente unos 40.000
CPUs y muchos Petabytes de almacenamiento. Esta infraestructura es usada
de forma diaria por muchos miles de científicos federados en más de 200
Organizaciones Virtuales. Esta es una estructura estable y bien apoyada,
utiliza las últimas versiones del middleware gLite.
- Los Servicios previos al Desarrollo92, entregan a los usuarios acceso a
un servicio grid previo, a fin de testear, evaluar y entregar retroalimentación
para cambios y nuevas características para el middleware. Además, previo
al desarrollo, extiende una certificación de actividades en el middleware,
ayudando a evaluar la puesta en marcha de los procedimientos, la
(inter)operabilidad y la funcionalidad básica del software, contra escenarios
operacionales que reflejen condiciones reales de trabajo.
- El Centro de Redes Operacionales de EGEE93, es el que se encarga de la
coordinación operacional entre EGEE y los proveedores de la red (GEANT2/
NRENs).
Esto es complementado por la capacitación de infraestructura y la certificación
de la plataforma para la experimentación, además del necesario apoyo de
estructuras y grupos políticos.
Nombre del proyecto
Ground European Network for Earth Science Interoperations - Digital
Repositories (GENESI-DR)
http://www.genesi-dr.eu/
Instituciones Participantes
La Comisión Europea (EC) y la Agencia Europea del Espacio (ESA, su sigla en
inglés).
servicios que hacen posible el funcionamiento de aplicaciones distribuidas sobre
plataformas heterogéneas.
91
Traducción para Production Service infrastructure.
92
Traducción para Pre-Production Service (PPS).
93
The EGEE Network Operations Centre (ENOC)
136
Capítulo V: Estado del Arte Internacional
Colaboran con proyectos como:
- European Commission Joint Research Centre (JRC)
- Centre National d>Etudes Spatiales (CNES), Francia
- The University of Reading (RUR)
- Entre otros.
Descripción94
GENESI-DR, tiene como desafío establecer un acceso abierto a un Repositorio
digital de las Ciencias de la Tierra para Europa y para los usuarios de la ciencia en
el mundo entero.
GENESI-DR debería operar, validar y optimizar el acceso integrado, y poner
a disposición de los usuarios repositorios de datos digitales para demostrar cómo
Europa puede responder de la mejor forma a las necesidades relacionadas a la
emergencia climática que se vive a nivel mundial, la cual es una demanda que está
muy lejos de ser satisfecha.
GENESI-DR ha identificado los siguientes objetivos:
- Entregar acceso garantizado, responsable, fácil, efectivo, y operacional a
una variedad de recursos de datos, y demostrar cómo el mismo desempeño
puede ser extendido para proveer acceso a todo tipo de datos en las Ciencias
de la Tierra.
- Armonizar las operaciones de datos claves de las Ciencias de la Tierra,
limitando y fragmentado la solución.
- Demostrar curaciones efectivas y preparar el marco para acercarse a la
preservación de los datos de las Ciencias de la Tierra en el largo plazo.
- Validar de manera efectiva las aptitudes requeridas para el acceso a
los repositorios distribuidos para las nuevas comunidades, incluyendo
educación, y calcular los beneficios e impactos.
- Integrar nuevos científicos y paradigmas tecnológicos derivados en
infraestructuras operacionales, en respuesta a los últimos requerimientos
de las Ciencias de la Tierra (CT).
GENESI-DR se construye sobre la actual y operativa infraestructura Europea,
Observatorio de la Tierra (EO, su sigla en inglés), e involucra centros claves de la CT
responsables de la adquisición operacional de datos, de su procesamiento, archivo
y distribución.
94
http://www.genesi-dr.eu/
137
Capítulo V: Estado del Arte Internacional
Aplicaciones climáticas95
Algunas de las aplicaciones climáticas que podemos encontrar en este
proyecto son:
-
-
-
-
La cubierta de hielo Ártico más baja de la historia.96
Aspereza y humedad de la Tierra capturado por TerraSAR97.
Arena y polvo desde el Desierto de Sahara98.
El esplendor sobre las nubes del Océano Pacífico99
Nombre del proyecto
EUROGRID
http://www.eurogrid.org
Instituciones participantes
Es un proyecto donde los costos fueron distribuidos entre el proyecto de
Investigación y Desarrollo Tecnológico (RTD, su sigla en inglés) y la Comisión
Europea. Es parte del Programa de Sociedad de Información Tecnológica (IST, su
sigla en inglés).
Dentro de los proyectos participantes se encuentran:
- Forschungszentrum Jülich, D
- Pallas GmbH, D (Proyecto Coordinador)
- Parallab - University of Bergen, N
- CNRS - IDRIS, F
- Warsaw University - ICM, PL
- Victoria University of Manchester, UK
- Deutscher Wetterdienst, D
- GIE EADS CCR, F
- CSCS (ETH Zürich), CH
95
http://genesi-dr.terradue.com/news/_images.asp
96
Lowest Arctic ice coverage in history, http://genesi-dr.terradue.com/news/_
images.asp?id=18
97
Earth roughness and humidity captured by TerraSAR,
http://genesi-dr.terradue.com/news/_images.asp?id=22
98
Sand and dust from the Sahara Desert, http://genesi-dr.terradue.com/news/_
images.asp?id=16
99
Glory Over Pacific Ocean Clouds, http://genesi-dr.terradue.com/news/_images.
asp?id=15
138
Capítulo V: Estado del Arte Internacional
Descripción
El período en que se llevó a cabo el proyecto, fue entre noviembre de 2000
y enero de 2004. EUROGRID demostró que el uso de grids en las comunidades
científicas e industriales seleccionadas, apuntó a los requerimientos de dichas
comunidades, y destacó los beneficios del uso de grids.
Los objetivos del EUROGRID fueron:
- Establecer una red de trabajo grid Europea, liderada por centros de
Computación de alto rendimiento (HPC, su sigla en inglés), desde diferentes
países de Europa.
- Operar y apoyar el software de la infraestructura EUROGRID, el que usó la
red de Internet existente y ofreció fluidez y acceso seguro para los usuarios
del proyecto.
- Desarrollar componentes importantes del software Grid e integrarlos
dentro de EUROGRID (transferencia rápida de archivos, agente de recursos,
interfaz para un par de aplicaciones y acceso interactivo).
- Demostrar códigos de simulación distribuida en diferentes áreas de
aplicación (simulaciones biomoleculares, predicción del tiempo, análisis
estructural, procesamiento de datos en tiempo real).
- Contribuir al desarrollo internacional de la grid y ayudar a las
comunicaciones con los proyectos grid líderes a nivel internacional.
- Producir los componentes de software EUROGRID. Una vez que el
proyecto terminase el software de EUROGRID debía estar disponible como
un producto de apoyo.
Todos estos objetivos fueron logrados durante el proyecto. Los componentes
del software EUROGRID son aprovechados por las comunidades de la computación
grid, y por portales específicos de dominio en las áreas científicas de biología,
química y meteorología y por computadores agregados a la ingeniería.
Aplicaciones que soporta100
La interfaz gráfica que soporta el proyecto permite un control sencillo para
echar a andar el modelo LM, en lo que se refiere al dominio del modelo (cualquier
parte del globo), tamaño de la malla (usualmente entre 25 a 2 km.), alcance del
pronóstico (arriba de 48 horas), datos iniciales y tiempo, y, como salida, los archivos
con sus resultados.
100
http://www.eurogrid.org/wp2.html
139
Capítulo V: Estado del Arte Internacional
La implementación del modelo de predicción del tiempo fue acompañado
por una cuidadosa evaluación de la validez meteorológica del modelo LM en
cualquier región del globo, para un rango de tamaño de malla de entre 25 a 2 km.
El procedimiento estándar de verificación de los resultados del modelo consiste de
una comparación del pronóstico de LM con todas las observaciones disponibles en
las regiones. Para este propósito, DWD desarrolló una estación de trabajo basada en
aplicaciones meteorológicas interactivas y sistemas de presentación (MAP, su sigla
en inglés), los cuales permiten lograr un vistazo general para cualquier región sobre
el globo donde estén disponibles observaciones (incluyendo imágenes de satélites)
y se encuentre en el campo de pronóstico del LM. MAP requiere una estación de
trabajo de tamaño medio para almacenar la gran cantidad de pronósticos y datos
de la observación, como también un rápido despliegue de estos datos.
El modelo de predicción del tiempo, LM, y su predecesor, GME2LM, fueron
instalados en el centro de HPC de CNRS-IDRIS, Universidad de Manchester, y también
en el Centro de Investigación Juelich, como en el sistema de HPC del DWD. El LM
es codificado en Fortran90 estándar y usa MPI para entregar los mensajes. Esto,
en principio, es código sumamente portable. Pero, usualmente hay un número de
instalaciones de parámetros dependientes, como el compilado de opciones o las
versiones de librería, que tienen que ser adaptadas para optimizar el rendimiento
bajo condiciones de tiempo real para el sistema HPC. Para la aplicación en tiempo
real del LM, algunos mecanismos son entregados por HPC y EUROGRID para
garantizar la su ejecución en la alta prioridad operacional. Esto fue demostrado en
un ambiente multi-usuario.
La funcionalidad de la interfaz LM, por la definición y lanzamiento del
pronóstico LM, fue evaluado por testeadores quienes no tenían experiencia en
HPC. Su práctica y sugerencias son la base para más desarrollos de la interfaz LM.
Una típica predicción de 48 horas del LM se ejecuta, para cualquier región del
globo, tomando no más que dos horas, incluyendo la preparación de los archivos
de datos topográficos. Durante todo el proceso del modelo, éste mantiene, a quien
lo lleva a cabo, informado acerca del estado actual de la ejecución LM y del tiempo
esperado para finalizar la tarea.
140
Capítulo V: Estado del Arte Internacional
Nombre del proyecto
The DataGrid Project
http://eu-datagrid.web.cern.ch
Instituciones Participantes
Proyecto fundado por la Unión Europea
Participan:
- European Organization for Nuclear Research (CERN).
- Centre National de la Recherche Scientifique (CNRS).
- European Space Agency (ESA).
- The Nacional Institute of Nuclear Physics (INFN, por su nombre en italiano,
Istituto Nazionale di Fisica Nucleare).
- Nacional Institute for Subatomic Physics.
- Science & Technology Facilities Council.
Descripción
El objetivo de este proyecto es construir la nueva generación de infraestructura
computacional, entregando cálculos intensivos y análisis de base de datos
compartidos a gran escala, desde cientos de Terabytes a Petabytes, a través de
muchas comunidades científicas distribuidas a nivel mundial.
Muchos de los productos (tecnologías, infraestructura, etc.) del proyecto
DataGrid serán incluidas en el nuevo proyecto grid de EU – EGEE.
141
Capítulo V: Estado del Arte Internacional
c)
Grids asiáticas con aplicaciones climáticas
Nombre del proyecto
EUChinaGRID
http://www.euchinagrid.org/index.htm
Institución Coordinadora101
El proyecto EUChinaGRID es una iniciativa abierta para contribuir a las
organizaciones que estén trabajando en el campo de las grid y donde haya
usuarios que empleen o deseen emplear aplicaciones grid dentro de sus trabajos.
EUChinaGRID fue co-fundado por la Comisión Europea a través del 6° Programa
Marco, las organizaciones actualmente involucradas en el proyecto son:
-
-
-
-
-
-
-
-
-
-
Beihang University, Beijing (China)
CNIC (China)
IHEP, Beijing (China)
Peking University, Beijing (China)
GRnet (Grecia)
Consortium GARR (Italia)
Department of Biology, Università di Roma3 (Italia)
INFN (Italia)
Jagiellonian University in Krakow (Polonia)
CERN (Suiza)
Descripción
El proyecto EUChina comenzó el 1ro de Enero de 2006 planificado hasta
el 31 de Marzo de 2008, con el objetivo de apoyar las interconexiones de las
infraestructuras grids entre Europa y China.
El primer objetivo del proyecto fue facilitar la transferencia de datos y
procesamiento científico, hacia un primer ejemplo de aplicaciones piloto, donde ya
existía una fuerte colaboración entre Europa y China. Estas aplicaciones beneficiaron
inmediatamente a la nueva infraestructura, y actuaron como la fuerza motriz para
testear y desarrollar una infraestructura grid efectiva entre Europa y China.
Durante los 27 meses de duración, el proyecto logró muchos objetivos y creó
una red de colaboración entre Europa y China en el área de la computación grid y
de las aplicaciones científicas.
101
142
http://www.euchinagrid.org/partners-engl.htm
Capítulo V: Estado del Arte Internacional
Al final del proyecto, la infraestructura piloto incluyó doce sitios (cinco
de los cuales están en China), con todos los servicios grid portados a la red y
funcionando.
Un hincapié especial fue puesto sobre la designación de una e-Infraestructura
que permitiera una completa interoperabilidad entre las europeas y chinas, y una
completa conformidad con un ambiente IPv6102.
El desempeño de las aplicaciones también logró un impacto significativo en
muchos campos de la ciencia.
Aplicaciones103
Algunos de los objetivos de este proyecto, en el campo de las aplicaciones,
fue la validación de la infraestructura intercontinental, usando las aplicaciones
EGEE, y apoyar el traspaso de las nuevas aplicaciones relevantes para la e-Ciencia y
la colaboración industrial entre Europa y China. Las principales actividades que se
seleccionaron en el cuarto marco de trabajo fueron:
- Aplicaciones EGEE
- Aplicaciones de Física de Astropartículas.
- Aplicaciones de Biología.
Por lo tanto, al contar con las aplicaciones EGEE, también contaban con las
aplicaciones climáticas desarrolladas en dicho proyecto.
Nombre del proyecto
EUIndiaGRID
http://www.euindiagrid.eu
Instituciones participantes104
Italia
Metaware SpA
Italian National Institute for Nuclear Physics
Consortium GARR - the Italian Academic and Research Network
Abdus Salam International Centre for Theoretical Physics
102
http://www.euchinagrid.org/IPv6/index.html
103
http://www.euchinagrid.org/work_package.htm
104
http://www.euindiagrid.eu/partner_listing
143
Capítulo V: Estado del Arte Internacional
Reino Unido
Cambridge University
India
Indian Tata Institute for Fundamental Research, Mumbai and the National
Centre for Biological
Indian Education and Research Network - ERNET
Department of Physics - University of Pune
Saha Institute of Nuclear Physics Calcutta
The Centre for Development of Advanced Computing Bangalore
Bhabha Atomic Research Centre - Mumbai
Variable Energy Cyclotron Centre
Descripción
EU-IndiaGrid se encuentra creando una red para la comunidad de e-Ciencia
entre Europa e India, para desarrollar una infraestructura grid común que apoye
el procesamiento de datos en áreas de aplicaciones científicas como: Ciencias de
la Tierra y Atmosféricas, Biología, Física de Partículas o Física de Altas Energías, y
Ciencia de los Tejidos.
Para conseguir esta meta, EU-IndiaGrid apoya la interconectividad entre la
infraestructura Grid Europea (EGEE), y la infraestructura Grid India (Garuad India
Grid), además de la del Departamento de Grid para la Energía Atómica, entregando
una avanzada infraestructura para colaboraciones científicas e industriales a
través de Europa e India y movilizando una infraestructura de hardware de
aproximadamente 1200 procesadores Core y 50 Terabytes de disco para el beneficio
de las aplicaciones EU-India Grid. El proyecto está activamente comprometido en
identificar nuevas aplicaciones para la ciencia y los negocios.
Este proyecto comenzó el 01 de Octubre de 2006.
Objetivos principales
- Construir una comunidad de investigación dinámica, académica e
industrial, que pudiera beneficiarse del uso de la tecnología grid.
- Promover el uso de tecnologías grid avanzadas en aplicaciones piloto en
Biología, Ciencias de Altas Energías y Materia, y Ciencias Atmosféricas y de
la Tierra.
- Promocionar los logros de la tecnología grid europea, EGEE, en India y
apalancar estas experiencias y habilidades en la grid india.
144
Capítulo V: Estado del Arte Internacional
Aplicaciones climáticas105
El “Monzón”106 de Verano Indio
El término “Monzón” significa cambios estacionales en la dirección del viento,
causados por la diferencia de temperatura entre la tierra y el océano, lo cual ocurre
en muchas partes del mundo pero, principalmente, sobre el subcontinente Indio.
El monzón indio es uno de los fenómenos más difíciles de aprender en el mundo,
teniendo como obligación mejorar las investigaciones para enfrentar su impacto
social y económico.
Lo modelos computacionales son la columna vertebral de la predicción e
investigación climática, entregando monitoreos mejorados y comprendiendo
qué puede ayudar a los meteorólogos a mejorar la predicción evolutiva de este
fenómeno atmosférico.
Objetivo de la aplicación
El Desarrollo de un sistema de modelamiento regional acoplado atmosféricoocéano para predecir el monzón indio durante el verano.
Logros
- Modelo Climático Regional (RegCM3) y Sistema de Modelamiento Océano
Regional (ROMS, su sigla en inglés), ambos aplicables en la Red GARUDA y
EGEE Grid, middleware gLite.
- Comprobar el concepto con el problema del limitado tamaño.
- Un par de sistemas testeados en gLite.
Siguientes pasos:
Implementar de manera adecuada la gestión de datos, incrementado la
cantidad de problemas que pudieran ser resueltos con simulaciones más realistas.
Recursos Grid
Este proyecto utiliza las infraestructuras grid tanto de EGEE como de
GARUDA.
105
http://www.euindiagrid.eu/applications/earth-atmospheric-sciences
106
Viento que sopla en el sureste de Asia. En invierno sopla de la tierra al mar y
es seco y frío, mientras que en verano sopla desde el océano a la tierra siendo cálido y
húmedo, y trae abundantes lluvias: el monzón ha provocado grandes inundaciones.
145
Capítulo V: Estado del Arte Internacional
d)
Proyectos Internacionales (Utilización de BOINC)
Nombre del proyecto
Climateprediction.net
Sitio Web: www.climateprediction.net
Institución Coordinadora
Climateprediction.net
Cualquier persona con un ordenador puede aportar a este proyecto.
Descripción
Este proyecto es una forma de utilizar el “volunteer computing” (computación
voluntaria). Los objetivos de Climateprediction.net son producir predicciones del
clima de la Tierra pasado el 2080, y testear la precisión de los modelos climáticos.
Para lograr estas metas, llaman a los cibernautas a bajar algún modelo climático
desde su Web para correrlos en sus computadores personales (durante los tiempos
ociosos), los resultados son enviados por medio de Internet a climateprediction.
net y el sumario de los mismos puede ser visto en la Web del proyecto.
Para lograr lo anterior es necesario bajar el software del proyecto BOINC
(Berkeley Open Infrastructure for Network Computing). El cual tiene como intención
obtener una capacidad de computación enorme empleando ordenadores
personales; este modelo es utilizado en áreas como física, medicina nuclear y
climatología.
Nombre del proyecto
World Community Grid
http://www.worldcommunitygrid.org/index.jsp
Instituciones
“World Community Grid tiene una red de asociados dedicados, donde
cada uno aporta su conocimiento y contribución especial. Estos negocios,
asociaciones, fundaciones, organismos gubernamentales y universidades, han sido
instrumentales en el desarrollo y en la operación del World Community Grid. Ellos
también vienen incentivando a sus empleados, miembros, beneficiarios, alumnos
146
Capítulo V: Estado del Arte Internacional
y profesores, para contribuir con el tiempo ocioso de sus PCs”107. Al 26 de abril de
2009, se contabilizaban 403 asociados. También cuentan con un consejo asesor
integrado por doctores de gran parte de las áreas científicas.
Descripción
La misión del World Community Grid es crear la red más amplia de computación
pública en beneficio de la humanidad. La base de su trabajo es la idea de que la
innovación tecnológica combinada con la investigación científica intuitiva y con
el voluntariado en gran escala, pueden mejorar nuestro mundo. Sostienen que su
éxito depende de individuos que contribuyen colectivamente con su misión, sin
fines de lucro, donando el tiempo libre de sus PCs.
Investigaciones relacionadas con el clima
•AfricanClimate@Home108
Misión:
La misión del proyecto AfricanClimate@Home es desarrollar modelos
climáticos más precisos de regiones específicas de África. Esto servirá de base
para predecir cómo cambiará el clima en el futuro, de modo que sea posible
implementar las medidas necesarias para aliviar los efectos adversos del cambio
climático. Se utilizará la gran capacidad de computación del World Community Grid
para comprender y reducir la incertidumbre con la cual se simulan los procesos
climáticos en África.
Importancia:
El cambio climático global es actualmente uno de los problemas más
apremiantes a los que se enfrenta la comunidad mundial. Los impactos negativos
del cambio climático global son una gran preocupación en todos los sectores
del mundo. Todos coinciden en que el impacto será más intenso en los países
subdesarrollados, donde la infraestructura y el acceso a los servicios sociales y
de salud, esenciales para aliviar y atender los efectos del cambio climático, son a
menudo insuficientes.
En este sentido, África, un continente vulnerable a las variaciones climáticas,
se enfrenta a retos importantes. Los múltiples efectos del cambio climático en África
se demostraron claramente en los años 2000 y 2001, en las graves inundaciones
que ocurrieron en Mozambique, que dejaron a más de medio millón de personas
sin hogar y provocaron la muerte de otros cientos, o en la sequía que ha afectado
107
http://www.worldcommunitygrid.org/about_us/viewOurPartners.do
108
http://www.worldcommunitygrid.org/projects_showcase/ach/viewAchMain.
do?SearchParam=climate
147
Capítulo V: Estado del Arte Internacional
al sureste de África los últimos años, que ha contribuido a la escasez generalizada
de alimentos. Actualmente, se desconoce con qué frecuencia cambiarán los climas
extremos, pero aún así, los problemas sociales que afectan a África en la actualidad
podrían agravarse, llegando a una devastación incluso mayor y a la pérdida de
vidas humanas.
La Fase 1 de este proyecto ha concluido (julio, 2008). Los científicos están
analizando los resultados para preparar la Fase 2.
Un informe de estado e información detallada sobre este proyecto será
publicado en las páginas Web de este sitio y circulado entre los investigadores109.
Este proyecto cuenta con su propio foro para preguntas y comentarios110.
109
http://www.csag.uct.ac.za/worldcommunitygrid
110
http://www.worldcommunitygrid.org/forums/wcg/listthreads?forum=281
148
Capítulo V: Estado del Arte Internacional
e)
Proyectos Internacionales con participación de Chile
(Europa y América)
Nombre del proyecto
South American Emissions, Megacities and Climate (SAEMC), en desarrollo.
Dirección Web: http://saemc.cmm.uchile.cl
Instituciones Participantes (Principales):
Argentina- Comisión Nacional de Energía Atómica (CNEA), Grupo de
Monitores Ambiental (GMA), la Unidad de Actividad Química (UAQ).
Brasil- Centro de Previsión del Tiempo y Estudios Climáticos (CPTEC),
Instituto de Astronomía, Geofísica y Ciencias Atmosféricas de la Universidad
de São Paulo.
Chile- Centro de Modelamiento Matemático (CMM), Departamento
de Ingeniería Mecánica de la Universidad de Chile (DIMEC), Dirección
Meteorológica de Chile (DMC), Departamento de Matemáticas y Ciencias
de la Computación de la Facultad de Ciencias de la Universidad de Santiago
(USACH), Escuela de Ingeniería Ambiental de la Facultad de Ecología y
Recursos Naturales de la Universidad Andrés Bello (UNAB).
Colombia- Departamento de Ingeniería Civil y Ambiental de la Escuela de
Ingeniería de la Universidad de los Andes (UDLA), Universidad Pontificia
Bolivariana de Medellín (UPB).
EE.UU.- College of Enigneering de la Universidad de California en Riverside
UCR. UCR participará a través de su centro de Investigación Ambiental y
Tecnológica CE-CERT. Además, la División de Química Atmosférica y el
Programa de Estudios Avanzados del National Center for Atmospheric
Research NCAR, participarán en la aplicación de modelamiento inverso
de CO en superficie, usando modelos 3D de transporte químico, tanto con
mediciones in situ, como remotas (del instrumento MOPITT).
Perú- Servicio Nacional de Meteorología e Hidrología del Perú (SENAMHI)
149
Capítulo V: Estado del Arte Internacional
Descripción:
Durante 2004, establecieron, bajo auspicios de IAI, una red multinacional de la
investigación que se centraba en la estimación y evaluación de emisiones móviles
en las megaciudades de América del Sur (UMESAM, www.cmm.uchile.cl/umesam).
Esta red implica a nueve grupos de investigación a partir de seis países. Fue
pensado, al inicio, para ser parte de un esfuerzo de consolidación en el desarrollo de
las herramientas del sistema de modelamiento terrestre y para proporcionar, más
particularmente, una base funcional y validada en la investigación de la química
atmosférica y del clima, y el establecimiento de políticas sostenibles a largo plazo.
Por lo tanto, ahora les parece lógico que se proponga una actividad realzada en la
cual, además del desarrollo de los inventarios de la emisión, adecuados para los
estándares de calidad de aire y del clima, proporcione a escala regional, panoramas
presentes y futuros del cambio climático, con un énfasis único en la evolución de la
calidad del aire en megaciudades de América del Sur, y la puesta en práctica de las
herramientas químicas regionales coordinadas del pronóstico meteorológico.
Objetivos:
• Proporcionar emisiones y panoramas regionales exactos del cambio del clima
para Sudamérica, con énfasis sobre los impactos de y sobre megaciudades.
• Establecer la base para el pronóstico meteorológico químico operacional
para las megaciudades de América del Sur.
• Consolidar y ampliar una red activa de investigación y de formación de
capacidades locales en las Américas, funcionales para modelar el sistema
terrestre.
Aplicaciones que soporta o sub-área científica que apoya
Uno de los objetivos de este proyecto de colaboración en red, es mostrar que
las conexiones inter-países realmente pueden ser utilizadas para el supercómputo
(high performance computing), lo cual requiere de amplitud de banda. Algunos
ejemplos de esto son:
INPE-CPTEC puede mantener las condiciones límite para Sudamérica para
que en él los usuarios del proyecto corran pronósticos del tiempo, tiempo químico,
usando CCATT-BRAMS u otros modelos.
Facilitar un portal que funcione a la demanda, donde científicos puedan
montar un modelo que trabaje en la red, entregando el trabajo al cluster y
obteniendo los resultados.
Pronóstico de Conjunto, el cual requiere bastante poder de cómputo y
almacenamiento, para potenciales usuarios ésta es otra aplicación que puede ser
usada en red.
150
Capítulo V: Estado del Arte Internacional
Una de las aplicaciones grid que este proyecto está desarrollando es “C/CATTBRAMS - Coupled Chemistry Aerosol and Tracer Transport model to BRAMS”111,
utiliza las herramientas que proporciona EELA-2. Aplicación en etapa de test. Como
su nombre lo dice, esta es una aplicación que utilizando los principios de BRAMS
buscar simular el desplazamiento del Material Partículado como Monóxido de
Carbono con máxima altura entre 20 a 30 kms. Su objetivo es entregar un portal
ejecutable para científicos, donde la aplicación pueda ser utilizada de una forma
completamente transparente por el usuario.
Recursos locales y grid:
CMM aporta con 32 CPU, Itanium2-based cluster.
CPTEC, un 24 CPU, x86-64 cluster.
Se utiliza un sistema de archivos basado en grid (G-Farm), con una amplitud
de banda de 2-4 Mbps que provee RedCLARA.
Nombre del proyecto
Campus Grid Project. http://www.fzk.de/fzk/idcplg?IdcService=FZK&node=2
450&lang=en
Institución Coordinadora
Centro de Investigación de Karlsruhe con su Instituto de Computación
Cientifica (IWR)
Participa:
El Grupo de trabajo “Hidrológica y Modelos” (H+M) del centro de Estudios
Avanzados en Zonas Áridas.
Descripción
Este programa se centra en los temas de investigación y desarrollo, para
explorar nuevos métodos de grid computing como una herramienta poderosa
en el ámbito de las investigaciones de vanguardia. El programa incluye todos los
aspectos de grid computing: hardware, middleware y aplicaciones. En todos estos
aspectos el trabajo es llevado a cabo en estrecha cooperación internacional, en el
marco del espíritu de los proyectos de la Comunidad Europea.
111
http://applications.eu-eela.eu/application_details.php?ID=51
151
Capítulo V: Estado del Arte Internacional
Esquematización del IWR-Campus Grid Project112
Aplicaciones, punto de vista CEAZA:
El objetivo principal del grupo H+M lo constituye el estudio y modelamiento
matemático de las componentes del ciclo hidrológico, bajo el impacto de las
oscilaciones climáticas, en las zonas áridas y semi-áridas del norte de Chile. El
modelamiento de estos sistemas es altamente complejo y requiere de computadores
con gran eficiencia de cálculo.
A partir del año 2005 el grupo H+M inicia su acceso al IWR- Campus Grid Project.
Hasta la fecha se ha trabajado fundamentalmente en problemas relacionados con la
modelación de la componente atmosférica del ciclo hidrológico. En consideración
a la topografía compleja del área de estudio, se ha trabajado, en especial, con el
modelo atmosférico de mesoescala KAMM, que permite afinar el tamaño del paso
espacial hasta 100 m.
Gracias a la tecnología del grid computing se ha podido acceder a
supercomputadores (p.ej., el computador vectorial NEC SX8 y SX5 del IWR-Campus
Grid Project), consiguiendo reducir los tiempos de cálculo al 15% en relación al
tiempo requerido por las máquinas locales.
112
152
Esquema facilitado por Melitta Fiebig.
Capítulo V: Estado del Arte Internacional
Figura 8. Computador vectorial NEC SX8113
Adicionalmente, el año 2007 se llevó a cabo un convenio con el Dr. Frank
Schmitz, representante del Instituto de Computación Científica de Karlsruhe (IWR)
y la Universidad de La Serena y su rector Dr. Nibaldo Avilés, en el cual se otorga
acceso a los recursos computacionales del IWR y del proyecto Campus Grid a
proyectos demandantes de alto rendimiento de la Universidad.
Recursos grid:
Supercomputadores (p.ej., el computador vectorial NEC SX8 y SX5).
113
Imagen entregada por Melitta Fiebig
153
Capítulo V: Estado del Arte Internacional
Nombre del proyecto
Proyecto ATN/OC-10064-RG BID «Información Climática Aplicada a la Gestión
de riesgo agrícola en los países andinos»
Disponible en: www.ciifen-int.org/images/stories/file/Proyecto%20BID_CIIFEN.pdf
Institución Coordinadora, Instituciones y Países Participantes.
Institución Coordinadora:
Centro de Investigación Internacional para el Fenómeno del Niño (CIIFEN)
Países participantes:
Venezuela, Colombia,
Meteorológica).
Ecuador,
Bolivia,
Perú
y
Chile
(Dirección
Coordinación con otras agencias multilaterales y bilaterales:
La operación está alineada con el Programa “Climate Information and
Prediction Services” (CLIPS) de la OMM y con el Plan de Acción de Hyogo (2005).
Está enmarcada en el mandato otorgado al CIIFEN por la Estrategia Andina para
la Prevención y Atención de Desastres, de julio de 2004 y, a nivel operativo,
complementa acciones de fortalecimiento institucional del CIIFEN, financiadas por
la CAF, y las iniciativas del Banco Mundial y de la Secretaría de la Convención Marco
de las Naciones Unidas sobre el Cambio Climático (UNFCCC) en la región.
Descripción
La operación apoyará al CIIFEN y los SMNs en la implantación de un sistema
de información climática aplicada en la región andina para beneficio de las
comunidades agrícolas más vulnerables. Este sistema comprende el mejoramiento
de la base de datos climatológicos regional, su conexión con modelos de predicción
climática y posterior gestión de la información para la aplicación por parte de los
usuarios.
También se fortalecerá la cooperación regional a través del reforzamiento de
los servicios de predicción e información climática, lo cual contribuirá a afianzar la
credibilidad de las instituciones especializadas y motivar a los gobiernos y el sector
privado a confiar e invertir en los SMNs de la región.
El implantar un nuevo horizonte de tiempo en la predicción climática
permitirá a los Gobiernos Nacionales y subnacionales trabajar en procesos más
ligados a la prevención y la gestión de riesgo que en la respuesta a emergencias,
lo que definitivamente refuerza y complementa las prioridades del BID en cuanto
al fortalecimiento de los sistemas nacionales de gestión de riesgo emprendidos
en la región durante los últimos años. Éste proyecto es parte de la Iniciativa para
154
Capítulo V: Estado del Arte Internacional
la Promoción de Bienes Públicos Regionales, aprobada por el Directorio Ejecutivo
del BID.
Para llevar todo esto a cabo, cada país participante ha elegido una región
piloto; e en Chile ésta es la región de Valparaíso.
El objetivo de este proyecto es de contribuir en la reducción de los impactos
socio económicos derivados de la acción del clima sobre la actividad agrícola en
los países de la región andina. En este contexto, esta cooperación técnica busca
crear un bien público regional que es la implantación de un sistema de información
climática, centrado en las necesidades de los agricultores, que facilite la toma de
decisiones y la gestión de riesgo del sector agrícola y, además, la diseminación de
la información para beneficio de numerosos agricultores.
El Proyecto contempla, a nivel local, el establecimiento de alianzas estratégicas con:
• El sector privado
• Los medios de comunicación local.
• Redes campesinas comunitarias y
• La preparación de talleres locales para consolidar las redes de distribución
de la información climática.
Aplicaciones en Desarrollo
Pronóstico climatológico para la Región de Valparaíso
Realización del pronóstico Estacional en fase Experimental de Precipitación
y Temperatura Extremas para la Región Piloto a escalas de tiempo mensual,
bimensual y trimestral. El área piloto seleccionada para la implementación del
Proyecto, considera la región de Valparaíso.
Mapa de riesgo agroclimático
Tomado como base el Pronóstico Estacional en fase Experimental de
Precipitación y Temperatura Extremas para la Región Piloto y considerando los
factores climáticos de riesgo para los paltos y cítricos, se construirá un mapa de
riesgo agroclimático.
Recursos locales:
Para la Dirección Meteorológica de Chile el proyecto permitió contar con dos
nuevos computadores de última generación y una estación de trabajo, incluyendo,
además, las licencias de los softwares para cada uno de los equipos adquiridos.
El proyecto ha permitido la contratación de dos digitadoras y un consultor
agrícola por un período de cinco meses para Chile.
155
Capítulo V: Estado del Arte Internacional
Trabajo ejecutado por las dos digitadoras:
Para la creación de la Base de Datos Climáticos Regionales, se digitalizó un
total de 199 meses de variables agrometeorológicas para la Región de ValparaÍso en
los parámetros de temperatura del aire, temperatura a 5cm, temperatura de suelo
a 10cm, 20cm, 50cm y 100cm, evaporación y precipitación, visibilidad horizontal,
nubosidad y estado de suelo, las que se miden tres veces al día.
Trabajo ejecutado por el Consultor Agrícola
Asistir al Consultor en Riesgo Agrícola Internacional a establecer una línea
de base en el área piloto de Chile, que contenga información de los niveles de
pérdidas agrícolas asociadas al clima y al uso y aplicación de información climática,
mediante encuestas en el terreno sobre muestras técnicamente diseñadas.
5.3 Visión Futura
En las investigaciones climáticas pueden existir muchas dudas y problemáticas
sobre cómo compartir y almacenar la gran cantidad de datos producidos, bajo qué
infraestructuras montar los modelos climáticos de más altos requerimientos, como,
también, los efectos de un futuro cambio climático. Es así como en esta sección
hemos querido señalar los puntos de vista de las instituciones líderes en el área de
la investigación climatológica, los cuales debieran ser analizados al momento de
llevar a cabo cualquier investigación sobre el tema.
La Organización Meteorológica Mundial (OMM), en uno de sus boletines114,
plantea actividades que debieran ser parte de las investigaciones climáticas,
sobre todo en esta época donde el clima está cambiando, en sus conclusiones nos
señala:
“Se señala como un paso imprescindible crear un sistema de información
climática el cual tenga como responsabilidades tomar decisiones acerca de
qué cambios están ocurriendo y por qué, como también vislumbrar situaciones
inmediatas. Esto se traduce al proceso de cómo las investigaciones básicas aportan
sus datos a la investigación aplicada y operativa que a su vez, desarrolla productos
y servicios climáticos” (Ver fotografía 2).
114
156
Kevin E. Trenberth. Obra citada. Enero 2008
Capítulo V: Estado del Arte Internacional
Usuarios interesados,
responsables de la toma de decisiones
Evaluaciones
Información sobre productos
Investigación
básica
Investigación
operativa
y aplicada
Predicción
Atribución
Servicios
Climáticos
Modelización
Asimilación
Observaciones, datos
datos,yyanálisis
análisis
Figura 9. Esquema del flujo del sistema de información climática115
“Para cumplir de forma satisfactoria los desafíos de la investigación anterior
se necesita una financiación adecuada, aunque en teoría se compensa con la
obtención de un valioso sistema de información”.
La predicción climática como información para la agricultura, silvicultura
y pesca
Un clima extremo y eventos climáticos tales como una severa sequía,
inundación, y temperaturas extremas, a menudo tienen grandes impactos sobre
la sostenible actividad agrícola, particularmente en los trópicos y sub-trópicos. La
variabilidad climática afecta a cada granjero como a todas las comunidades rurales,
y la seguridad de la alimentación mundial116.
Es claro que una buena información climática puede ayudar a disminuir
los efectos de estos bruscos cambios, logrando que una comunidad rural pueda
resguardarse y programarse, sabiendo lo que depara la naturaleza.
¿Hacia qué tipo de investigaciones debería ir la tendencia para evitar estas
situaciones?
115
Kevin E. Trenberth. Obra citada. Enero 2008
116
World Climate News OMM. Climate prediction and information for decisiónmaking. Enero de 2009
157
Capítulo V: Estado del Arte Internacional
En un Boletín de la OMM se señala: La adaptación imperativa: ¿está preparada
la ciencia climática?117 , uno de los puntos que se resalta es la Regionalización de
las investigaciones.
Regionalización de las investigaciones para la toma de decisiones
Cada día las investigaciones climáticas a nivel regional y local toman más
importancia, esto es debido a que el clima, el cambio climático y la vulnerabilidad
ante el mismo, difieren de una región a otra, por ello, contar con información fiable
regional y localmente, ayudará a disminuir la incertidumbre de cara a futuras
proyecciones. De esta forma, las decisiones de adaptación al cambio climático
podrán ser más eficaces. Por lo tanto, el mantenimiento y mejora de los sistemas
de vigilancia climática serán actividades esenciales para apoyar a las ciencias
climáticas, lo cual, obteniendo las infraestructuras adecuadas, servirá para un
intercambio de información y datos climáticos a nivel internacional, y una creación
contínua de capacidad en la comunidad de investigación climática en todas las
naciones. El futuro tiene como dirección desarrollar y compartir la ciencia climática
con todas las partes interesadas y con los responsables de adoptar decisiones.
En un boletín de la OMM, específico sobre la regionalización de la información,
podemos encontrar temas como:
En el contexto del cambio climático, las principales herramientas que se
disponen son los modelos de circulación acoplada atmósfera-océano (MCGAO).
Lamentablemente, y a pesar de las plataformas informáticas cada vez más potentes
los MCGAO más utilizados siguen teniendo resoluciones horizontales de unos 100300 km, las cuales no se ajustan a las escalas finas como las que se requieren para
los estudios de evaluación de impactos del cambio climático.
Las infraestructuras en el futuro
En el campo de la e-Infraestructura (grid) y su aporte a la comunidad científica,
uno de los integrantes del proyecto South American Emissions, Megacities and
Climate (SAEMC) señala:
“En un futuro, la comunidad meteorológica y sus sub-ramas, tendrán acceso
a recursos computacionales capaces de echar a andar modelos para clima y
tiempo, almacenar/recuperar datos meteorológicos, gracias a la computación grid.
Esto será logrado por medio de una interfaz Web donde estarán las aplicaciones
climáticas y será de sencillo uso, mejorando los vínculos entre los investigadores
117
158
Xuebin Zhang, Francis W. Zwiers y Thomas C. Peterson
Capítulo V: Estado del Arte Internacional
y las comunidades de modelos operacionales, y fomentando nueva colaboración
entre las comunidades de clima y tiempo118”.
Uno de los proyectos norteamericanos más grandes en lo referente a
infraestructura grid en el área de “Ciencias de la Tierra” es Earth System Grid, (fundado
por el Departamento de Energía de EE.UU.), en este proyecto encontramos una de las
grandes bases de datos y metadatos en esta área. Este proyecto apunta y señala que:
“Los actuales modelos climáticos son ejecutados en supercomputadores
dentro de los EE.UU., y producen terabytes de datos los cuales son guardados en
almacenamientos de archivos locales. Los análisis de esos datos contribuyen para la
compresión de nuestro planeta, cómo hemos influenciado el cambio climático, y cómo
los políticos reaccionan y responden con la información científica que nosotros, como
una comunidad global, producimos. El futuro tiende, en lo referente al modelamiento
climático, sólo a incrementar los requerimientos computacionales y de almacenamiento.
Los avances científicos requerirán un masivo incremento en capacidades
computacionales, como también, el incremento en el volumen y distribución de los
datos de los modelos climáticos. Veremos incrementos en la resolución física de los
modelos, una elevación del número de conjunto de pronósticos corriendo, aumentada
“calidad”, en términos de nubes, aerosoles, ciclos biogeoquímicos, y otros parámetros,
y una amplitud de alcance global que se extenderá dentro de la región más alta de la
atmósfera. Si nos proyectamos al futuro, es claro que nuestras actividades del sistema
de modelación global de la Tierra producirán petabytes (1 petabyte = 1024 terabytes)
de datos que serán cada vez más complejos y distribuidos, debido a la naturaleza de
nuestros recursos computacionales.
“La comunidad de modelación climática ha estado creando organizaciones
o proyectos específicos de archivos de datos por un tiempo. Sin embargo,
mientras estos archivos ayudan a posibilitar el trabajo de grupos bien definidos y
específicos, ellos limitan el acceso a la comunidad, a la larga, y prohíben el análisis
y comparación a través de los archivos. Con la actual infraestructura, el análisis de
estos grandes y distribuidos conjuntos de datos, los cuales son reducidos para un
sistema de almacenamiento separado en centros distribuidos geográficamente, se
convertiría en una tarea de enormes proporciones. El objetivo de ESG es mejorar
drásticamente esta situación. Surgimos en el desarrollo de la tecnología grid,
podemos romper con estas barreras artificiales, creando un entorno de acceso a
datos que englobe múltiples dominios, abarcando fronteras organizacionales con
el objetivo de entregar un acceso sin límites de diversos datos de la modelación
climática para el uso de los usuarios119”.
118
Eugenio Sper De Almeida
119
The Earth System Grid: Supporting the Next Generation of Climate Modeling
Research
159
Capítulo VI: Estado del Arte Nacional
6 Capítulo VI:
Estado del Arte Nacional
Si bien es cierto es muy difícil limitar hasta qué punto llegan las investigaciones
climáticas de otras ciencias, es así como muchos proyectos y publicaciones pueden,
al mismo tiempo, abarcar temas tanto de ingeniería, astronomía y climatología. A
pesar de esta dificultad, se ha querido destacar los centros de investigación que
realizan su aporte a la investigación del clima, ya sea recolectando datos y análisis
o creando modelos climatológicos. A continuación se ofrece una breve descripción
de los principales centros de investigación, considerando sus objetivos, misión y,
en algunos casos, proyectos destacados en el área de clima.
6.1 Instituciones y/o grupos de investigación a
nivel nacional
Dirección Meteorológica de Chile (DMC)
http://www.meteochile.cl
Descripción:
La Dirección Meteorológica de Chile, dependiente de la Dirección General
de Aeronáutica Civil, es el organismo responsable del quehacer meteorológico
en el país; su propósito es satisfacer las necesidades de información y previsión
meteorológica de todas las actividades nacionales.
Misión:
Proporcionar pronósticos, avisos e información de tiempo y clima para fines
aeronáuticos y de otras actividades; realizar estudios e investigación en todas sus
161
Capítulo VI: Estado del Arte Nacional
aplicaciones; administrar y preservar toda la información meteorológica nacional;
con el objetivo de mitigar daños por fenómenos atmosféricos, contribuyendo a
proteger las personas, sus bienes y aportar al desarrollo socio-económico del país,
en un marco de eficiencia, eficacia y de acuerdo a estándares de calidad.
Funciones específicas:
•Suministrar información y previsión meteorológica destinada a dar servicio
a la aeronáutica y a las actividades productivas y de planificación nacional.
•Realizar actividades de investigación, conducentes al desarrollo y
aprovechamiento de la meteorología en todos los campos de la actividad
nacional.
•Participar, conjuntamente con organismos de gobierno, en el estudio de
las aplicaciones de la meteorología en los distintos ámbitos del quehacer
nacional.
•Establecer y mantener relación con organismos meteorológicos de otros
países e instituciones científicas internacionales, con el fin de optimizar la
gestión y proyección de la Dirección Meteorológica de Chile en el exterior.
•Supervisar técnicamente los Centros Meteorológicos Regionales.
•Administrar el Banco Nacional de Datos Meteorológicos.
Proyectos destacados en los que actualmente participa:
• South American Emissions, Megacities and Climate (SAEMC)120.
• Proyecto ATN/OC-10064-RG BID "Información Climática Aplicada a la
Gestión de riesgo agrícola en los países andinos121”.
•Proyecto ACT-19122 .
Proyectos de adquisición de infraestructura:
Mejoramiento de la Capacidad de Modelación Numérica de la DMC
Entre sus objetivos están:
- Simular numéricamente el océano y la atmósfera, utilizando varios
modelos para llegar a un pronóstico de conjunto (ensemble).
- Adquisición de un equipo de alto rendimiento computacional (HPC, su
sigla en inglés).
120
http://saemc.cmm.uchile.cl/
121
www.ciifen-int.org/images/stories/file/Proyecto%20BID_CIIFEN.pdf
122
http://www.dgf.uchile.cl/ACT19
162
Capítulo VI: Estado del Arte Nacional
- Creación de un centro de modelación atmosférica, se abrirán diez puestos
de trabajo a tiempo completo.
- Talleres de Capacitación.
Renovación de la Red Integrada Satelital
- Actualizar el sistema de recepción satelital, nuevas instalaciones en la
DMC, Antofagasta, Puerto Montt, Punta Arenas, Antártica e Isla de Pascua.
- Instalación, en Punta Arenas y Santiago, de receptores de sensor móvil de
tierra y agua, permitiendo obtener datos de alta resolución con los cuales se
pueden abordar problemas de contaminación (océano o atmósfera).
- Talleres de Capacitación.
Adquisición de Instrumentos Perfiladores para la cuenca de Santiago
- Adquisición de un equipo LIDAR (Light Detection and Ranging); este tipo
de equipamiento puede ser fijo o utilizados en campañas.
- Aparato perfilador de tiempo y temperatura.
- Talleres de Capacitación.
Centro de Estudios Avanzados en Zonas Áridas y Universidad de La Serena
CEAZA y ULS, http://www.ceaza.cl y http://www.userena.cl/
investigacion, respectivamente.
Descripción:
La Universidad de La Serena y el CEAZA trabajan en estrecha colaboración,
tanto en lo que se refiere a los recursos humanos, como en materia de infraestructura
y equipamiento, especialmente en la temática de la investigación del clima.
CEAZA junto a ULS son una Unidad de Desarrollo Científico y Tecnológico
Regional, es decir, un verdadero consorcio de investigación en el que confluyen las
capacidades científicas y las voluntades de los sectores público y privado.
Su fundación, en el año 2003, se gestó gracias a un proyecto conjunto
de la Universidad de La Serena, la Universidad Católica del Norte (sede
Coquimbo) y el Instituto de Investigaciones Agropecuarias, INIA-INTIHUASI.
Estas instituciones establecieron el CEAZA, gracias al financiamiento otorgado por
CONICYT y el Gobierno Regional de Coquimbo. El Centro se ha constituido con
38 investigadores, diez de los cuales son profesionales contratados especialmente
para el proyecto a jornada completa.
163
Capítulo VI: Estado del Arte Nacional
Misión y objetivos123:
“La institución intenta comprender los procesos oceanográficos, atmosféricos
e hidrológicos asociados al Cambio Climático Global (CGC) y a El Niño-Oscilación
del Sur (ENOS), sus efectos sobre los sistemas bióticos naturales o bajo cultivo. A
su vez, busca aportar soluciones a los desafíos que imponen estos fenómenos,
desarrollando ciencia y tecnología regional, aunando las voluntades del sector
público y privado.
“Su misión es contribuir a la comprensión de los efectos de las oscilaciones
climáticas/oceanográficas sobre el ciclo hidrológico y la productividad biológica
(natural y bajo cultivo) en las zonas áridas y marinas del centro-norte de Chile”.
Áreas de Impacto de CEAZA:
Posee cinco áreas en las cuales centra sus proyectos, éstas son:
- Agricultura y Clima.
- Acuicultura y Oceanografía.
- Biología Marina.
- Biología Terrestre.
- Hidrología y Modelos.
“El área de impacto de los proyectos de investigación desarrollados por el
CEAZA se distribuyen de acuerdo a las prioridades estratégicas de la región. En
términos de los montos de los proyectos adjudicados durante el periodo 20032008, el área con mayor impacto ha sido la Ambiental (44,9%). Esta área incluye
un importante número de proyectos en las temáticas hidrológicas, oceanográficas,
climáticas, ecológicas y de conservación de la biodiversidad. Con un 43,9%, le
siguen en importancia dos áreas de impacto productivo (i.e., acuícola= 22,7% y
agrícola=21,2%)”124.
Infraestructura:
“En el área del clima es importante destacar la infraestructura en monitoreo
de variables ambientales que el Centro ha generado en la Región de Coquimbo.
“El CEAZA mantiene y administra una red de estaciones meteorológicas
instaladas en el Valle del Elqui y el Valle del Huasco, lo que le permite generar
una base de datos e información on-line importante de aspectos climáticos y
agrometeorológicos. Esta red se extendió hacia la cuenca del Choapa y en la alta
123
Memorias 2008 de CEAZA, disponible en http://www.ceaza.cl/images/
docs/memoria_ceaza_2008.pdf
124
164
Memorias 2008 de CEAZA, obra citada.
Capítulo VI: Estado del Arte Nacional
montaña (CEAZA CRIO). Además se integró la red SIAR con cobertura en el Valle
del Limarí con el apoyo de INIA- INTIHUASI, la Asociación de Canalistas del Canal
Palqui Maurat Semita, Junta de Vigilancia del Río Grande y Limarí y sus Afluentes,
Asociación de Canalistas del Canal Camarico.
“Junto a ello cabe destacar la implementación de la Red CEAZA-MAR la cual
está operativa desde el inicio del año 2009”125.
Colaboración Internacional en el área clima:
El CEAZA posee vínculos con el Instituto de Meteorología y Climatología (IMK)
del Centro de Investigación de Karlsruhe (FZK), Alemania. Junto a dicha institución,
ha logrado:
- Tres proyectos de investigación, centrados en la Región de Coquimbo
(financiamiento del Ministerio Federal Alemán de Ciencia y Tecnología,
BMBF).
- Seis publicaciones ISI conjuntas; una publicación ISI enviada, el Dr. Norbert
Kalthoff, jefe del grupo de trabajo “Meteorología y Climatología de la
Troposfera Baja”, estableció un documento de compromiso de colaboración
con el CEAZA, que compromete participación en campañas de mediciones
meteorológicas con equipos de última generación del IMK.
Con el Instituto de Computación Científica (IWR), del Centro de Investigación
de Karlsruhe (FZK), se trabaja en conjunto desde 2004 hasta la fecha y, hasta ahora,
los resultados de dicha colaboración han sido:
- Una publicación ISI conjunta.
- La integración del CEAZA como usuario del Campus Grid: Trabajando
teleconectados en las supercomputadoras del IWR.
Con el Centro de Investigación del Medio Ambiente de Leipzig, Alemania
(UFZ), desde 2003 a la fecha, los logros son:
- Postulación conjunta a proyectos.
- Dos publicaciones ISI conjuntas.
Proyectos destacados en clima126:
Manejo de la Red Meteorológica CEAZA-MET.
“Se trata de una Red de 8 estaciones meteorológicas dispuestas por todo
125
Memorias 2008 de CEAZA, obra citada.
126
http://www.ceaza.cl/index.php?option=com_content&task=view&id=381&I
temid=84
165
Capítulo VI: Estado del Arte Nacional
el Valle de Elqui con el fin de medir variables climáticas como temperatura,
humedad relativa, radiación solar, velocidad y dirección del viento, precipitación y
temperatura del suelo en dos profundidades (10 y 20 cm).
“La información se encuentra en línea y los usuarios la pueden obtener en
forma gratuita, diariamente en www.ceaza.cl.
“Los datos proporcionados por la Red facilitan la toma de decisiones en el
manejo agrícola y la optimización del sistema productivo del sector. Además,
genera antecedentes para distintos proyectos de investigación”127.
Más información: http://www.ceazamet.cl.
Análisis de riesgos ambientales derivados de la contaminación por
mercurio en el distrito minero de Almadén y estudio de alternativas de
remediación de sus suelos.
Stratosphere - Troposphere Exchange processes and their impact on the
ozone balance in the subtropics of the Southern Hemisphere: A multi-scale
integrated study based at Cerro Tololo (30ºS, 70ºW, 2200 m.a.s.l).
Proyecto realizado en conjunto con la Universidad de Chile y la Dirección
Meteorológica de Chile.
“Los procesos de intercambio entre la estratosfera y la troposfera constituyen
factores clave para el estudio del balance de gases traza de importancia radiativa y
química. Estos procesos de intercambio también están relacionados con temas de
interés práctico para el pronóstico operacional del clima y prevención de desastres
provocados por eventos de precipitación catastrófica, especialmente en una zona
de topografía compleja como lo es la Región de Coquimbo.
“Este proyecto de investigación está orientado al estudio del intercambio de
ozono a través de la tropopausa sobre la estación monitora de cambio global en
Cerro Tololo (30ºS, 70ºW, 2220 m.s.n.m). Medidas continuas de ozono y variables
meteorológicas en la superficie han sido realizadas desde 1996 con el auspicio de
la Organización Mundial de Meteorología (WMO) y la Dirección Meteorológica de
Chile en cooperación con el Interamerican Southern Astronomical Observatory.
La estación regional localizada en el cerro Tololo integra la red de estudio de
tendencias de cambio climático del programa de Global Atmospheric Watch (GAW)
de la WMO.
127
http://www.ceaza.cl/index.php?option=com_content&task=category&secti
onid=12&id=97&Itemid=84
166
Capítulo VI: Estado del Arte Nacional
“El objetivo del estudio lo constituye la identificación de los mecanismos
responsables de la variación de las concentraciones de ozono medidas en Cerro
Tololo. Este estudio considera, por una parte, la aplicación de modelos atmosféricos
de diferentes escalas y, por otra parte, la medición de perfiles verticales de ozono
(ozonosondas) y variables meteorológicas”128.
Institutional adaptations to climate change.
Proyecto elaborado en conjunto con la Universidad de Regina, Canadá.
“El objetivo del proyecto es desarrollar una comprensión sistemática e
integral de la capacidad de las instituciones regionales para formular y desarrollar
estrategias de adaptación a los riesgos y a los impactos pronosticados del cambio
climático en lo referente al suministro y manejo del agua en ambientes de zonas
áridas.
“Este objetivo se aborda a través de un estudio comparativo de dos
regiones en diversas etapas de vulnerabilidad social y ambiental: la cuenca del río
Saskatchewan Sur (SSRB) en Canadá Occidental y la cuenca del río Elqui (ERB) en el
Norte Chico de Chile.
“El clima actual del semiárido de la ERB constituye un análogo espacial del
clima futuro de la SSRB según pronósticos de modelos de clima global”129. “Ambas
regiones tienen un clima seco contiguo a un sistema importante de montañas y
paisajes en riesgo de desertización, así como una economía agrícola dependiente
del agua de riego que se deriva de la nieve y de los glaciares de las montañas. Como
resultado de condiciones más secas y de una creciente incertidumbre climática,
ambas regiones se verán afectadas de manera similar por el cambio climático.
“En este proyecto también se elaboran escenarios de impacto local del
cambio climático, usando técnicas de downscaling estadístico, para obtener
información climatológica regional futura, a partir de los modelos de circulación
global (GCM)”130.
Energy and water balance studies in the arid area of La Serena (Balance
Hidrológico y de Energía en la Zona Árida de La Serena).
Proyecto realizado junto al Centro de Investigación de Karlsruhe, Alemania.
128
Información proporcionada por Melitta Fiebig.
129
http://www.ceaza.cl/index.php?option=com_content&task=category&secti
onid=16&id=79&Itemid=84
130
Información proporcionada por Melitta Fiebig.
167
Capítulo VI: Estado del Arte Nacional
“Bajo la perspectiva del impacto local del cambio climático global, este
proyecto contribuye al conocimiento del estado actual del clima en el valle del
Elqui.
“Este valle se encuentra ubicado en el Norte Chico a 30°S de latitud Sur, en
una zona de transición de clima árido a semi árido.
“Esta región se caracteriza por su topografía compleja y grandes diferencias
en las propiedades de las superficies del suelo, debido al hecho que en el fondo
del valle se extienden áreas irrigadas e intensamente cultivadas y en los demás
sectores existe solo una vegetación muy pobre.
“En este proyecto se investiga el balance de energía en algunos sectores
del valle de Elqui, con el objetivo de comparar la evapo-transpiración real de las
zonas cultivadas con aquella de zonas con vegetación natural; además se estima
la deposición del rocío, que resulta ser una importante fuente de agua en zonas
áridas. Se estudia también la influencia del embalse Puclaro sobre el clima local.
“Se trabaja con monitoreo continuo en terreno, campañas intensivas
de radiosondeos y modelación físico-matemática en una poderosa red
computacional”131.
FONDECYT 2008-2007:
Impact of large scale disturbances in the upwelling system off northern
Chile (near 30º S).
“El presente proyecto propone un estudio exhaustivo del sistema de surgencia
de Coquimbo (30 ° S). Se postula que las grandes oscilaciones costeras atrapadas
- principalmente intraestacionales - modulan el sistema de surgencia costera frente
a Coquimbo. Esta modulación se manifiesta de dos maneras. En primer lugar, el
efecto directo de las olas sobre la termoclina profundidad (oxycline y nutricline)
modifica las características de las aguas de la surgencia. En segundo lugar, estas
oscilaciones tienen una enorme influencia en las corrientes sobre la plataforma
continental, condicionando el destino final de las aguas de la surgencia. Esta
hipótesis se pondrá a prueba directamente en el océano y en las mediciones la
temperatura actual de las mediciones de la plataforma continental y en las bahías
adyacentes y los datos complementarios del viento, las costas del nivel del mar, e
imágenes de satélite de temperatura superficial del mar y clorofila. Esta hipótesis se
pondrá a prueba directamente en el mar. Se efectuaran mediciones de temperatura
131
http://www.ceaza.cl/index.php?option=com_content&task=category&secti
onid=16&id=77&Itemid=84
168
Capítulo VI: Estado del Arte Nacional
de la plataforma continental y en las bahías adyacentes y se tomarán datos
complementarios de viento, de niveles del mar en la costa, e imágenes de satélite
de temperatura superficial del mar y clorofila. Estas observaciones serán analizadas
desde la perspectiva de la teoría de surgencia, de olas costeras, y contrastadas con
los resultados del modelo océano-costero”132.
Climatic regionalization and physical modeling of the cryosphere over
Chile’s Norte Chico Region133.
Bajo las condiciones semiáridas de la región del Norte Chico en Chile
(27°S-33°S) , los recursos hídricos y energéticos son centrales para el desarrollo
sostenido. En esta región Andina, el recurso hídrico es fuertemente dependiente
de las extensiones de nieve y hielo. Durante el siglo, un desprendimiento de la
“criosfera”134 fue observado como un indicador del cambio climático en el área. Sin
embargo, el déficit de observaciones continuas en las altas altitudes ha limitado
nuestra habilidad para comprender el origen físico de este desprendimiento. Esto
es particularmente cierto en la escala regional, donde la carencia de observaciones
dificulta el modelamiento físico de la acumulación, y al proceso de ablación, que
son requeridos para crear escenarios precisos de la evolución de la criosfera.
Las posibilidades de la modelación del proceso de ablación en una escala
regional están fuertemente vinculadas con la resolución y limitaciones de los
modelos climáticos, además del re-análisis. Un modelo de ablación físico está
basado en la computación del balance de la energía de la superficie y requiere
información meteorológica en una resolución comparable con el tamaño de los
objetos estudiados (campos de nieve y glaciares). En el pasado y futuro de los
estudios climáticos, la resolución de Modelos de Circulación Global (GCM, su sigla
en inglés), re-análisis (pronóstico de conjunto) y Modelos de Circulación Regional
(RCM), es aún demasiado extenso para el estudio detallado de la criosfera en las
áreas montañosas, y en un paso más lejano, en la regionalización, es una necesidad.
Este proyecto producirá información climática en una resolución requerida para
introducir en un sofisticado modelo de nieve/hielo, la cual sucesivamente será
usada para simular y predecir la variabilidad de la extensión de nieve y hielo en la
región del Norte Chico dentro del periodo 1950-2100.
Dos herramientas serán aplicadas para obtener campos meteorológicos
detallados desde modelos de escala más extensos. Primero, un modelo físico que
132
http://www.ceaza.cl/index.php?option=com_content&task=category&secti
onid=13&id=309&Itemid=84
133
Información proporcionada por Melitta Fiebig.
134
Porción de la superficie de la tierra donde el agua esta en forma solida.
169
Capítulo VI: Estado del Arte Nacional
obtenga una escala regional, éste será aplicado para capturar la naturaleza de la
región con respecto a su elevado terreno bajo la influencia de las precipitaciones.
Segundo, una herramienta para el modelo que obtendrá una escala regional
será desarrollada para interpolar los incidentes de cambios de estado de la energía.
Los resultados del modelo serán validados por comparaciones con mediciones
meteorológicas de la superficie, con salidas de simulaciones RCM y con datos
satelitales. Estas herramientas usarán datos re-analizados (1950 a 2005) y la salida
de datos de simulaciones GCM (hasta 2100), a fin de producir una resolución (500m)
de la base de datos climática sobre el periodo 1950-2100.
A objeto de obtener una base de datos para un control de calidad, las
herramientas serán introducidas con la base de datos del clima regional de la
Universidad de Chile, que fue procesada con WRF para el período 1960-1990 y para
2060-2100.
Una vez que la información del clima en alta resolución ha sido generada,
ellos serán usados para manejar el avanzado modelo de cambio de nieve/hielo
CROCUS (Meteo-Francia). La calidad de las simulaciones de la acumulación de
nieve y ablación será verificada sobre los últimos 50 años, con un equilibrio
de masa de datos desde el Glaciar Echaurren del Norte (Dirección General de
Agua, Chile), mediciones de acumulación de nieve y el cumplimiento con altas
medidas de altitud. Los procesos de ablación serán estudiados y el impacto de las
precipitaciones y variaciones de temperatura sobre la nieve y evolución del hielo,
serán destacados.
Los escenarios de la evolución del clima en la mesoescala permitirán verificar
que la precipitación decrecerá en el área durante el siglo 21, como han sugerido
otros estudios basados en simulaciones GCM. Finalmente, el impacto de las
variaciones climáticas sobre las extensiones de nieve y hielo serán calculados. Este
conocimiento será crucial para el modelamiento del ciclo hidrológico y para una
evaluación del futuro de las variaciones de los recursos hídricos en esta área.
170
Capítulo VI: Estado del Arte Nacional
Centro de Estudios Científicos
http://www.cecs.cl
Descripción:
Una de las áreas de estudio es “Glaciología y Cambio Climático”, donde se
analizan las variaciones de los glaciares y las dinámicas del flujo del hielo y su
relación con los cambios climáticos. Las zonas de estudio comprenden los Andes
de Chile Central, la Región de Los Lagos, los Campos de Hielo Patagónico Norte
y Sur, la Península Antártica y el sector Occidental del casquete Antártico (WAIS).
Sus métodos incluyen mediciones y monitoreos sistemáticos de la superficie de los
glaciares en terreno (sistemas GPS, radio eco-sondaje, balance de masa y energía),
exploraciones aéreas y prospección con sensores activos (GPS, radar, altimetría
láser) y análisis digital de imágenes satelitales (espectro visible, infrarrojo y radar).
Proyectos destacados:
•Expedición Científica al Lago Ellsworth-Antártica, 2006.
•Exploración aérea de los glaciares del Mar de Amundsen y la Península
Antártica.
•Interacciones entre volcanes y glaciares de la Región de Los Lagos.
•Estudio de testigos de hielo someros en los Andes de Chile Central y
Patagonia.
•Desarrollo de métodos geofísicos y geodésicos para el estudio de los
glaciares.
FONDECYT 2008-2006:
•Past climate changes in Patagonia obtained from three high-altitude ice
cores (Incentivo a la cooperación internacional).
•Past climate changes in Patagonia obtained from three high-altitude ice
cores.
171
Capítulo VI: Estado del Arte Nacional
Departamento de Geofísica de la Universidad de Chile
http://www.dgf.uchile.cl
Descripción:
El Departamento de Geofísica de la Facultad de Ciencias Físicas y Matemáticas,
de la Universidad de Chile, realiza investigación avanzada y docencia de Pregrado y
Postgrado en Ciencias Atmosféricas, a través de su Grupo de Meteorología. El Grupo
de Meteorología realiza, también, labores de extensión y divulgación científica, así
como consultorías especializadas y de relevancia nacional.
Con una tradición de 40 años, el Grupo de Meteorología está formado por
siete académicos de jornada completa, de los cuales seis tienen una formación a
nivel de doctorado, y uno se encuentra en proceso de obtenerla en el MIT. El grupo
cuenta, además, con dos profesores de jornada parcial, y un número comparable de
asistentes de investigación y estudiantes de Postgrado. A través de su trayectoria, el
grupo ha sido pionero en la introducción de herramientas modernas de observación
y análisis de información atmosférica en el medio nacional. En la década de los
sesenta, introdujo el uso de imágenes captadas desde plataformas espaciales; en
la última década ha aplicado y difundido metodologías de pronóstico climático,
y, en los últimos años, ha fomentado la aplicación de modelos numéricos de la
atmósfera. En concordancia con el buen nivel alcanzado, el Grupo de Meteorología
participa activamente en programas internacionales de investigación cuyas
temáticas tienen un impacto en la región.
Áreas de Investigación:
La investigación que se realiza en el Grupo de Meteorología se ha orientado
tradicionalmente a la comprensión de fenómenos atmosféricos en Chile, América
del Sur y los océanos adyacentes. Esta investigación comprende tres áreas
principales: meteorología sinóptica y de mesoescala, climatología dinámica y
procesos radiativos.
El área de meteorología sinóptica y de mesoescala involucra el análisis
observacional, teórico y numérico de fenómenos asociados a los cambios
de tiempo atmosférico, incluyendo sistemas frontales, depresiones costeras,
convección sobre el Altiplano y circulaciones locales forzadas por la cordillera de
Los Andes. El desarrollo de estas dos áreas se ha visto fuertemente incrementado
por la posibilidad de realizar simulaciones numéricas de la atmósfera con creciente
fidelidad y rapidez, y la disponibilidad de sistemas de observación de resolución
local y cobertura global.
Los procesos físicos responsables de la mantención de las condiciones medias
de la atmósfera en la región Sud Americana, así como sus variaciones de largo plazo
172
Capítulo VI: Estado del Arte Nacional
(meses, años, décadas y tendencias seculares), son el objeto de estudio en el área
de climatología dinámica.
Sustanciales aportes se han realizado, por ejemplo, en la comprensión de la
extrema aridez del desierto de Atacama, el origen y variabilidad de la precipitación
altiplánica, el diagnóstico y predictibilidad de las variaciones interanuales de las
precipitaciones en la zona central y sur de Chile, y la detección de tendencias y
saltos climáticos en el cono sur de América durante el siglo XX.
Recursos e infraestructura:
El Departamento de Geofísica cuenta con una biblioteca especializada
y actualizada en Ciencias Atmosféricas, adecuada para las necesidades de
investigación y docencia, y una masiva base de datos atmosféricos y oceánicos
en formato digital. Adicionalmente, una moderna red de estaciones de trabajo
y computadores de multiproceso, programas especializados de computación
científica y equipos de soporte informático, permiten desarrollar actividades de
investigación y docencia computacionalmente complejas, como modelamiento
numérico, visualización científica, y manejo de grandes bases de datos.
El grupo cuenta, además, con acceso a información meteorológica en tiempo
real mediante recepción directa de imágenes satelitales de alta resolución y
conexión a Internet por medio de fibra óptica.
Sistemas de observación meteorológica en superficie (estaciones automáticas,
equipo de medición de balance de energía) y altura (equipo para radiosondeos
cautivos y libres), instrumentos de calibración y una vasta experiencia en su uso,
están disponibles para la docencia y los trabajos de investigación que requieren
mediciones en terreno.
FONDECYT 2008-2005:
•Extratropical source of interannual rainfall variability in Chile.
•Field Study of armospheric dust devils in the northern Chile.
•Intraseasonal rainfall variability in south-central Chile (35º-45ºS).
•Modeled and Empirical regional paleoclimate variability in western
Patagonia: Glacial versus interglacial conditions.
173
Capítulo VI: Estado del Arte Nacional
Centro de Modelamiento Matemático,CMM (Área Medio Ambiente),
Universidad de Chile
www.cmm.uchile.cl
Misión y visión:
La misión del CMM es crear nuevas matemáticas y usarlas para resolver
problemas de otras ciencias, la industria y las políticas públicas. Su finalidad es
desarrollar ciencia con los más altos estándares, los que guían asimismo sus
actividades en investigación industrial y educación.
Visualizamos al CMM como un centro de excelencia de clase mundial en
investigación y formación avanzada en matemáticas aplicadas, reconocido
internacionalmente como una plataforma para el modelamiento matemático
industrial con alto impacto en innovación.
Proyectos:
• El CMM es una de las principales entidades que participan en el proyecto
SAEMC.
Centro de Investigación Oceanográfica en el Pacifico Sur-Oriental
COPAS http://copas.udec.cl/
Descripción:
“Su objetivo es comprender la variabilidad climática y oceanográfica presente
y pasada en la región, sus impactos sobre los ecosistemas y la productividad
regional. Esta investigación se realiza en forma multi e interdisciplinaria. Abarca
diversas escalas espaciales y temporales. Se basa en observaciones directas,
análisis retrospectivos, trabajo experimental, y enfoques de modelamiento, y se
lleva a cabo a través de seis programas de investigación”.
Entidades participantes:
Universidad de Concepción y Universidad Austral de Chile (asociada).
Temas de Investigación:
• Variabilidad oceanográfica tropical y subtropical a gran escala (El Niño
Oscilación del Sur ENSO, decadal/interdecadal) y su interacción con
procesos oceanográficos locales (surgencia, estructuras de mesoescala):
consecuencias en la biogeoquímica, circulación y ecología presente y
pasada del Pacífico Sur-Oriental.
• Estructura, funcionamiento y dinámica de la Zona de Mínimo Oxígeno
174
Capítulo VI: Estado del Arte Nacional
OMZ en el Pacífico Sur-Oriental: su rol en el sistema climático y los efectos
del cambio climático global sobre ella.
• Oceanografía del sur de Chile, incluyendo el sistema de fiordos y canales:
circulación, masas de agua, Deriva del Oeste, variabilidad presente y pasada
de la productividad biológica y los ciclos biogeoquímicos.
FONDECYT 2008-2005:
•Autotrophic processes and greenhouse gases cycling on the continental
shelf off central Chile (32-38º S).
•N2O consumption at the oxygen minimum zone and its boundaries of the
eastern South Pacific.
Departamento Geofísica (DGEO, Universidad de Concepción
www.dgeo.udec.cl/index.htm
Descripción
“Crear las condiciones adecuadas para el desarrollo y fortalecimiento de las
ciencias geofísicas a través de la investigación científica, la docencia y la extensión
hacia los estudiantes, profesionales y la sociedad en su conjunto. De esta forma el
Departamento de Geofísica contribuye al desarrollo económico y social del país y a
la preservación de la vida y el medio ambiente de nuestro planeta”.
Integrantes
Actualmente lo conforman once académicos en jornada completa y uno en
jornada parcial.
FONDECYT 2008-2004
•The dynamic of waters on the inner shelf in a upwelling region: The role of
winds, river discharges and coastline.
•Theoretical study of the atmospheric dust devil.
•Interaction of low frequency waves, mesoscale eddies and phytoplankton
biomass in the Peru-Chile Current System
Otros Proyectos:
•Variabilidad climática en Chile: evaluación, interpretación y proyecciones
en Chile: evaluación, interpretación y proyecciones.
•Sistema Integrado de Registro de Corrientes y Olas (SIRCO) aplicado al
monitoreo, la modelación y el diagnóstico de bahías, fiordos y zonas costeras.
175
Capítulo VI: Estado del Arte Nacional
Centro de Investigación y Transferencia en Riego y Agroclimatologia
(CITRA, Universidad de Talca)
www.citrautalca.cl
Descripción
Ciertamente la prioridad de este Centro no es la variabilidad del clima, pero sí
lo es la relación con las consecuencias que para la agricultura podría tener el cambio
climático en las necesidades de agua de los cultivos, descenso pluviométrico,
aumento de las temperaturas, déficit de horas-frío y pérdidas de la estacionalidad
de las variables agrometeorológicas.
Misión
Realizar investigación científica y aplicada en el ámbito del riego,
modelamiento biomatemático y agricultura de precisión; transferir sus resultados
al sector productivo y apoyar la docencia de pre-grado y post-grado en la Facultad
de Ciencias Agrarias de la Universidad de Talca.
Visión
Posicionarse como un Centro de referencia Nacional e Internacional,
que contribuya a la optimización del uso del agua a nivel predial a través de la
incorporación de técnicas de manejo con alto nivel tecnológico, no solo para la
obtención de altos rendimientos y calidad de los productos agrícolas sino también
para minimizar sus costos y preservar el medio ambiente.
Investigadores dedicados al estudio del clima
Tres investigadores de catorce que participan en el centro.
Proyectos:
•Sistema de Alerta Temprana sobre la base de una red de Estaciones
Meteorológicas automáticas en Tiempo Real.
176
Capítulo VI: Estado del Arte Nacional
Laboratorio de Climatología (Universidad de Magallanes)
www.umag.cl/climatologia/schythe.htm
Descripción:
Consciente de la importancia del conocimiento del clima regional como
base para la planificación y desarrollo de todas las actividades humanas, en 1971
el Instituto de la Patagonia inició un Programa de Información y Documentación
Climática con el objetivo de avanzar en el conocimiento del clima de Magallanes.
Para lograr este avance en el conocimiento del clima regional se inició, en 1971,
una labor que incluye:
•La observación y registro de datos meteorológicos, a través de la creación
e instalación de la estación climática Jorge C. Schythe , la que , al paso de un
corto tiempo, comenzó a operar en convenio de colaboración científica con
la Dirección General de Aguas (DGA) dependiente del Ministerio de Obras
Públicas, la Dirección Meteorológica de Chile (DMC) y la Empresa Nacional
de Petróleo (ENAP).
•La recopilación de antecedentes climáticos históricos y actuales de la
región, creándose con esto un archivo de datos climáticos.
Infraestructura:
•Estación tradicional (requiere de un observador)
•Estación automática.
•Estación satélite.
Proyectos:
El personal de este laboratorio fue invitado a participar en el proyecto CEQUA
(www.cequa.cl) para integrar un grupo de Climatología. Paralelamente, un
proyecto para instalar estaciones meteorológicas automáticas en el canal Beagle
se gestionaba con la Patagonia Research Fundation (PRF), con base en Puerto
Williams, a través de su representante legal, Charles Porter.
177
Capítulo VI: Estado del Arte Nacional
Centro de Estudios del Cuaternario Fuego-Patagonia y Antártica
www.cequa.cl
Antecedentes y objetivos
A principios del año 2002, el Gobierno Regional de Magallanes y Antártica
Chilena, en conjunto con la Universidad de Magallanes, el Instituto Antártico
Chileno y el Instituto de Fomento Pesquero, se unieron en torno a una iniciativa
que se consolidó cuando el Consejo Nacional de Ciencia y Tecnología aprobó la
creación del “Centro de Estudios del Cuaternario de Fuego-Patagonia y Antártica
Chilena”, CEQUA. El costo total del proyecto CEQUA, que tiene una duración de
cinco años, asciende a un total de 2000 millones de pesos, los que son aportados
en partes iguales por CONICYT y el Gobierno Regional de Magallanes y Antártica
Chilena.
El objetivo es crear un centro de investigación científica multidisciplinario y
de nivel internacional, enfocado a estudios de la evolución Cuaternaria del medio
ambiente natural en el extremo sur de Sudamérica y Antártica, particularmente el
establecimiento de las grandes masas de hielo, su retiro y posterior colonización
biótica y humana.
Se pretende formar una masa crítica de investigadores jóvenes en Punta
Arenas, capaces de caracterizar el medio ambiente pasado, actual y la evolución
futura de la región, en un medio ambiente cuyas características son únicas en el
mundo, puesto que Fuego-Patagonia es un laboratorio natural considerado clave
para entender los procesos de glaciación y desglaciación ocurridos desde 1.8
millones de años hasta el presente.
La hipótesis de trabajo fundamental plantea que las fluctuaciones climáticas y
glaciales durante las últimas glaciaciones y presente interglacial en Fuego-Patagonia
y Antártica, han afectado profundamente la geomorfología, la hidrogeología y
la evolución del medio ambiente en general, incluyendo colonización biótica y
poblamiento humano.
Grupo de Climatología
Sus objetivos:
•Mediante la instalación de estaciones automáticas, cubrir con registros de
variables meteorológicas, la zona sur de Magallanes (Canal Beagle y zonas
adyacentes) que carece de información.
•Análisis de la información y comparación con otras estaciones de registro
más largo.
178
Capítulo VI: Estado del Arte Nacional
•Entregar un estado del escenario de la influencia antártica en el extremo
sur del continente americano y, particularmente, de esta sensible zona como
contribución a los estudios del cambio global.
Integrantes:
El Laboratorio de Climatología de la Universidad de Magallanes.
•Ariel Santana Aguila
•Nicolás Butorovic Alvarado, candidato a Doctor en Ciencias Atmosféricas
en la Universidad Complutense de Madrid.
•Carlos Olave
FONDECYT 2008:
•Late –Holocene glacier fluctuations in the Andes of southern Chile: MultiCriteria dating approach integrating high-resolution dendroglaciologic
methods with lichenometry, tephrochronology and stratigraphic analysis.
Con este simple catastro se puede apreciar cómo la gran mayoría de los
proyectos vienen de cuatro grupos, a saber: Universidad de Chile, Universidad de
Concepción, Centro de Estudios Avanzados en Zonas Áridas y Centro de Estudios
Científicos. Lo cual se confirma al constatarse que son ellos quienes se han
adjudicado la gran mayoría de los recursos Fondecyt de cada año.
Otro dato importante es el número de publicaciones ISI que han generado
los proyectos llevados a cabo en Chile. Se puede afirmar que desde el año 2005
hasta la fecha, la cantidad de publicaciones ISI exclusivas del área de meteorología
y ciencias atmosféricas llega, aproximadamente, a 80. Esto supera con creces lo
logrado en el período 2000-2005, donde se sumaron 56 publicaciones135.
135
Documento “Análisis de Proyecciones de la ciencia chilena 2005”.
179
Capítulo VI: Estado del Arte Nacional
6.2 Proyectos a nivel nacional
Nombre del Proyecto:
Proyecto ACT-19 (http://www.dgf.uchile.cl/ACT19)
Instituciones:
Universidad de Chile136,
Meteorológica de Chile138.
Universidad
de
Concepción137,
Dirección
“El proyecto incluye además la participación de un investigador del IMK-IFU
(Alemania) y un estrecha vinculación con centros de investigación tales como el
Centro de Investigaciones del Mar de la Atmósfera (CIMA) de la U. de Buenos Aires,
el Byrd Polar Research Center (BPRC) de la Universidad de Ohio, el Departamento
de Geofísica de la U. de Copenhagen, el Laboratoire d’Etudes em Geophysique et
Oceanographie Spatiales (LEGOS) en Toulouse, el Centro de Previsao de Tempo
e Etudos Climaticos (CPTEC) en Brasil, así como vinculación con programas
internacional de investigacion tales como CLARIS, CLIVAR-VAMOS y CLIVARPacific”139.
Descripción:
“La variabilidad del sistema climático (atmósfera/océano) en todas sus
escalas temporales (intraestacional, interanual, interdecadal y secular) tiene un
significativo impacto socioeconómico en un país como Chile, que basa fuertemente
su desarrollo en una explotación intensiva de sus recursos naturales. Del mismo
modo, existe un creciente interés a nivel mundial por mejorar la comprensión de
la variabilidad climática global y prever los eventuales impactos antropogénicos
sobre el clima futuro. De hecho, el Panel Intergubernamental sobre Cambio
Climático Global (IPCC) publicará en 2007 un nuevo informe en el cual se incluirán
los avances alcanzados por la comunidad científica hasta el presente año. En este
contexto, este proyecto está dirigido a la realización de un trabajo complementario
y único a nivel regional, tendiente a mejorar la comprensión de la variabilidad del
sistema climático relevante para Chile, en sus componentes atmosférica y oceánica,
y evaluar los posibles impactos del calentamiento global de origen antropogénico
en el clima regional”.
136 http://www.uchile.cl
137
http://www.udec.cl
138
http://www.meteochile.cl
139
http://www.dgf.uchile.cl/ACT19
180
Capítulo VI: Estado del Arte Nacional
“El proyecto está estructurado en tres etapas. El objetivo principal de la
primera de ellas es evaluar la variabilidad del sistema climático regional durante las
décadas más recientes en las distintas escalas temporales, comparándolo con las
fluctuaciones climáticas a nivel global. Para alcanzar este objetivo se analizaron con
apoyo de técnicas estadísticas convencionales series de variables meteorológicas y
oceanográficas registradas durante periodos de varias décadas.
“El segundo objetivo general del proyecto es la identificación de mecanismos
físicos que explican aspectos no conocidos de la variabilidad del sistema climático
regional, mediante la realización de estudios de diagnóstico. Para esto se buscan
relaciones entre variaciones locales de las condiciones atmosféricas y oceánicas y
procesos o fenómenos de gran escala, mediante un uso cuidadoso de técnicas de
análisis multivariados (EOF, SVD, CCA, etc.). La síntesis e interpretación de los modos
de co-variabilidad entre los patrones de anomalías de circulación de gran escala
y variables de clima local obtenidas con técnicas estadísticas da lugar a modelos
conceptuales que deben respetar las leyes físicas que rigen a la circulación de la
atmósfera y el océano.
“El tercer objetivo general del proyecto es evaluar las condiciones más
probables del sistema climático regional en un escenario futuro caracterizado por
un efecto invernadero intensificado. Este es el aspecto más innovador del proyecto,
puesto que incluye el desarrollo de una capacidad nueva a nivel nacional para
analizar la variabilidad climática regional y su proyección en el futuro mediante la
aplicación de modelos climáticos regionales, tanto atmosféricos como oceánicos,
que requieren un gran capacidad computacional”.
Recursos del proyecto
Hardware:
•1 cluster Linux (16 CPUs AMD Opteron).
•12 servidores Linux, 8 CPUs cada uno.
•16 estaciones de trabajo Linux/Windows, apoyando las actividades
enseñanza.
•15 Terabytes de capacidad de almacenamiento.
Software:
•Modelos: MM5, single column MM5, WRF, WRF-Chem, ROMS, CALMET,
RCA, MATCH, PRECIS.
•Software Especializado: GrADS, HYSPLIT, GEMPAK, IDV, Grace, NCL, NCO,
CDAT
•Software General: Matlab, ENVI, ARCGis, IDL, GMT,
•Software en Desarrollo: PGI's full suite, Intel's compilers, MPICH
181
Capítulo VI: Estado del Arte Nacional
Sistemas de observación:
•GOES High resolution Ground Station (GTI Electronics)
•10 estaciones de tiempo automáticas full equipo (Campbell Sci.); con
sensores de repuesto para la temperatura del aire y la humedad, viento,
presión atmosférica, radiación solar, temperatura de la tierra, economizador
de energía y equipo de calibración.
•1 AIR radiosonde and tethered balloon station.
•1 Pilot balloon system.
•1 Laser ceilometer.
Humanos:
En la realización de esta tarea multidisciplinaria participa un grupo de trece
científicos, especialistas en ciencias atmosféricas y oceanográficas, pertenecientes
al Departamento de Geofísica de la Universidad de Chile (DGF), al Departamento
de Física de la Atmósfera y del Océano (DEFAO) y al Programa Regional de
Oceanografía Física y Clima (PROFC), ambos de la Universidad de Concepción,
y a la Dirección Meteorológica de Chile (DMC). Además de los vínculos con las
instituciones anteriormente nombradas.
Relación con el ámbito docente:
El proyecto tiene una fuerte componente de formación de especialistas
de alto nivel en ciencias atmosféricas y en oceanografía física, mediante el
financiamiento de tesis de postgrado y puestos de investigadores postdoctorales. A
nivel institucional, el proyecto favorece y fomenta el desarrollo de una vinculación
de carácter permanente entre los dos grupos de investigación más activos a nivel
nacional en estudios de aspectos físicos del cambio climático regional. Desde el
punto de vista de innovación tecnológica, este proyecto abre la posibilidad de
desarrollar una capacidad de nivel internacional en estudios de modelamiento
oceánico y atmosférico, lo que aumenta el atractivo de los programas de postgrado
asociados a la iniciativa, y favorece la visita de científicos de la región.
Impacto en los sectores público y privado:
“A nivel nacional el proyecto, y en particular las actividades de difusión
asociadas al mismo, contribuirán a posicionar el tema de la variabilidad climática
y sus impactos socioeconómicos en la agenda científica nacional, y en los sectores
productivos y de servicios afectados por ella, y dar respuesta objetiva sobre los
posibles impactos del calentamiento global de origen antropogénico en Chile”140.
Áreas: Agricultura, Minería, Pesca.
140 182
http://www.dgf.uchile.cl/ACT19
Biociencia
Capítulo VII: Estado del Arte Internacional
7 Capítulo VII:
Estado del Arte Internacional
7.1
Introducción
La Biología Molecular ha utilizado Computación de Alto Desempeño desde los
trabajos de M. Dayhoff en 1947 en su tesis doctoral y los siguientes estudios acerca
de la estructura molecular de las proteínas, que junto a la Química Computacional,
han sentando las bases de la Bioinformática. Por otro lado la Medicina ha ido
acumulando información de pacientes la cual ha permitido desarrollar tratamientos
y medicamentos más precisos. Los mayores requerimientos de memoria y capacidad
de análisis, así como las nuevas tecnologías para secuenciar el genoma y obtener
imágenes de alta resolución han hecho que diferentes grupos de investigación
compartan información generando redes de investigación a niveles nacionales y
continentales.
Estos grupos han generado nuevas instituciones que son verdaderas bibliotecas
de información como el NCBI, el EMBL y el DBBJ, además de ir construyendo
motores de búsquedas, como blast, que puedan filtrar y analizar la información
almacenada. Como ejemplo, el banco de genoma internacional GenBank ha
mostrado un crecimiento exponencial en los últimos años, duplicándose alrededor
de cada siete meses, lo que hace sospechar que para fines del 2010 se obtengan 10
veces más información que la del 2009.
185
Capítulo VII: Estado del Arte Internacional
Growth of GenBank
(1982-2008)
100
100
90
90
80
80
70
70
60
60
50
50
40
40
30
30
20
20
Base Pairs
Secuences
10
10
0
0
1982
1985
1990
1994
1998
2002
2006
Figura 10. Gráfico del crecimiento del GenBank (fuente: Genbank)
Solamente este ejemplo muestra que la red de colaboración tendrá también
que aumentar considerablemente para generar y analizar esta información (Figura
10). Por otro lado la Química Computacional ha trabajado en el desarrollo de
equipamiento (Figura 11) y programas computacionales. Estos permiten el análisis
molecular de estructuras orgánicas e inorgánicas potenciando el desarrollo de
productos biotecnológicos de alto rendimiento como biofilms y medicamentos.
186
Capítulo VII: Estado del Arte Internacional
Figura 11. Máquina MMS para gráfica molecular, Universidad de Washington.
Hoy en día tanto el equipamiento como el software se han especializado
requiriendo capacidades mayores de recursos computacionales, transformándose
así en una necesidad en la investigación y el desarrollo de productos farmacéuticos.
Por otro lado, también se ha potenciado su uso en Biomedicina accediendo a
apoyar el desarrollo de investigación en una nueva área. En particular, las grids han
permitido compartir información valiosa y escasa (como exámenes médicos y sus
diagnósticos) permitiendo mejoras en la interpretación de exámenes ayudando
a realizar tratamientos preventivos tempranos en beneficio del bienestar de la
población.
Para nuestro país, contar con dichos recursos de manera compartida
potenciará el desarrollo científico y tecnológico al permitir a los investigadores
compartir equipamiento de alto desempeño, nuevas bases de datos, herramientas
de análisis, además de integrarse a la comunidad internacional. Los numerosos
proyectos grids internacionales muestran que esta área ha sido muy beneficiada
con estas tecnologías y que Chile tiene el potencial de integrarse.
187
Capítulo VII: Estado del Arte Internacional
7.2 Tendencias de investigación en Biociencias
El uso de recursos computacionales para almacenar y analizar información
genética y médica ha llevado al desarrollo de numerosas páginas web de servicios
creadas por diferentes instituciones. La gran cantidad de información y de interés
en analizar grandes cantidades de datos, ha permitido que muchos proyectos
grids se hayan desarrollado en el ámbito de las Biociencias. El uso de herramientas
bioinformáticas de manera masiva, como blast, permiten el desarrollo de
aplicaciones grid distribuidas. Problemas de búsquedas de homólogos de genes y
proteínas se han atacado en diversos proyectos grids. Por otro lado, simulaciones
moleculares permiten desarrollar nuevos medicamentos donde los recursos
computacionales de alto rendimiento son fundamentales. Por último la generación
de grandes cantidades de datos genómicos requieren una constante revisión
de los resultados obtenidos. Así, los investigadores en Biología Molecular están
constantemente apoyando sus investigaciones con consultas a bases de datos y
uso de recursos distribuidos. En el caso de problemas más específicos, ellos se han
organizado para crear grids de dedicación exclusiva donde tanto las herramientas
de análisis como las bases de datos se comparten de manera segura.
Otra fuente de aplicaciones en grid han sido los proyectos de información
médica de pacientes con el objetivo de mejorar y acelerar pronósticos de
enfermedades. Junto con ello, por medio de nuevas aplicaciones grids, se han
creado nuevas capacidades de análisis de imágenes que han permitido apoyar la
toma de decisiones en la formulación de diagnósticos. Las necesidades de conectar
diferentes hospitales han llevado a que las tecnologías grid ofrezcan una solución
segura de acceso remoto a la información privada y de una fácil interacción por
medio de interfaces amigables. Esta colaboración no sólo ha potenciado la
investigación médica, sino que además se ha mejorado la calidad de vida de los
usuarios.
Todas estas aplicaciones también han motivado el desarrollo de nuevos
middlewares y herramientas que poseen características propias de los problemas
a resolver, por ejemplo, interfaces amigables para el análisis de imágenes y
muestra de resultados o también estándares de almacenamiento y uso. De
esta manera tanto la Biociencia como la Computación Grid se han beneficiado
mutuamente en su colaboración. Esta evolución conjunta justifica la continua
creación e implementación de nuevos proyectos grids facilitando la integración
de investigadores nacionales a las grids internacionales de probado éxito. Debido
al creciente número de iniciativas, Chile está invitado a ser un nuevo usuario de
la Computación Grid. Cabe destacarse que ha sido tal el número de proyectos
188
Capítulo VII: Estado del Arte Internacional
y su importancia que en mayo 2009 ha publicado Handbook of Research on
Computational Grid Technologies for Life Science, Biomedicine, and Healthcare,
editado por Mario Cannataro de la University Magna Gracia de Catanzaro, Italia,
de la editorial IGI-Global, 1050 páginas en dos volúmenes. En esta obra se resumen
tanto las iniciativas como las tecnologías utilizadas en la Computación Grid para
Biociencias.
7.3 Iniciativas Internacionales: e-Infraestructuras
para el desarrollo de la e-Ciencia
Estas iniciativas se pueden separar en proyectos de desarrollo de aplicaciones
grid experimentales en apoyo a las Biociencias y proyectos grids de desarrollo
de middleware específico y de aplicaciones científicas desarrolladas sobre estas
plataformas.
Las diferentes iniciativas centradas en universidades y laboratorios han sido
desarrolladas para resolver un problema específico, pero al no contar con una
mayor colaboración no han podido potenciar la investigación de dichos grupos.
Mencionaremos algunos casos en la sección 2.4, por ejemplo Squid.
Por otro lado, los proyectos de colaboración nacional, como eDiamond sobre
cáncer mamario tratados en hospitales públicos, han tenido un financiamiento
gubernamental que les ha permitido capacitar recurso humano, instalar
infraestructura grid y reunir a los potenciales beneficiarios de la investigación. Sus
resultados son exitosos en todo sentido, en particular en el bienestar de las mujeres
extendiendo su esperanza de vida.
Finalmente los proyectos europeos han tenido aún mayor impacto. El proyecto
EGEEE financiado por el Programa Marco FP6 ha generado 16 aplicaciones grids en
Biomedicina. Por otro lado, el proyecto EELA-2 del FP7 (Figura 12) ha generado 60
proyectos de desarrollo de aplicaciones grid en diferentes áreas de investigación
y desarrollo, de ellas 25 iniciativas corresponden a las áreas de Biociencias
(Bioinformática, Medicina, Biomedicina, Química Computacional y Ciencias de la
Vida). Esta es la iniciativa que ha mostrado ser exitosa en su diseño por lo que ha
permitido la fácil integración de equipos de trabajos sin requerir muchos recursos
computacionales, realizando escuelas de capacitación y financiando reuniones de
colaboración. Además, los resultados de investigación de estos proyectos ha sido
189
Capítulo VII: Estado del Arte Internacional
muy significativa y se espera que continúen en aumento con la continuación, el
proyecto Gisela. GISELA tiene por objetivo garantizar la sostenibilidad a largo plazo
de la UE-e-Infraestructura, y así garantizar la continuidad y el fortalecimiento de la
Investigación de las Comunidades Virtuales Unión Europea - América Latina, para
este fin, el proyecto se centrará en dos objetivos interrelacionados: implementar un
modelo de sostenibilidad de las iniciativas grid en LatinoAmerica y proporcionar
VRCs (Centro de Recursos Virtuales) con la E-Infraestructura adecuada y que
permitan dar servicios a las aplicación desarrolladas.
PROYECTO EUROPA LATINOAMÉRICA
E- infraestructure shared between Europe and
Latin America
1.7 M€ / ~ 2.5. M€
E-science grid facility for Europe and latin America
~ 2.1. M€ / ~ 4.4. M €
Grid Initiatives for e-Science virtual communitie s
in Europe and Latin America (GISELA)
2006
2007
2008
EELA
JAN
2009
2010
EELA-2
DEC APR
2013
GISELA
MAR
Figura 12. Iniciativa EELA, EELA2 y Gisela.
7.3.1 Descripción tecnológica de la e-infraestructura
La mayoría de los sitios de desarrollo de aplicaciones no entregan información
acerca de la infraestructura presente (computadores, servidores, bases de datos) y
solamente se remiten a entregar información de las aplicaciones desarrolladas, su
uso y área de aplicación y opcionalmente el middleware utilizado para el desarrollo,
donde Globus posee la mayor cantidad de citas.
190
Capítulo VII: Estado del Arte Internacional
En el caso de proyectos grids, EELA tuvo una primera fase donde se desarrolló
una infraestructura de 730 cpus y 60 TB de almacenamiento. Hoy en día se han
alcanzado 3000 cores y 600 TB en 41 centros de Europa y América Latina. En cambio
EGEE posee aproximadamente 150.000 cores, 28 PB de disco y 41 PB de cinta de
almacenamiento, reuniendo a 250 centros de investigación de Europa. Acerca del
middleware, ambos proyectos se basan en gLite (glite.web.cern.ch/glite/).
Para los proyectos nacionales, podemos comentar que eDiamond fue un
proyecto de tres años con 4.1 millones de libras que permitió crear la infraestructura
necesaria para desarrollar el proyecto grid. EELA tuvo un presupuesto de 2,5
millones de euros para dos años. Finalmente EGEE también tuvo una duración de
dos años y un financiamiento de 32 millones de euros solamente de la Comisión
Europea con un total estimado de 100 millones de euros con casi 10 mil personas
involucradas de un total de 250 organizaciones de 55 países.
7.3.2 Descripción de Iniciativas
Debido al gran número de iniciativas, estas serán separadas geográficamente
en tres: latinoamericanas, europeas y otras aplicaciones. Esta división tiene el
propósito de ver cómo los proyectos latinoamericanos han sido casos de grid en
Biociencias más cercanos a la realidad chilena. En el caso de los proyectos europeos,
en general han contado con apoyo de la Comunidad Europea buscando integrar
a sus países miembros y han contado con gran financiamiento. Finalmente, otros
casos que han sido ejemplos de grids colaborativas en torno al tema de iniciativa
local más que gubernamental.
7.3.2.1 Latinoamérica
7.3.2.1.1 BioMD (EELA 2, UFRJ, Brasil)
http://applications.eu-eela.eu/application_details.php?l=20&ID=50
La dinámica molecular es una herramienta poderosa para investigar la
estabilidad, cambios conformacionales y estructurales a nivel atómico de biocomplejos moleculares. En los últimos años, el enfoque de diseño racional de
drogas, se basa en explorar el concepto complementario estructural para generar
antagonistas específicos para las moléculas objetivo. Conocer en detalle la estructura
espacial de las enzimas por medio de herramientas computacionales y la ayuda
191
Capítulo VII: Estado del Arte Internacional
de un banco de datos estructurales,
permite identificar las moléculas
cuya especificidad puede coincidir
con el sitio activo de la enzima. El
análisis dinámico de una enzima
es necesario para comprender su
función y la interacción con sus
inhibidores a escala atómica. Así, los
modelos teóricos de simulaciones se
valen de la Dinámica Molecular (MD)
con el fin de extraer información
valiosa. La computación en Grid
ayuda a minimizar el tiempo de
cálculo de la simulación.
7.3.2.1.2 BioSys (EELA 2, UCI y CIM, Cuba)
http://applications.eu-eela.eu/application_details.php?l=20&ID=68
La Biología de Sistemas consiste en entender los diferentes procesos
biológicos que ocurren de manera simultánea (reacciones químicas, formación
de proteínas, concentraciones de iones, etc.) El entendimiento de estos sistemas
necesita de altos recursos computacionales de simulación que integre algoritmos
de estimación de parámetros, data mining, análisis de sistemas, entre otros.
La aplicación grid utiliza varios algoritmos que simulan las partes del sistema
y las integra por medio de herramientas grids.
7.3.2.1.3 CardioGrid Portal (EELA 2, UBA, Argentina)
http://applications.
eu-eela.eu/application_
details.php?l=20&ID=15
El proyecto consiste
en la construcción de un
portal, permitiendo a los
médicos e investigadores el
acceso a una base de datos
médica para el manejo de la
información del paciente y
de sus respectivos archivos
médicos,
especialmente,
electrocardiogramas.
192
Capítulo VII: Estado del Arte Internacional
CardioGrid tiene la capacidad de analizar electrocardiogramas a través de un
conjunto de algoritmos de procesamiento de señal, almacenando y visualizando
los resultados en línea.
El electrocardiograma, no consume gasto excesivo de computación. Sin
embargo, cuando existe una gran cantidad de pacientes y cada estudio toma
mucho tiempo, el tiempo de cálculo toma un papel preponderante en el buen
funcionamiento del portal web. Por esta razón se propone una solución basada
en la tecnología Grid que permita la escalabilidad requerida por el proyecto. Una
vez conectado a CardioGrid, los investigadores pueden acceder y compartir datos
experimentales, herramientas para el análisis de datos y modelos computacionales
relacionados con el funcionamiento de los individuos.
7.3.2.1.4 DicomGrid (EELA 2, InCor-USP, Brasil)
http://applications.eu-eela.eu/application_details.php?l=20&ID=9
La disponibilidad de conjuntos de datos de imágenes médicas de gran
envergadura y la enorme capacidad de procesamiento puede permitir el
desarrollo de nuevas técnicas de visualización, nuevos algoritmos de detección
(detección del cáncer, diagnóstico de Alzheimer precoz) y nuevas técnicas de
procesamiento (segmentación de imágenes, reconocimiento de patrones y fusión
de imágenes). Hoy en día las imágenes se utilizan en los hospitales sólo como
parte de los procedimientos de rutina, mientras se ignora su valor intrínseco para
la investigación. Esto se debe a las dificultades para almacenar enormes cantidades
de datos, las limitaciones de computación para procesar grandes cantidades de
datos y razones legales.
DicomGrid propone crear un almacenamiento distribuido de imágenes
médicas, los cuales pueden ser utilizados por los investigadores para probar
nuevas técnicas de procesamiento utilizando la potencia de cálculo que ofrece la
tecnología Grid. La idea es también poder contar con grandes cantidades de datos
que pueden ofrecer una distribución estadística significativa de una enfermedad
en particular.
7.3.2.1.5 Dist-SOM-PORTRAIT (EELA 2, UnB, Brasil)
http://applications.eu-eela.eu/application_details.php?l=20&ID=63
Hoy en día, los experimentos han demostrado que algunos tipos especiales
de ARN pueden controlar la expresión de genes y el fenotipo, además de su papel
tradicional de permitir la síntesis de proteínas. El ARN se puede dividir en dos clases:
los ARN mensajeros (ARNm), que se traducen en proteínas y ARN no codificantes
(ncRNAs), que desempeñan varias funciones celulares importantes. En los últimos
193
Capítulo VII: Estado del Arte Internacional
años, varios métodos de cálculo se han propuestos para distinguir los ARNm de los
ncRNAs, utilizando diferentes teorías y modelos. Un modelo de red neuronal, es un
modelo eficiente para esto: Self-Organizing Maps (SOM).
Se propone un método para identificar ARN no codificantes utilizando SOM,
llamado SOM-PORTRAIT. Con el fin de acelerar el uso de SOM-PORTRAIT, se propone
Dist-SOM-PORTRAIT. Básicamente éste funciona de la siguiente manera: en primer
lugar, el archivo de entrada FASTA se dividirá en tantas partes como al usuario defina
y cada una de estas porciones se almacenará en un archivo separado, entonces un
trabajo se creará para todos estos archivos separados, y finalmente se ejecutará en
una infraestructura GRID.
7.3.2.1.6 DistBLAST (EELA 2, UnB, Brasil)
http://applications.eu-eela.eu/application_details.php?l=20&ID=49
BLAST es un software ampliamente utilizado para la aproximación de la
comparación de secuencias biológicas. Incorpora los conocimientos biológicos en
su método, y es extremadamente eficiente en el tiempo, pero usa bases de datos
muy grandes. A fin de acelerar su proceso, se propone DistBLAST. Esta aplicación
es usada para la genómica comparativa, ya que muchos de los métodos de cálculo
utilizados en este ámbito usan BLAST como una herramienta básica.
7.3.2.1.7 G-HHMER (EELA 2, UNIANDES, Colombia)
http://applications.eu-eela.eu/application_details.php?l=20&ID=57
HMMER es una implementación de Modelos de Markov Ocultos (Hidden
Markov Model), para búsquedas en bases de datos mediante alineamientos
múltiples de secuencias. En otras palabras, es un conjunto de programas que
permiten analizar múltiples alineaciones utilizando métodos probabilísticos.
El objetivo es exportar HMMER a la grid, llamada Grid-enabled HMMER (GHMMER), por el desarrollo del Bioinformatic Grid Wrapper (BGW), basado en PHP
y Command Line Interface (CLI) usado para crear, presentar y solicitar trabajos en
múltiples redes a través de la web.
7.3.2.1.8 G-InterProScan (EELA-2, UNIANDES, Colombia)
http://applications.eu-eela.eu/app_list.php?l=20
Es una herramienta que gridifica la aplicación InterProScan e integra
información de familias de proteínas, sus dominios y sitios, usando diferentes
metodologías para derivar firmas de proteínas (identificadores únicos).
194
Capítulo VII: Estado del Arte Internacional
7.3.2.1.9 GrEMBOSS (EELA-2, UNAM, México)
http://applications.eu-eela.eu/application_details.php?l=20&ID=11
Nuevamente la idea es gridificar la aplicación EMBOSS de análisis de secuencias
genómicas, la cual reúne una amplia información para realizar los análisis.
EMBOSS (European Molecular Biology Open Software Suite) de EMBnet
(European Molecular Biology Network) es un paquete de software gratuito Open
Source desarrollado para el análisis de la bioinformática. Con EMBOSS se puede
hacer: Alineamiento de secuencias; búsqueda rápida de base de datos con los
patrones de secuencia; identificación de proteínas, incluyendo el análisis de
dominio, análisis de patrones de secuencias de nucleótidos, y análisis de uso de
codones para genomas pequeños.
7.3.2.1.10 GRIP (EELA-2, UFRO, Chile)
http://cmcc.ufro.cl/doku.php?id=Tratamiento_De_Imagenes
El proyecto Grid Image
Processing (GRIP) busca gridificar
el análisis de las imágenes
biomédicas utilizando diferentes
algoritmos de procesamiento de
imágenes que permite ayudar a la
toma de decisiones en la detección
de patrones correspondientes
a enfermedades y acelerar los
tiempos de diagnósticos. El
objetivo del análisis, consiste en la
identificación y el conteo de células
cancerígenas en una imagen de
tejido mamario, donde los núcleos
son teñidos mediante la utilización de técnica inmunohistoquímica.
7.3.2.1.11 Heart Simulator (EELA 2, UFJF, Brasil)
http://applications.eu-eela.eu/application_details.php?l=20&ID=12
Esta aplicación simula la actividad eléctrica en el tejido cardíaco. Las ecuaciones
de bidomain se utilizan para este fin, ya que son especialmente importantes para
modelar con precisión la estimulación extracelular. Sin embargo, la solución de las
ecuaciones es computacionalmente costosa debido a la discretización espacial
y temporal, y esto limita el tamaño y la duración del problema que puede ser
modelado. Independientemente de la forma específica en la que han sido emitidos,
el cuello de botella del cálculo se convierte en la solución reiterada de un sistema
195
Capítulo VII: Estado del Arte Internacional
grande y lineal. Así que la simulación sólo sería posible hoy en día en un entorno
Grid.
7.3.2.1.12 HeMolab (EELA 2, LNCC, Brasil)
http://www.lncc.br/prjhemo/main.htm
La principal
preocupación de
este proyecto es
el desarrollo de
modelos, técnicas
y
herramientas
computacionales
para la simulación
del
sistema
cardiovascular
humano.
Al transferir
las
innovaciones
científicas a la comunidad médica, se espera tener una gran contribución en la
comprensión del funcionamiento de este sistema, la asistencia en la prevención,
diagnóstico, terapia y rehabilitación cardiovascular de las patologías más diversas.
7.3.2.1.13 HPC Structure (EELA 2, CIP, Perú)
Structure es un software desarrollado por J.K. Pritchard. Utiliza datos de
múltiples genotipos para investigar la estructura de la población. Sus usos incluyen
inferir la presencia de distintas poblaciones, la asignación de los individuos a la
población, el estudio de zonas híbridas, entre otros. Structure utiliza MCMC (Markov
Chain Monte Carlo) para sus cálculos., donde estos obtiene mejores resultados
cuando se realizan más iteraciones del análisis, resultando tareas muy intensivas
en la CPU, la cual puede correr durante horas en los computadores actuales.
HPC Structure es un conjunto de herramientas que permiten al investigador a
realizar análisis de estructura en paralelo disminuyendo el tiempo de análisis.
7.3.2.1.14 Integra-EPI (EELA 2, Mackenzie, Brasil)
http://telemedicina.unifesp.br/set/projetos/integraepi/entrada.php
El servicio de integración de datos de INTEGRA-GISE fue desarrollado
para obtener datos de múltiples fuentes a través de un único punto de acceso.
196
Capítulo VII: Estado del Arte Internacional
En particular, este servicio proporciona una gestión eficiente de los recursos
computacionales disponibles. También hace uso de la infraestructura de seguridad
de la red y la estructura de inicio de sesión único para acceder a múltiples fuentes
de datos.
Del mismo modo como se presenta en la arquitectura IntegraEPI general, la
arquitectura de Integra-GISE se divide en capas compuesta por los servicios de la
red y los recursos.
En la simulación y módulos de análisis, el sistema de IntegraEPI necesita
el acceso a diferentes tipos de datos como mapas, datos epidemiológicos,
información geográfica y social de la economía de datos. Los datos requeridos
son distribuidos geográficamente en DBMS, (PostgreSQL, SQLServer y Oracle). El
servicio GISE proporciona los datos necesarios para los otros módulos IntegraEPI
de forma transparente, mediante la aplicación de un conjunto de servicios de
datos de la red.
Para Integra-GISE se utiliza la OGSA-DAI (Open Grid Service Architecture Data Access Integration). La OGSA-DAI proporcionar servicios de almacenamiento
para acceder a datos de diferentes fuentes.
7.3.2.1.15 InvCell (EELA 2, UFJF, Brasil)
http://applications.eu-eela.eu/application_details.php?l=20&ID=61
Esta aplicación
basada en Algoritmos
Genéticos,
tiene
por objeto ajustar
automáticamente los
modelos existentes
de electrofisiología
celular a los datos
experimentales
obtenidos a partir
de una célula o un conjunto de células cardíacas. La metodología propuesta es
aplicada y evaluada a través de diferentes experimentos numéricos. Los modelos
ajustados por Algoritmos Genéticos fueron capaces de reproducir la actividad
eléctrica medida por varios experimentos in vitro. Además, estos modelos fueron
validados a través de nuevos experimentos in vitro utilizando conocidos efectos de
drogas. Los resultados preliminares sugieren que la metodología propuesta es una
herramienta prometedora para apoyar el desarrollo y el uso de modelos celulares.
Para las simulaciones complejas se requiere una gran cantidad de recursos
197
Capítulo VII: Estado del Arte Internacional
informáticos, y para aumentar su rendimiento, se ha adaptado a la infraestructura
de Grid EELA.
7.3.2.1.16 INVTissue (EELA 2, UFJF, Brasil)
http://applications.eu-eela.eu/application_details.php?l=20&ID=62
InvCell se centra principalmente a niceles celulares. El enfoque INVTissue es a
nivel de los tejidos: el objetivo de esta aplicación es resolver un problema inverso
asociado a la simulación de modelos de tejido cardíaco. La aplicación calcula los
valores de la conductividad eléctrica del tejido cardíaco, teniendo como base
información sobre la actividad eléctrica del corazón. Este es un problema de gran
interés, ya que en muchas patologías cardíacas estos valores presentan alteraciones
significativas. La investigación, desarrollo y validación de la metodología propuesta
son necesarios para hacer frente a problemas inversos de interés científica y
clínicamente más elevado. INVTissue es una implementación de un Algoritmo
Genético paralelizado con MPI.
7.3.2.1.17 MetaDock (EELA 2, UNAM, México)
http://applications.eu-eela.eu/application_details.php?l=20&ID=55
El propósito de Meta-Dock es dar un método de tamizaje basado en Grid
para la selección de estudios farmacéuticos. Cuando una proteína que causa una
enfermedad se conoce, el siguiente paso es identificar una molécula (un ligando)
que pueda impedir la acción de esta proteína a través de un mecanismo vinculante.
El método tradicional de laboratorio es identificar el ligando, y reducir el espectro de
análisis, pero el costo es elevado. Un método alternativo es utilizar una simulación
in silico: utilizando un programa de acoplamiento. Los estudios in silico permiten la
realización de un acoplamiento masivo en un amplio espectro de ligandos, que se
denomina comúnmente tamizaje virtual (virtual screening).
7.3.2.1.18 MHOLline (EELA-2, UFRJ, Brasil)
http://applications.eu-eela.eu/application_details.php?l=20&ID=25
Es un proyecto descrito como workflow bioinformática de genómica
estructural por medio de la comparación estructural. Integra programas de
búsqueda de proteínas en PDB, comparación por blast, alineamiento por Modeller
y evaluación de modelos de proteínas por Procheck. Un paso de refinamiento se
realiza con la etapa BATS, la cual accede a una nueva batería de algoritmos de
análisis.
198
Capítulo VII: Estado del Arte Internacional
7.3.2.1.19 Squid - a simple bioinformatics grid (BMC Bioinformatics 2005, 6, 197)
http://www.dbbm.fiocruz.br/labwim/bioinfoteam/templates/
archives/squid/squid.html
En lugar de utilizar middleware estándar, se propone simplificar el problema
desarrollando un protocolo TCP/IP para ejecutar BLAST en plataformas Windows
transportando un binario en cualquier computador. Se basa en dos programas
Perl, donde cada nodo posee una copia de BLAST e idealmente de la base de datos.
Se fragmenta la base de datos y se envían los trabajos, los cuales son removidos
del archivo maestro una vez que regrese el resultado, evitando problemas de falla
de nodos.
7.3.2.2 Europa
7.3.2.2.1 BIG, BLAST en Grid (EELA 2, UPV, España)
http://sacmis.itaca.upv.es:8080/PortalBiG/Inicio/index.jsp
Uno de los esfuerzos más importantes en el análisis del genoma es el estudio
de la funcionalidad de los distintos genes y sus regiones. El alineamiento de
secuencias proporciona una manera eficaz para comparar las secuencias con genes
previamente caracterizados. El programa compara las secuencias de nucleótidos o
proteínas en bases de datos de secuencias y calcula la significación estadística de
éstas.
El servicio BiG es versátil y la interfaz de usuario se puede acceder desde un
portal de Internet. En todos los casos, el comportamiento interno es el mismo: la
estructuración, la creación, el lanzamiento de los trabajos en la Grid y el uso de los
servicios generales para los usuarios autentificados.
Big está siendo modificado para hacer frente a los kernels de computación
en paralelo y secuencial. La elección del kernel más adecuado depende de las
necesidades del usuario y el tamaño del trabajo. Big provee el ingreso de trabajos
en masa, la gestión de múltiples bases de datos y diferentes formatos de salida. La
seguridad y tolerancia a fallos son proporcionadas a nivel del portal o a través de
los componentes adicionales disponibles.
199
Capítulo VII: Estado del Arte Internacional
7.3.2.3 bioNMF (EELA-2, UCM, España)
http://bionmfeela.dacya.ucm.es
Es un portal web que implementa la metodología de Factorización de Matriz
No-negativa para detectar clusters de genes altamente correlacionados en un
conjunto de datos. Se implementan diferentes métodos que permiten realizar un
análisis más completo. Se pueden desarrollar scripts y workflows.
7.3.2.3.1 BGBLAST (Italia)
geneva2007.healthgrid.org
Se desarrolla una aplicación Grid para exportar BLAST a una plataforma
Grid y realizar ejecuciones a gran escala de BLAST en la Grid EGEE, característica
diferenciadora de los otros proyectos bioinformáticos Grids consiste en la
administración eficiente de las bases de datos, que se actualizan constantemente
pero manteniendo las versiones anteriores, y administra réplicas de éstas con un
algoritmo adaptativo que balancea los costos de almacenamiento y paralelismo
de ejecución.
7.3.2.3.2 Biomedical Research Informatics Delivered by Grid
Enables Services BRIDGES (Glasgow, Edimburgo)
http://www.brc.dcs.gla.ac.uk/projects/bridges/index.html
Para comprender mejor el funcionamiento cardiovascular, como los problemas
genéticos de hipertensión, se buscan los responsables del aumento en la presión
sanguínea. Para ello, la búsqueda de similitudes entre secuencias es fundamental
y se utiliza BLAST. Basados en Globus Tollkit 3, se desarrolla una herramienta que
consta de scheduler, segmentación de la base de datos, uso del mpiBLAST para
ejecución paralela de BLAST. La ScotGRID provee 250 cpus para ejecutar trabajos
en cola por OpenPBS y el uso de Condor en 25 máquinas.
7.3.2.3.3 DRI/mammogrid (EELA 2, MAAT, CETA.CEIMAT, España)
http://applications.eu-eela.eu/application_details.php?l=20&ID=32
gLibrary / DRI es una plataforma que alberga y apoya repositorios basados en
grid, el objetivo principal de la plataforma es reducir el costo en términos de tiempo
y esfuerzo. Esto se consigue gracias a una infraestructura común y un conjunto de
mecanismos (API) que los proveedores de repositorio usan para definir el modelo
de datos, el acceso a los contenidos (por árboles de navegación y filtros) y el modelo
de almacenamiento. gLibrary/DRI posee una forma genérica para ofrecer toda esta
funcionalidad, sin embargo, los proveedores pueden agregar comportamientos
específicos de las funciones para sus repositorios.
200
Capítulo VII: Estado del Arte Internacional
Mammogrid + (MG +) es una aplicación que hace uso de esta plataforma como
un sistema de apoyo de diagnóstico y despliegue de datos para la colaboración en
la investigación del cáncer de mama.
7.3.2.3.4 DYNADRUG (DEISA, National Research Council (CNR),
Istituto di Chimica del Riconoscimento Molecolare,
Italy)
http://www.deisa.eu/science/deci/projects2009-2010/DYNADRUG
El principal objetivo de esta propuesta es desarrollar una plataforma
computacional biológica, altamente integrada y robusta; desarrollo de simulaciones
MD y nuevos enfoques y herramientas para (a) la exploración de mecanismos
moleculares de la función de la Hsp90, y (b) el desarrollo en diseño de nuevos
inhibidores de la Hsp90 clínicamente relevantes, orientados a fármacos para el
tratamiento del cáncer. Este es un proyecto asociado a DEISA (Distributed European
Infrastructure for Supercomputing Applications) en el período 2009-2010.
7.3.2.3.5 eIMRT (EELA 2, CESGA, España)
http://eimrt.cesga.es
eIMRT es un sistema
basado en nuevas herramientas
de control remoto de cómputo
que
permite
ayudar
a
radioterapeutas para planificar
y aplicar los tratamientos.
Esta iniciativa tiene tres
componentes principales:
•Un
marco
de
optimización,
que
analiza las necesidades
de
tratamiento
de
radioterapia y ofrece
soluciones optimizadas
para la entrega de éste.
•Una herramienta de
verificación, que calcula
utilizando técnicas de Monte Carlo las dosis producidas por un tratamiento
planificado y compara las dosis producidas por ambos métodos.
•Una herramienta de manejo, que calcula los parámetros que necesitan los
dos módulos anteriores.
201
Capítulo VII: Estado del Arte Internacional
7.3.2.3.6 ESSM (BalticaGrid, República de Latvia)
http://www.balticgrid.eu
Algoritmo que permite la comparación de estructuras de proteínas,
utilizando estructuras de Secuencia Evolutiva (ESSM). ESSM puede identificar
automáticamente diferentes mutaciones de la estructura de proteínas entre pares.
La infraestructura Grid da la posibilidad de procesar la gran cantidad de datos
perteneciente a la base de datos de proteínas como CATH. Esta aplicación está
asociada a BalticaGrid cuyo propósito es establecer una infraestructura de GRID
que permita apoyar a científicos bálticos y bielorrusos a través del consorcio BG-II,
iniciativa financiada por la EU FP7 con un período de ejecución a partir de mayo
2008 a abril 2010.
7.3.2.3.7 fMRI (EELA 2, UA, Portugal)
http://applications.eu-eela.eu/application_details.php?l=20&ID=10
La resonancia magnética funcional (fMRI) puede ser usada para caracterizar la
actividad fisiológica del cerebro, generalmente ésta se presenta como volúmenes
3D en función del tiempo. El enfoque tradicional de analizar fMRI se basa en la
cartografía estadística paramétrica (SPM). En SPM, se supone que a través de
paradigmas estructurados es posible inferir las áreas del cerebro relacionadas con
los cambios.
El objetivo de esta iniciativa es diseñar e implementar en el marco GRID el
cálculo para fMRI no paramétrico, los que serán utilizados por los investigadores.
7.3.2.3.8 eDiamond
www.ediamond.ox.ac.uk
Las mejoras en la tecnología de redes de información, la digitalización y
estandarización de la información médica de imágenes y señales, y la implementación
de sistemas de información dentro de los hospitales generan un ambiente propicio
para el desarrollo de infraestructuras Grid en Medicina. Junto con ello el uso de PCs
202
Capítulo VII: Estado del Arte Internacional
por médicos y especialistas ayudan a la introducción de nuevas TICs. El disponer
de mayor información permite mejorar la toma de decisiones. Incluso el desarrollo
de nuevas técnicas de monitoreo del cuerpo, así como el desarrollo de sistemas
mecatrónicos menos invasivos ayudan a monitorear más cautelosamente una
enfermedad, reducir el tiempo de recuperación y disminuir los costos de salud. En
el caso del Reino Unido ha implementado sistemas nacionales de información de
la salud como el Plan Nacional del Cáncer NCP.
Desde el descubrimiento de los rayos X por Röntgen en el siglo XIX, las
imágenes han permitido un monitoreo no invasivo del cuerpo y el desarrollo
de diagnósticos más precisos con tratamientos eficientes, en particular en la
Traumatología. Controlando la energía de los rayos, ha sido posible desarrollar
otros métodos de radiación por ondas que han permitido revelar diferentes
texturas de tejidos más blandos como la detección de tumores no palpables
como en las mamografías. Además, otros tipos de ondas han permitido generar
nuevas imágenes por radiofrecuencia (ecotomografías), ultrasonido, resonancia
magnética y resonancia nuclear. Por otro lado, combinando diferentes imágenes
se puede tener hoy en día una visualización 3D del cuerpo, siendo la Tomografía
Computacional una de las herramientas más ampliamente usada en Medicina.
El cáncer de mamas representa el 19% de los cánceres en mujeres con casi
350000 casos por año en EEUU y Europa. Los tumores palpables son superiores
a 1cm de diámetro desarrollado en un período de 6 a 8 años, pero para tener un
diagnóstico 99% más favorable, es necesario detectar tumores de no más de 0,5
cm. Para el caso de mamografías, la detección temprana de microcalcificaciones
es clave en la detección de tumores no palpables para el pronóstico del cáncer
de mamas. Para poder detectar estas microcalcificaciones se necesitan cuatro
imágenes de tamaño oficio de 4000x4000 pixeles generando 128MB por paciente.
Debido a la importancia de la información, no se utilizan métodos de compresión
con pérdidas. Además, estas imágenes cuentan con problemas de distorsión, ruido
de alta frecuencia y ruido del equipamiento de resonancia magnética utilizado.
Son necesarios métodos de tratamientos de imágenes para mejorar la calidad
de la información basados en detección de formas, movimiento, análisis cruzado
de pacientes. La acumulación de estas imágenes junto con más información del
paciente proveniente de diferentes análisis hace necesario fusionar la información
de manera de entregar real información más que solamente una gran cantidad de
datos.
Junto con el Reino Unido varios países se han integrado al Programa
de Screening Nacional para mamografías de rayos X. El BSP (Breast screening
Programme) invita a mujeres entre 50 y 64 años a realizarse un screening cada tres
años, logrando la participación de 1,3 millones de mujeres en 92 centros con 230
203
Capítulo VII: Estado del Arte Internacional
radiólogos analizando entre 5000 y 20000 exámenes. Este programa ha permitido
extender un promedio de 20 años de vida a más de 1000 mujeres por año. Con la
creciente necesidad de radiólogos una base de datos mayor ayudaría a capacitar
mejor a los especialistas y realizar diagnósticos más rápidos y precisos.
El proyecto eDIAMOND busca estandarizar la base de datos de imágenes,
revisar la calidad de la imagen según ciertos estándares, tener una fuente de
entrenamiento y enseñanza, servir para determinar los casos complejos que
enfrentan los radiólogos, y finalmente ser una fuente de información para
tratamientos hormonales y riesgo de cáncer de mamas. Los beneficios con claros:
•Almacenamiento seguro de la información de los pacientes
•Opiniones de diversos especialistas que acceden a la información
•Diagnósticos más rápidos por similitud con diagnósticos previamente
realizados
•disminuir los exámenes por biopsias
•Uso del manejo del hospital más eficiente
Para ello es necesario generar un middleware adecuado a las necesidades del
problema, como descripción ontológica, bases de datos compartidas, compresión
y transferencia, seguridad de acceso, técnicas de minería de datos y adecuada a los
ambientes clínicos.
El Middleware debe tener las siguientes características:
•Realizar una transferencia y acceso de datos segura
•Desarrollar algoritmos de Minería de Datos que permita obtener casos
similares
•Crear ontologías para la clasificación adecuada de la información
•Realizar pruebas y validaciones “en terreno”
La estructura del proyecto consiste en IBM como proveedor de la parte
técnica (determinación de escenarios, arquitectura y diseño, uso de productos,
seguridad y optimización de la eficiencia (performance), acceso a documentación
y capacitación. La red sería una WAN de alta velocidad con servidores de archivos
via SAN Storage Area Network con discos y cintas, y un servidor de seguridad y
otro de web. Las ubicaciones satélites serán los hospitales, centros de enseñanza
donde los datos se recolectan y se cargan en el sistema, cada uno con un servidor
principal conectado a 100 Mbps Ethernet con el resto.
204
Capítulo VII: Estado del Arte Internacional
Existen otros proyectos Grid en mamografías: como el US NDMA con IBM, de
similares características pero con mayor flujo de información. Para datos de rayos
X digitalizados, la Universidad de Pennsylvania con IBM están desarrollando un
prototipo de acceso rápido y de alta capacidad, “universal database”. MammoGrid
con Oxford y CERN, Cambridge, UDINE, Mirada solutions que se concentra en el
control de calidad de las imágenes, entrenamiento y pruebas de los sistemas, y
avanzar hacia los estudios epidemiológicos. El proyecto Grid Enabled Knowledge
Services: Collaborative Problem Solving Enviroments in Medical Informatics busca
la resolución de problemas médicos por colaboración centrados en el análisis de
tres tipos de información: imágenes, señales y datos del paciente, de manera de
determinar rápidamente el tratamiento a seguir.
7.3.2.3.9 GAMOS (EELA-2, CIEMAT, España)
http://applications.eu-eela.eu/application_details.php?l=20&ID=33
Esta iniciativa desarrolla herramientas de simulación de Monte Carlo para
diseñar sistemas de verificación de imágenes basadas en terapias de radiación.
GAMOS es un framework basado en GEANT4.
7.3.2.3.10 GBIO (Laboratory of Bioinformatics and nmR for
Structure Lyon, Francia)
gbio.ibcp.fr/ws
Grid bioinformática dedicada a resolver diferentes problemas relacionados
con las bases de datos de gran tamaño. Han participado en proyectos Grid Europeos
de los cuales se destacan:
•EMBRACE: estandarización de información biológica
•EGEE: desarrollo de tecnologías Grid europeas y desarrollo de servicios
Grid
•GPSA: desarrollo de un portal Grid para análisis de secuencias de
proteínas
•GriPPS: aplicación Grid de búsqueda de patrones y perfiles de proteínas
•RUGBI: Grid bioinformática para apoyar la construcción del genoma
humano
•Gedeon: administración de datos en Grids
•fr-Grid: Grid francesa
•DIET: desarrollo de herramientas para construir servidores
•Grid5000: construir una Grid con 5000 cpus
•RagTimes: Grid para el tratamiento de informaciones médicas
205
Capítulo VII: Estado del Arte Internacional
Además de participación en redes científicas de Bioinformática y en un
programa de magíster en Bioinformática Molecular y Modelación.
7.3.2.3.11 Grid Bio Portal (EELA-2, UPV, España)
Es un portal grid donde se pueden procesar diferentes aplicaciones
bioinformáticas corriendo en grid vía una GUI, lo que permite un mejor uso de
recursos.
7.3.2.3.12 Grid Enable BLAST (Proyecto de magíster en Francia)
www-sop.inria.fr
Las anotaciones de secuencias genómicas siguen mostrando un crecimiento
exponencial, por lo cual cualquier búsqueda de secuencias se torna cada vez más
lenta. Por ello disponer de una versión Grid de BLAST es una interesante alternativa
a desarrollar una herramienta que permita prepararse para disminuir el tiempo de
cada búsqueda. Las dos maneras de distribuir el trabajo consisten en segmentar la
base de datos o bien segmentar la secuencia objetivo.
Este proyecto consiste en segmentar ambos, la base de datos y la secuencia
objetivo, y utilizar las herramientas de Proactive como middleware de Grid. Esta
plataforma está desarrollada en Java y permite realizar computación paralela,
distribuida y concurrente.
7.3.2.3.13 Grid – BLAST (Royal Institute of Technology, Suecia)
http://kthgridproxy.biotech.kth.se/grid_blast/index.html
Los algoritmos de búsqueda de similitudes entre proteínas demandan altos
recursos computacionales y las bases de datos siguen creciendo, siendo necesario
reprocesar y actualizar la información. El proyecto busca utilizar herramientas
Grid para determinar puntajes de identidad de fragmentos comparados con el
proteoma humano. El algoritmo de comparación es BLASTp con parámetros por
omisión salvo el filtro de baja complejidad, junto con un algoritmo de ventana
deslizante de la proteína objetivo.
Para el uso por Grid, se utiliza la organización virtual NorduGrid basado en
Globus. La implementación del algoritmo se hace con dos scripts Perl: uno como
broker y el segundo para el trabajo.
206
Capítulo VII: Estado del Arte Internacional
7.3.2.3.14 GriPPS Grid Protein Pattern Scanning (Proyecto francés)
gripps.ibcp.fr
Es un proyecto de investigación de interfaz entre la Biología y la Informática
en Genómica y arquitecturas distribuidas. La Genómica debe enfrentarse al
problema creciente de adquisición de datos. Por otro lado, la Computación Grid
permite ayudar a resolver este problema y eso se manifiesta en diferentes proyectos
Grid en ejecución. El objetivo del proyecto es adaptar y desarrollar algoritmos
bioinformáticos de investigación de lugares u sitios funcionales de proteínas para
comprender al genoma y realizar anotaciones en los bancos de datos biológicos
internacionales.
7.3.2.3.15 Grid Protein Sequence @nalysis (PBIL NPS, Lyon)
gpsa-pbil.ibcp.fr
Utilizando la infraestructura de la Grid europea EGEE, se propone desarrollar
el portal web Grid Protein Sequence Analysis para proveer una interfaz amigable
para el uso de recursos genómicos Grid del proyecto EGEE. Se propone portar un
experimento del servicio NPSA.
7.3.2.3.16 HA-HELIX (DEISA, Università degli Studi di Torino, Italy)
http://www.deisa.eu/science/deci/projects2009-2010/HA-HELIX
Proyecto asociado al proyecto GRID Distributed European Infrastructure for
Supercomputing Applications (DEISA) orientado a la simulación del plegamiento
de péptidos inducida por materiales inorgánicos. El objetivo del trabajo es analizar
los procesos de plegado, tales como la conformación del péptido después de la
adsorción o la superficie de sitios de unión del péptido.
7.3.2.3.17 MEGASIM (Cambridge University, UK)
http://www.deisa.eu/science/deci/projects2009-2010/MEGASIM
El objetivo es analizar la dinámica RMN con métodos de muestreo y MD
para obtener un marco de base experimental para el estudio a gran escala de las
transiciones conformacionales de biomoléculas. Este utiliza las infraestructuras de
cómputo proporcionado por DEISA para estudiar el efecto de las mutaciones en
la interacción natural de la dinámica de activación de las quinasas, plegamiento y
agregación de proteínas, con el fin de mejorar la comprensión del cáncer y otras
patologías
207
Capítulo VII: Estado del Arte Internacional
Molecular Modelling and Grid Computing (BIo-ICT, Italia)
www.cnr-bioinformatics.it
Se busca comprender las propiedades funcionales y físico-químicas de las
proteínas participantes de los procesos patológicos y sus variantes. Se desarrollarán
herramientas basadas en HPC y Computación Grid para revisar las librerías de
interferencias metabólicas con actividad farmacológica potencial. Se focalizará el
trabajo en la modelación de variantes naturales de la proteína C relacionada con
la inflamación celular y apoptosis, la predicción de la interacción entre receptores
hormonales esteroidales y simulaciones de docking molecular endocrino para
conocer el impacto de sustancias exógenas.
7.3.2.3.18 TotalEnz (University of Bristol, School of Chemistry,
Bristol, UK)
http://www.deisa.eu/science/deci/projects2009-2010/TotEnz2
El proyecto de TotalEnz DEISA tiene el propósito de investigar la catálisis
enzimática y su dinámica para calcular los “mapas de la catálisis”, a partir de
organismos adaptados a diferentes condiciones físicas. Las enzimas son eficientes
catalizadores naturales, y la comprensión de los mecanismos por los que logran
estas propiedades catalíticas son importantes al momento de estudiar nuevos
fármacos; análisis de los efectos de la variación genética y mutación, y en el diseño
de nuevos catalizadores. Por esta razón, existe un gran interés en el desarrollo de
catalizadores de proteínas para las aplicaciones en las industrias farmacéutica,
química y biotecnología. La combinación de algoritmos y programas informáticos
modernos con los recursos de cómputo de DEISA dan un potencial para calcular
cientos de perfiles de catalizador que permitirán la creación de completos mapas
de la catálisis enzimática.
7.3.2.3.19 GenocodisGrid (EELA 2, UCM, España)
http://genecodis.dacya.ucm.es
GeneCodis es una herramienta basada en grid que integra diferentes fuentes de
información biológica para la búsqueda de características biológicas (anotaciones),
que a menudo co-ocurren en un conjunto de genes y que son clasificadas según
su importancia estadística. Puede ser utilizado para determinar las anotaciones
biológicas o combinaciones de anotaciones que se asocian significativamente a
una lista de los genes en estudio con respecto a una lista de referencia.
208
Capítulo VII: Estado del Arte Internacional
7.3.2.3.20 Phylogenetics (EELA-2, UPV, España)
http://applications.eu-eela.eu/application_details.php?l=20&ID=39
La necesidad de contar con filogenias utilizando diferentes algoritmos permite
a la aplicación grid correr trabajos de manera independiente y distribuida.
7.3.2.3.21 Phylogrid (EELA-2, CEIMAT, España)
http://applications.eu-eela.eu/application_details.php?l=20&ID=43
Se desarrolla un workflow para calcular filogenias utilizando MrBayes tool. Se
puede definir parámetros y determinar el modelo evolutivo.
7.3.2.3.22 Proyectos EGEE
Una serie de proyectos EGEE involucran aplicaciones biomédicas. Entre ellos
se destacan:
•WISDOM descubrimiento de fármacos acelerando el proceso de búsqueda
por medio de herramientas grids. Se realiza docking computacional sobre
un conjunto de compuestos químicos para anclarse (dock) a una proteína.
•GATE aplicación de tomografía médica y planificación de radioterapias.
•CDSS (Clinical Decisions Support System): aplicación de ayuda a la toma
de decisiones médicas en base a condiciones del paciente.
• Docking Platform for Tropical Diseases aplicación para el descubrimiento
de fármacos acelerando la búsqueda.
•gPTM3D método grid para recolectar, producir y analizar imágenes
3D de órganos humanos para ayudar a los cirujanos en el diagnóstico de
enfermedades tipo cáncer.
•SiMRI3D simulador paralelo de imágenes de resonancia magnética
produciendo imágenes 3D de los escáners médicos.
•Xmipp_MLrefine es una herramienta de limpieza de imágenes de
estructuras moleculares provenientes de microscopios electrónicos.
•GridGRAMM permite análisis de docking molecular por medio de un
portal grid, lo que permite desarrollar otras aplicaciones.
•GROCK (Grid Dock) permite el análisis de interacciones moleculares.
•SPLATCHE (SPatiaL And Temporal Coalescences in Heterogeneous
Environment): analiza el movimiento humano en un área geográfica para
reconstruir datos demográficos basados en el desarrollo genético
•Xmipp_assign_multiple_CTFs (Micrographia Contrast Transfer Function
calculation) es otra aplicación para limpiar imágenes de microscopio
209
Capítulo VII: Estado del Arte Internacional
electrónico por medio de la ‘Contrast Transfer Function’ (CTF).
•Pharmacokinetics es una aplicación para el estudio de la difusión
de agentes en registros de resonancia magnética abdominal.
7.3.2.4 Otras Iniciativas
7.3.2.4.1 1. CEPAR y CEPort (Grid Computing; F. Berman, G. Fox
& A. Hey, Wiley, 2003, 1002 pg.)
La base de los estudios realizados tanto por bioquímicos como biólogos
moleculares consiste en comprender los procesos biológicos regulados por
proteínas. Sus estructuras 3D se obtienen por costosos y extensos experimentos,
por lo cual no es posible contar con la información estructural de todas las proteínas
secuenciadas a la fecha. Es por ello que se recurre a la comparación por homología,
donde se busca una proteína con estructura tridimensional de similar secuencia
de aminoácidos y se infiere que su estructura será similar. Los algoritmos utilizados
para dicha comparación consisten generalmente en aproximaciones heurísticas
que buscan soluciones aproximadas. Para este caso se propone un método
exacto de comparación que requiere de altas capacidades computacionales.
Utilizando el Blue Horizon 1.7 Teraflop en el SDSC, se han realizado entre 5 a 10.000
comparaciones mensuales, publicados en más de 80 publicaciones.
CEPAR es un algoritmo escalable en redes que realiza distribuidamente el
algoritmo utilizado en Blue Horizon. Para poder optimizar el algoritmo en redes se
procedió a las siguientes mejoras:
•
•
•
•
La asignación de paquetes de datos se almacenaron con anterioridad
El procesador maestro prioriza los mensajes de petición de trabajo
Los procesadores se detienen si la comparación detecta que no será
exitosa
Optimizaciones de un procesador se aplican al procesador maestro
En estas mejoras consiste CEPAR, el cual fue paralelizado con MPI que
permite una fácil gridificación. Por esta razón se han creado portales Grid para
ejecutar este programa de manera eficiente en el SDSC a través de http;//Gridport.
npaci.edu/CE/ cuando los recursos están disponibles y con middleware Grid
desarrollado por ellos, el GridPort Toolkit. Este middleware permite acceso seguro
y encriptado, separación entre el cliente y el servidos, acceso a diferentes recursos
computacionales, disponibilidad de monitoreo en tiempo real y se pueden agregar
nuevas componentes. Esto requiere implementar y administrar un buen sistema
210
Capítulo VII: Estado del Arte Internacional
de archivos distribuido, archivos de entrada de usuarios, trabajos en cola y envío
de resultados. Además, se actualiza frecuentemente la base de datos de proteínas
en cada máquina y se asegura la transparencia al usuario. Se recomienda utilizar
un Storage Resource Broker, SRB, para realizar una administración de archivos
compartida y centralizada.
En el caso de modelación de estructuras y estudio de la dinámica molecular, el
GridPort se ha utilizado para crear un portal para este problema. GAMESS (General
Atomic Molecular Electronic Structure System) además éste contiene un SRB y a
Globus como distribuidor y monitor de trabajos.
Los desarrolladores de middleware deben tener en consideración los
siguientes desafíos:
•Desarrollar un mejor manejo de datos
•Entregar servicios de portabilidad
•Visualizar los futuros cambios en tecnologías Grid
•Trabajar en conjunto con investigadores para desarrollar mejores
aplicaciones
7.3.2.4.2 The Virtual Laboratory Project (WEHI and Monash U.,
Melbourne)
www.buyya.com/vlab
Buscan desarrollar tecnologías Grid para resolver problemas de gran escala e
intensivos en datos del Chemical Data Bank. Las herramientas de software son:
•Herramientas DOCK para modelación molecular
•Herramientas Nimrod/enFusion para modelación de parámetros
•Broker Grid Nimrod-G
•Herramientas de acceso y administración del Chemical Data Bank como
creación de índice, catálogo, servidor, broker, clientes.
•Middleware Globus
7.3.2.4.3 Comb-e-chem (Reino Unido)
www.combechem.org
Uno de los problemas más complejos de la Química Computacional es probar
nuevas combinaciones de unidades moleculares conocidas y de manera rápida.
211
Capítulo VII: Estado del Arte Internacional
La Química Combinatorial se encarga de atacar este problema y ha mostrado
resultados en la industria de los semiconductores y la industria farmacéutica. La
idea inicial es crear una reacción que une dos componentes, cada una con dos
áreas reactivas, lo cual puede producir cadenas de componentes. El proceso
se repite obteniendo una gran cantidad de compuestos. Combinando de cierta
manera también se pueden producir films. El desarrollo de moléculas inorgánicas
ha permitido que la base de datos del Cambridge Crystallographic Data Center de
estructuras cristalográficas por rayos X vaya en aumento en comparación al caso
de moléculas orgánicas.
El proyecto Comb-e-Chem empezó por definir un mecanismo de intercambio
de información: cML Chemical Markup Language (www.xml-xml.org). Las
necesidades de visualización de resultados, el manejo por mouse de aplicaciones
hace que el desarrollo de aplicaciones deba mantener estas características de
fácil uso para los químicos. Para evaluar las propiedades moleculares, se utiliza un
software de Mecánica Cuántica que recibe este archivo (junto con información
de parámetros) y entrega propiedades como energía, RMSV variación cuadrática
media de las coordenadas, concentración, presión, etc.
Para acelerar la evaluación de las combinaciones, se propone utilizar un
diseño de experimentos que comience con un número menor pero representativo
de las combinaciones.
La Grid permite trabajar con esta librería y extender el laboratorio a trabajo de
simulación y obtención de materiales sintéticos, comunicación en tiempo real para
desarrollar experimentos de manera segura en ambientes colaborativos.
7.3.2.4.4 BioCoRe (University of Illinois, EE.UU)
www.ks.uiuc.edu/Research/biocore
BioCoRE es un entorno de trabajo colaborativo para la investigación
biomédica, la gestión de la investigación y la formación. BioCoRE ofrece a los
científicos una interfaz para una amplia gama de tecnologías locales y remotas,
herramientas específicas y generales, datos y soluciones de visualización. Para
aprovechar y perfeccionar las capacidades de colaboración a través de límites
temporales y materiales en la investigación y la formación, BioCoRE se basa en el
uso transparente y la comunicación entre los recursos tecnológicos (hardware y
software) y bases de datos.
212
Capítulo VII: Estado del Arte Internacional
7.4 Apoyo de la e-infraestructura en la
investigación
La principal atracción de los proyectos grids ha sido potenciar la investigación
por medio de la colaboración. En la mayoría de los casos de iniciativas grids
universitarias (grupos de investigadores desarrollando aplicaciones para resolver
un problema enmarcado en una aplicación) solamente se ha podido publicar
el artículo de la iniciativa o bien preprints y conferencias de difusión en escasa
cantidad. Por ejemplo, el proyecto Squid solamente realizó una publicación en
BMC Bioinformatics 2005, 6, 197.
En el caso de las iniciativas europeas EGEE y EELA-2, ambos proyectos han
sido más exitosos en su desarrollo científico. Para EGEE, el informe BioGrid White
Paper muestra que se publicaron 23 artículos en revistas y se desarrollaron 19
presentaciones en conferencias. En el caso de EELA-2, su página web muestra
que han editado proceedings con un total de 75 publicaciones entre artículos y
presentaciones en conferencias.
Para las grid nacionales como Comb-e-chem, los resultados de investigación
son alentadores y se han reportado 63 publicaciones. Otro caso de grid nacional es el
del proyecto eDiamond de prevención de cáncer mamario con 28 publicaciones.
7.5 Visión Futura
Las iniciativas grid internacionales son numerosas y resuelven diversos
problemas en el área de las Biociencias. Su experiencia resulta muy valiosa para
realizar experimentos de instalación y uso, así como motivar la creación de nuevas
aplicaciones grids. Por otro lado, el aporte a la investigación que han realizado
las iniciativas de colaboración en grids nacionales o continentales (europeas,
realmente) muestra que el trabajo en equipo potencia la investigación y se puede
constatar el las numerosas publicaciones desarrolladas en este tipo de iniciativas.
Además, el recurso humano generado así como la infraestructuras grids instaladas
permiten el desarrollo de otras redes colaborativas que pueden potenciar aún más
la investigación.
213
Capítulo VII: Estado del Arte Internacional
Es claro que el apoyo coordinado de gobiernos e instituciones internacionales
de investigación (como el FP6 de la Unión Europea) son necesarios para contar con
un financiamiento base para la creación de la red el cual queda completamente
justificado con compromisos de desarrollo de investigaciones.
Dadas las necesidades nacionales de investigación y desarrollo en Biociencias
junto con los generosos aportes actuales al financiamiento de iniciativas
colaborativas, como los Núcleo Milenio y Financiamiento Basal, muestran que
es posible desarrollar en Chile iniciativas de desarrollo de aplicaciones grids en
diferentes áreas de la investigación nacional. La participación de universidades
chilenas en proyectos internacionales muestra una ventaja comparativa para
el desarrollo de una grid nacional, potenciando el trabajo colaborativo y
posicionándonos internacionalmente para poder integrar un mayor número de
iniciativas grids internacionales exitosas, las cuales generalmente requieren de
capacidades instaladas. Una grid nacional permitirá que tengamos infraestructura
de primer nivel para fortalecer las colaboraciones que en sinergia permitan
aumentar las capacidades de I+D nacionales, así como generar mayor recurso
humano capacitado.
De los costos de generar una gris nacional, si proyectamos los costos de
las grids europeas como EGEE, un proyecto de 24 meses para 10 instituciones
con 6.000 cores y 1PB de disco debería costar alrededor de un millón de euros
de financiamiento estatal y un millón de euros en aportes de las instituciones
considerando aproximadamente 400 personas involucradas.
214
Capítulo VIII: Estado del Arte Nacional
8 Capítulo VIII:
Estado del Arte Nacional
8.1 Investigación y Colaboración
Los proyectos grid en Biociencias llevan pocos años en Chile y se han
caracterizado en dos fases: una primera fase de colaboración internacional
accediendo a proyectos europeos y una segunda fase en el desarrollo de proyectos
nacionales de colaboración grid. A pesar de esto, no ha habido un gran desarrollo
en el área de Biociencias debido que para acceder a grupos internacionales es
necesario contar con capacidades de desarrollo de grid (recurso humano capacitado
para la instalación y mantenimiento de middleware, desarrollo de aplicaciones,
etc.) y recursos computacionales ociosos para compartir. Por otro lado, además
de los problemas clásicos de coordinación entre las instituciones de investigación
quienes prefieren fomentar la colaboración internacional v.s. la colaboración
nacional. Cabe mencionarse que la investigación nacional se concentre alrededor
de la Región Metropolitana y la competencia histórica entre las universidades
con mayor investigación, U. de Chile y la P.U.Católica, dificulta el desarrollo de
colaboración con el resto de las universidades. En general, son las universidades con
menor investigación y localizadas fuera de la influencia de la Región Metropolitana
quienes se muestran más interesadas en desarrollar colaboraciones que apoyen los
pequeños grupos de investigación como lo muestra el proyecto CLGrid. A modo de
215
Capítulo VIII: Estado del Arte Nacional
ejemplo, el año 2005 en el proyecto Fondef D02I1054 Servicios y Aplicaciones de
Alto Rendimiento Sobre Redes de Tercera Generación se desarrolló el primer piloto
grid basados en Globus 3.0 entre la Universidad de La Frontera y REUNA, donde
fue posible el envío de trabajos en torno a una aplicación bioinformática entre dos
nodos de dos servidores.
Para potenciar el desarrollo de grid en el área de Biociencias es necesario:
•Difundir experiencias internacionales exitosas de grids en Biociencias que
motiven la cooperación entre instituciones de investigación.
•Contactar expertos internacionales que permitan una rápida
implementación de aplicaciones grids exitosas en la investigación.
•Capacitar recurso humano que permita generar nodos grids en las
diferentes instituciones y crear nuevas aplicaciones, así como poder disponer
de equipamiento no exclusivo para poder generar la grid computacional
(laboratorios docentes en fines de semana o durante la noche).
•Crear redes de cooperación entre universidades regionales que potencien
su investigación, pues son estas universidades las que necesitan aumentar
su trabajo, lo que les permitirá estar mejor posicionada para competir por
los recursos públicos.
•Asociarse con la Universidad de Chile o la P. Universidad Católica de Santiago
para potenciar las redes de investigación. En algunos casos ex-alumnos de
estas universidades están trabajando en universidades regionales lo que
facilitaría una asociación, pues estas universidades privilegian las redes
internacionales.
•Concursar a fondos públicos para la creación de proyectos grids en
diferentes áreas de investigación
Estas ideas nos permiten visualizar un gran potencial de desarrollo de grids
para las Biociencias.
216
Capítulo VIII: Estado del Arte Nacional
8.2 Instituciones y/o grupos de investigación a
nivel nacional
En el área de Bioinformática, en Chile se generó una pequeña red con cuatro
instituciones principales:
•Centro de Bioinformática y Simulación Molecular, U. de Talca
•Centro de Bioinformática, P. Universidad Católica de Santiago
•Centro de Bioinformática y Biología Genómica, U. Andrés Bello y Fundación
Ciencia para la Vida
•Laboratorio de Bioinformática y Matemática del Genoma, U. de Chile
Éstas lograron realizar talleres científicos y desarrollar altas capacidades
computacionales para la investigación. Sin embargo, solamente las tres primeras
han podido avanzar en el desarrollo de una grid colaborativa en el tema de
educación de biología por medio del proyecto Fondef TIC-EDU TE08I1021 Sistema
de Aprendizaje Colaborativo basado en Infraestructura Grid (SACGRID).
En el área de Modelación y Simulación Molecular, la investigación de primer
nivel la ha liderado el CBSM de la U. de Talca, quienes han promovido esta técnica
en el país. Por el lado de la Química Computacional, existen diferentes grupos pero
se alejan del área de Biociencias acercándose más a los Nanomateriales y Química
Orgánica.
En el área de Biomedicina, existe una gran cantidad de investigación basada
en laboratorios de tratamiento de muestras donde la componente computacional
no tiene cabida. Considerando que en proyectos internacionales se comparten
datos (exámenes, análisis, etc.) como equipamiento, ésta es un área potencial de
desarrollo de grids en la cual se puede potenciar a los grupos de investigación, en
particular cuando los datos son escasos, por ejemplo en tratamiento de cánceres.
En el caso de colaboración internacional, el CBSM de la U. de Talca participa
de un ambicioso proyecto europeo de grid, Action-Grid www.action-grid.eu
cuyos objetivos son la Nanoinformática, Nanomedicina, Informática Biomédica,
Tecnologías Grid y Nanotecnología. Su objetivo principal es reutilizar y transferir
tecnologías grid para la Informática Biomédica a America Latina, Los Balcanes
Oeste y África del Norte.
217
Capítulo VIII: Estado del Arte Nacional
Otra iniciativa con recientes resultados ha sido la participación de la
Universidad Técnica Federico Santa María en el proyecto EELA-2, quienes han
invitado a la Universidad de La Frontera al desarrollo de una aplicación grid para
el procesamiento de imágenes GRIP applications.eu-eela.eu Esta aplicación
ayuda a encontrar estructuras y patrones para un mejor diagnóstico y tratamiento
temprano de enfermedades.
8.3 Identificar las áreas científicas que se trabajan
en Chile
Para el caso de grids nacionales, la primera iniciativa de un proyecto grid en
Biociencias es el Fondef TIC-EDU TE08I1021 Sistema de Aprendizaje Colaborativo
basado en Infraestructura Grid (SACGRID), cuyo objetivo es el desarrollo de juegos
de biología basados en plataformas grid donde tanto middleware como altos
recursos computacionales están disponibles para los alumnos de escuelas donde
la meta es llegar a 200.000 estudiantes en línea. El área más directa de aplicación
del proyecto es la Educación a través de la innovación en las metodologías del
aprendizaje, lo cual aleja a esta iniciativa del área de Biociencias.
Una segunda iniciativa es el proyecto Corfo Uso Colaborativo de Recursos
de Alto Valor UCRAV que pretende mejorar la investigación por medio del uso
compartido de seis equipos a través del levantamiento de un servicio grid. Las
áreas de aplicación del proyecto contemplan Biología Molecular, Estructuras
Moleculares, Química Orgánica e Inorgánica y Biología Celular.
Del punto de vista de las posibles colaboraciones a formar, de los proyectos
internacionales podemos destacar que potenciales grupos son los proyectos que
involucran a varias instituciones y un número importante de investigadores en un
área en particular. Referentes a las Biociencias sugerimos:
•Instituto de Ciencias Biomédicas, icbm.cl y sus redes de colaboración.
•Centro de Bioinformática y Simulación Molecular, cbsm.utalca.cl, y sus
redes de investigación.
•Centro de Biotecnología, Universidad de Concepción y su red nacional e
internacional www.centrobiotecnologia.cl
218
Capítulo VIII: Estado del Arte Nacional
8.4 Productividad e impacto Científico
Debido a lo nuevo de las iniciativas nacionales, no se ha reportado el impacto
de las tecnologías grid. El proyecto UCRAV declara que su objetivo es entregar
un acceso más equitativo de instrumental científico que ayude al desarrollo de
investigaciones científicas.
En el caso de la colaboración internacional en Action-Grid, el sitio muestra
tres publicaciones pero no están relacionadas con la Universidad de Talca, sino
que con la U. Politécnica de Madrid. Para el caso de EELA-2, no hay publicaciones
reportadas referentes a éste.
8.5 Iniciativas en las áreas de Biociencias
8.5.1 Proyecto UCRAV
Se logró levantar una grid computacional para el manejo de instrumental
científico de diferentes instituciones socias (Universidad Católica del Norte,
Universidad de Atacama, Universidad Tecnológica Metropolitana, Universidad de
Chile y la Universidad de Concepción) coordinados a través de REUNA que además
presta servicios a universidades y empresas. El equipamiento es principalmente para
el análisis molecular tanto de productos orgánicos como inorgánicos, permitiendo
avances en áreas de la Biología Molecular, Biología Celular, Nanotecnologías, entre
otras. Estos equipamiento pertenecen a laboratorios que realizan docencia de
pre y postgrado, y que cuentan con personal capacitado para su uso, así como
entrenados en tecnologías grids. Con una mayor difusión, el proyecto podrá
utilizarse para colaboraciones científicas, como estudio de estructura de proteínas,
y también en el desarrollo de la industrian biotecnológica nacional donde el uso de
nuevos productos permite mejorar las capacidades productivas, por ejemplo, en el
desarrollo de biofilms y fármacos.
219
Capítulo VIII: Estado del Arte Nacional
8.5.2 SACGRID
Este proyecto se focaliza en técnicas de aprendizaje por lo que el mayor
área de impacto es la Educación. Está fuertemente ligado a la docencia escolar
y como subproducto se obtendrán capacidades computacionales de alto nivel
para desarrollar Simulaciones Moleculares, así como tecnologías grids para el uso
colaborativo de recursos. Debido a que está orientado a estudiantes de enseñanza
media, el diseño de interfaz gráfica permitirá potenciar estos recursos como
plataforma grid de fácil uso. Su impacto se remite principalmente la ámbito público
a través de fortalecer el aprendizaje colaborativo basado en la indagación.
8.5.3 ACTION-GRID
A pesar de no ser un proyecto nacional, sus objetivos contemplan la posibilidad
de extenderse al resto de la comunidad. Por medio de la participación del CBSM es
posible conocer la experiencia del proyecto y proponer transferir dicha experiencia
al ámbito nacional. Debido a su importancia, la Informática Biomédica es un área
en la cual no existen grids colaborativas nacionales y permitiría el desarrollo de una
temática de gran relevancia nacional.
8.5.4 EELA-2
Este proyecto de colaboración internacional posee una aplicación desarrollada
en Chile entre la colaboración de la Universidad Técnica Federico Santa María y la
Universidad de La Frontera. GRIP (Grid Image Processing for Biomedical Diagnosis)
es una aplicación grid de Biomedicina orientada en la búsqueda de patrones en
imágenes biomédicas, en particular de la detección de núcleos cancerigenos en
células de tejido mamario bajo técnicas inmonohistoquímicas. Estudiantes de
pregrado se han capacitado en las escuelas EELA en técnicas grids y han podido
colaborar en el desarrollo de las aplicaciones. Sus usos potenciales permiten que
médicos puedan acceder a análisis de imágenes que le ayudan a tomar decisiones
por medio de un mejor diagnóstico. Debido a su característica experimental, aún
no se ha implementado a nivel de investigación y se espera que el proyecto EELA-2
sirva para extender sus posibilidades de uso.
220
Estrategia
Capítulo IX: Necesidades futuras de Tecnologías de Información en Chile
9 Capítulo IX:
Necesidades futuras de Tecnologías de
Información en Chile
9.1 Introducción
El objetivo de este capítulo es determinar los nichos que requerirán a futuro
mayor demanda de tecnologías de información desde el punto de vista país.
Chile se ha ido posicionando como localización atractiva en el campo de
servicios tecnológicos y es un gran desafío seguir generando las condiciones que
permitan atraer inversiones en actividades intensivas en conocimiento.
El mundo está sujeto en la actualidad al impacto de revoluciones tecnológicas
de amplio impacto: la de las Tecnologías de la Información y las Comunicaciones
(TIC), la de las biotecnologías y, más recientemente, la de las nanotecnologías, cada
cual en una fase distinta de desarrollo.
En el caso de las TIC, la evidencia existente indica que el sistema productivo
nacional aún no hace aprovechamiento pleno de las ganancias de productividad
que permite el uso de estas tecnologías. Por otra parte, está emergiendo una nueva
constelación de innovaciones ligadas a las tecnologías inalámbricas o el software
embebido, que pueden multiplicar varias veces esas ganancias de productividad.
De allí la necesidad de continuar promoviendo una adopción extendida de estas
tecnologías en distintos ámbitos de nuestra sociedad y, especialmente, a nivel de
nuestros principales sectores de exportación.
223
Capítulo IX: Necesidades futuras de Tecnologías de Información en Chile
El Banco Mundial, en su informe “De los Recursos Naturales a la Economía del
Conocimiento: Comercio y Calidad de Empleo“, afirma con fuerza que las actividades
que se basan en recursos naturales bien pueden ser industrias con uso intensivo de
conocimiento y, por lo mismo, con capacidad para impulsar el crecimiento durante
mucho tiempo. Para sostener esta posición, cita varios casos ejemplares.
En primer término, comenta que es imposible sostener que Australia, Canadá,
Estados Unidos, Finlandia y Suecia no basaron su desarrollo en sus recursos
naturales. De hecho, inclusive hoy son exportadores netos de productos basados
en ese tipo de recursos, junto con productos de alta tecnología.
De acuerdo al informe de Competitividad Global del World Economic Forum
(WEF), la preparación tecnológica, que mide la agilidad con la que una economía es
capaz de adoptar tecnologías existentes que mejoren la productividad industrial,
se muestra bastante débil en nuestro país. La preparación tecnológica resulta
especialmente relevante en una economía como Chile que, en general, no está
en la frontera tecnológica y que, por lo tanto, puede beneficiarse de la adopción
de tecnologías extranjeras. De esta manera, es importante aprovechar la posición
respecto de la frontera tecnológica e innovar a través de la adopción y adaptación
de nuevas tecnologías, lo que sin duda requiere de la disponibilidad de una base
tecnológica nacional.
Si bien en ciertos aspectos asociados a este factor el desempeño es destacable,
como legislación en TIC>s (ranking 24) y el nivel de IED (Inversión Extranjera Directa)
y transferencia tecnológica (ranking 24), otros aspectos se presentan bastante
débiles y son los que explican la posición 35 de Chile en este factor: por ejemplo,
cantidad de computadores (posición 44), usuarios de Internet (41) y absorción
tecnológica a nivel de la firma (33).
Con respecto a la innovación, Chile tiene un mal desempeño en el área
principalmente por la provisión de productos tecnológicos por parte del gobierno
(ranking 54), la capacidad de innovar en el país (ranking 50), la calidad de las
instituciones científicas (ranking 48), el nivel de gasto en I+D en la empresa (ranking
48) y la protección a la propiedad intelectual (ranking 45).
Como base para este estudio se utilizarán los informes desarrollados por
el Boston Consulting Group para el Consejo Nacional de Innovación para la
Competitividad. Estos documentos son la base de la nueva estrategia de desarrollo
basada en los clusters con mayor potencial en el país y que permitan retomar los
ritmos de crecimiento de comienzo de los 90.
224
Capítulo IX: Necesidades futuras de Tecnologías de Información en Chile
9.2 Determinación de las industrias en estudio
9.2.1 La elección de un camino.
Una pregunta fundamental respecto de la innovación es cuál de las sendas
que se nos ofrecen es la que debemos tomar, teniendo en cuenta que no podemos
ser buenos en todo. En este punto fundamental existen dos opciones extremas:
•Una afirma que existen algunos sectores donde se concentra la posibilidad
de innovar y ser más competitivos, y que son esos los que debemos elegir,
sin importar con qué ventajas podamos partir en ellos o cuánto esfuerzo
nos puede costar alcanzar los niveles de productividad que nos permitan
competir en las ligas mundiales.
•La otra, que ha dominado la acción pública durante los últimos decenios,
es la neutralidad, esto es, que el mercado irá contestando naturalmente las
preguntas relativas a dónde deberemos concentrar nuestros esfuerzos.
No apostar a nada entraña el riesgo de sacrificar el desarrollo de algunos
sectores en los que el país podría tener ventajas especiales, pues se pierde la
oportunidad de moverse a tiempo para llegar a competir exitosamente en el
mundo, por el hecho de no proveer oportunamente ciertos insumos que son
fundamentales para lograr tal desarrollo.
Tal como reconoce la OCDE (Organisation for Economic Co-operation and
Development), en la transición hacia un mayor crecimiento impulsado por la
innovación, Chile debe aprovechar sus fortalezas y ventajas comparativas mediante
el fortalecimiento de aquellos clusters incipientes, principalmente, aunque no
exclusivamente, basados en recursos naturales, con el fin de desarrollar prácticas
innovadoras que ayuden a transformar en ventajas dinámicas las actuales ventajas
estáticas de la economía chilena.
Por ello, la propuesta del Consejo de Innovación, y en la cual nos basaremos
para este estudio, apunta a incentivar fuertemente el desarrollo empresarial, la
formación de capital humano y la investigación (básica y aplicada) considerando
la especificidad de aquellos sectores que sean promesa de un mayor desarrollo
para el país, con un fuerte impacto en innovación, como son hoy la acuicultura
y la minería, ya constituidos y muy fuertes, o la naciente oportunidad que nos
dan las nuevas tecnologías de la información para ofrecer desde Chile servicios
profesionales de alto valor a empresas localizadas más allá de nuestras fronteras.
225
Capítulo IX: Necesidades futuras de Tecnologías de Información en Chile
9.3 El Consejo Nacional de Innovación para la
Competitividad
El Consejo Nacional de Innovación para la Competitividad es un organismo
público-privado que actúa como asesor permanente del Presidente de la
República
Su objetivo es asesorar a la autoridad en la identificación y formulación de
políticas referidas a la innovación y la competitividad, incluyendo los campos de la
ciencia, la formación de recursos humanos y el desarrollo, transferencia y difusión
de tecnologías.
El Consejo ha tenido como objetivo prioritario la elaboración de la estrategia
nacional de innovación para la competitividad que oriente el desarrollo del país
durante la próxima década.
En el segundo volumen de su informe «Hacia una estrategia nacional de
Innovación para la Competitividad» el Consejo entrega sus recomendaciones sobre
cómo debe actuar el Estado en cada uno de los tres pilares de la innovación (Capital
Humano, Ciencia e Innovación Empresarial) y cómo debe organizarse para cumplir
estas tareas de manera oportuna y armónica, teniendo siempre como objetivo final
que el sector privado maximice su potencial en beneficio del desarrollo del país.
El volumen incluye, además, propuestas de acción concretas para el desarrollo de
siete clusters y definiciones más específicas sobre la modernización institucional
requerida para la innovación y la competitividad.
Buscar el desarrollo de la Economía del Conocimiento y la diversificación
en Chile mediante el potenciamiento de los clusters hoy existentes o nacientes
(principalmente ligados a recursos naturales) se fundamenta en que estos
conglomerados han sido definidos como “fábricas de competitividad”, pues tienen
tres características:
•Enfocan mejor las necesidades de los clientes que son el corazón de la
ventaja competitiva, al estar organizados alrededor de clientes y usos
finales.
•Crean mercados más eficientes y menores costos de transacción (por
ejemplo, costos de búsqueda) para todos los jugadores del cluster y, por ello,
dinamizan la productividad.
•Son centros de innovación, simultáneamente por la extrema rivalidad que
se da en algunas áreas y por la cooperación fluida que se produce en otras.
226
Capítulo IX: Necesidades futuras de Tecnologías de Información en Chile
9.4 Los siete sectores elegidos
De entre más de 100 sectores con alto potencial de crecimiento en el mundo,
se llegó a una lista con los 33 sectores más prometedores para Chile, en relación con
el esfuerzo requerido para capturar ese potencial. Todos ellos tienen alto potencial,
pero como los recursos no son ilimitados, era necesario identificar y priorizar los
once sectores que estaban en el tope de la lista, considerando tanto su impacto
directo en el crecimiento como su potencial de encadenamientos (o conformación
de clusters) que pudieran tener un efecto más amplio en la economía.
Los sectores priorizados fueron: Acuicultura, Offshoring, Turismo,
Fruticultura, Minería del Cobre, Alimentos Procesados, Servicios Financieros,
Logística y Transporte, Porcicultura-Avicultura, Comunicaciones y Construcción.
Serv. medio
ambiente
Alto
Outsourcing
Industriales
creativas
Crecimiento PIB emn 10 años
Potencial de
Crecimiento (%)
billón de pesos
Alimentos
procesados de
consumo humano
Sectores que se
destacan
Vitivinicultura
Comunicaciones
Horticultura
primaria
Medio
Acuicultura
Servicios
financieros
Plástico
Plataforma de negocios para L.A .
Farmacéutica
Medicina
especializada
Consultoría
Educación superior
Logística y
transporte
Alimentos para
Bovino
consumo animal
y ovino
Lácteo
Industria Química
Productos
de madera
Bajo
Metalurgia
Alto
Medio
Fruticultura
primaria
Porcicultura y avicultura
Minería no metálica
Construcción
Comercio minorista
Minería cobre
y subproductos
Turismo
Silvicultura
Celulosa
y papel
Bajo
Esfuerzo para lograr la
competitividad necesaria
Fuente: Boston Consulting Group
Figura 13. Análisis del potencial de crecimiento de 100 sectores económicos
chilenos
227
Capítulo IX: Necesidades futuras de Tecnologías de Información en Chile
De ellos, el Consejo seleccionó los primeros siete para ser estudiados
en profundidad durante 2007, con el fin de proponer al Ejecutivo una “apuesta
selectiva” en el marco de la Estrategia Nacional de Innovación.
Adicionalmente y una vez seleccionados los sectores, se procedió a identificar
las plataformas habilitadoras, de carácter transversal, más relevantes para el
desarrollo del conjunto de los sectores priorizados.
Según datos de la industria141, la participación de la industria TIC como
oferentes de los clusters priorizados es baja, y sólo un pequeño porcentaje de las
empresas de software se enfocaron al mercado exportador -agricultura, pesquero,
forestal y minero.
9.5 Requerimientos de TIC de los siete clusters
privilegiados
Una de las grandes tareas para los próximos años será el incremento de la
productividad de las empresas a través de un gran esfuerzo de difusión, adaptación
y adopción tecnológica que les permita asimilar las mejores prácticas productivas
presentes en Chile y el mundo y les brinde la posibilidad de incorporarse al ámbito de
la innovación
El área de Tecnologías de Información y Comunicaciones (TICs) busca
promover y apoyar el desarrollo y uso de las nuevas tecnologías de información y
comunicaciones, del comercio electrónico e Internet en los negocios.
Las tecnologías de información y comunicación representan uno de los principales
motores de la productividad y del crecimiento económico a nivel mundial.
En la siguiente figura se pueden observar las megatendencias globales que
tienen un alto impacto en los clusters nacionales:
141
228
Estudio Estrategia competitiva para la industria TIC, ACTI
Capítulo IX: Necesidades futuras de Tecnologías de Información en Chile
Fuente: Boston Consulting Group
Figura 14. Megatendencias globales
En el siguiente acápite se realizará un análisis de los requerimientos de
tecnologías de información y comunicación de los siete clusters privilegiados por
el Consejo de Innovación de acuerdo a lo visto en la sección anterior.
9.6 Offshoring
Offshoring es una de las principales megatendencias en el mundo de los
negocios. Es una de las industrias más dinámicas, con un crecimiento esperado de
40% anual, llegando a US$ 280 mil millones en 2010142.
La oferta de servicios de offshoring está comenzando a diversificarse
geográficamente, dada la necesidad de contar con plataforma multi-país para
atender necesidades de clientes (husos horarios, combinación de on y offshore,
variedad idiomática y cultural). El requerimiento principal es la oferta de recursos
142
Fuente: IDC “Worldwide and U.S. Business Process Outsourcing
229
Capítulo IX: Necesidades futuras de Tecnologías de Información en Chile
humanos calificados. En esta diversificación geográfica, América Latina tiene
una gran oportunidad de crecimiento apalancando su condición de plataforma
nearshore para el mercado de Estados Unidos.
9.6.1 Requerimiento de TIC
Este cluster es el que tiene un mayor requerimiento de tecnologías de
información, ya que el offshoring en esta área representa el 15% del monto del total
mundial, estimándose en US$43,2 mil millones al 2010. Los requerimientos son
principalmente aplicaciones, ganando sofisticación con el tiempo, por ejemplo:
•Solución de Y2K.
•Desarrollo de aplicaciones.
•Mantenimiento de aplicaciones.
oLegacy
oPackage
Países desarrollados
Otros países de bajos costos
India
% respondientes
100%
80%
60%
40%
20%
0%
TI
Call center
Bussiness
Finanzas y
research Administración
analysis
Recursos
Humanos
I&D específico
para industrias
Fuente: MGI
Figura 15. Lugares donde mandan o planean mandar a offshore las siguientes
actividades
230
Capítulo IX: Necesidades futuras de Tecnologías de Información en Chile
La instalación de grandes compañías tecnológicas en el país permite aumentar
sustancialmente la cantidad de investigación desarrollada en el país. Este tipo de
offshoring las empresas buscan realizarla en países de mayor desarrollo, tal como
se ve en la siguiente figura:
En conclusión, Chile puede ofrecer un Incremento en la oferta de procesos de
mayor valor agregado, dado que ha demostrado capacidad en servicios de mayor
valor agregado en algunas empresas internacionales (ej. Synopsys y Evalueserve) y
nacionales (ej. Andean Software Development Solutions). Un ejemplo de servicios
de valor agregado es Irlanda, país que es usado por las multinacionales como una
base sobre la cual puedan manejar sus operaciones de bajo costo en otros países;
ej. Microsoft, Apple, Pfizer, Citigroup.
9.7 Acuicultura
La acuicultura fue durante muchos años el sector estrella en crecimiento,
llegando a exportar sobre US$2.300 millones en 2006, con un crecimiento del 13%
en diez años. Sin embargo, la aparición de enfermedades en las especies, como el
virus ISA, mermaron la capacidad productiva del sector, la cual se espera comience
un periodo de recuperación a partir del año 2010, dada la nueva legislación
aprobada en el país.
Chile sigue teniendo excelentes condiciones para el desarrollo de la
acuicultura, especialmente debido a la temperatura de las aguas, fiordos y canales
para cultivo existente, costos relativos inferiores a los competidores directos y el
conocimiento acumulado en el país.
Se espera que la demanda siga creciendo en los próximos años, y los
competidores directos muestran saturación en sus bordes costeros (ejemplo:
Noruega).
9.7.1 Requerimiento de TIC
Las tecnologías de información son un apoyo vital para lograr un desarrollo
más eficiente del sector acuícola, dadas las mejoras que se pueden lograr en los
siguientes ámbitos:
231
Capítulo IX: Necesidades futuras de Tecnologías de Información en Chile
•Mejorar el rendimiento de los alimentos.
•Desarrollo de nuevas especies.
•Mejora de la trazabilidad en el proceso productivo, orientado a lo sanitario
y medio ambiental.
Se espera que el Estado financie la Investigación y Desarrollo relacionada a
este cluster, dado el alto potencial de crecimiento que muestra, y las condiciones
que tiene el país para su desarrollo. De acuerdo a los estudios del Boston
Consulting Group, el país debe gastar entre US$200 y US$500 millones de dólares
en investigación en este sector.
El desarrollo de estos procesos de investigación debe ser realizado en
conjunto con los especialistas en acuicultura, los cuales son escasos en Chile.
9.8 Minería del cobre
Chile es líder mundial en producción y reservas de cobre pero con una
participación relativa menor en la minería en general. Existe una brecha esperada
de producción a nivel mundial en el largo plazo.
Un alto nivel de inversiones en Chile genera la posibilidad de crecimiento de
la actividad del cluster en los próximos cinco años.
Existe una oportunidad de desarrollar proveedores locales en nichos
específicos asociados con tecnología e innovación con potencial de exportación.
En el año 2009 el 90% de los proveedores de CODELCO, la principal compañía
chilena, eran de origen nacional.
9.8.1 Requerimiento de TIC
Es necesario incentivar la innovación para favorecer el desarrollo de los
proveedores y asegurar el desarrollo sustentable y competitivo de la industria.
Las principales áreas de desarrollo para las TIC son:
•Análisis químicos
•Tecnología de caracterización de yacimientos
232
Capítulo IX: Necesidades futuras de Tecnologías de Información en Chile
•Camiones autónomos
•Diagnóstico a distancia
•Telemanejo
•Automatización
•Preacondicionamiento
•Automatización de procesos
•Lixiviación y Biolixiviación
•Optimización del uso del agua y energía eléctrica
La innovación por medio de tecnología aplicada debe basarse en el
entendimiento de las necesidades concretas de la industria y la coordinación del
esfuerzo de I+D junto al desarrollo de incentivos específicos.
9.9 Alimentos Procesados
La industria de alimentos procesados incluye diversos sub-sectores que comparten
oportunidades y desafíos transversales, dentro de los que podemos mencionar:
procesados del mar, panadería y pastas, jugos y concentrados, deshidratados y frutas
secas, conservas, congelados, confitería, cecinas, café y té, aceite de oliva.
El mercado mundial de alimentos procesados muestra un crecimiento
considerable por cambios en patrones de consumo, con comercio internacional
jugando un rol cada vez más importante.
Chile es un actor pequeño, focalizado en alimentos procesados frutícolas y
hortícolas:
•Exportaciones por US$ 1.400 MM en 2006 en los sub-sectores
mencionados.
•Competencia en base a productos de buena calidad y bajo costo, pero
con potencial de apalancar ventajas competitivas para lograr mayor valor
agregado a través de la diferenciación
El país tiene la oportunidad de alcanzar exportaciones anuales por US$ 4.300
MM a 2017
233
Capítulo IX: Necesidades futuras de Tecnologías de Información en Chile
9.9.1 Requerimiento de TIC
Se requiere crear una fuente de ventaja competitiva para Chile a través de
la I+D, la cual complemente diversas disciplinas donde las TIC cumplen un rol
fundamental.
Las áreas principales identificadas para el cluster de alimentos incluyen:
•Variedades específicas para la industria de proceso
•Envases y packaging
•Inocuidad
•Procesos y tecnologías (de producción, inspección, de control de calidad,
de manipuleo de materiales, etc.)
•Biotecnología
•Ingredientes, extractos y alimentos funcionales
La industria de alimentos procesados posee un déficit en su programa de I+D
apoyado en cuatro dimensiones
•Fondos disponibles
•Utilización
•Capital Humano
•Transferencia
9.10 Fruticultura
Chile es un actor relevante a nivel mundial en este sector. Es el primer
exportador del hemisferio sur, basando su estrategia en una diversidad de
productos de calidad superior a la media y venta contra estación.
Las exportaciones al 2006 bordearon los US$ 2.330 millones, representando
alrededor del 30% de las exportaciones de frutas de interés (que pueden ser
producidas en Chile). El país representa el 60% de la producción global de frutas
del hemisferio sur y 7% del mundo
Oportunidad de aumentar exportaciones anuales a 2012 entre US$ 900 MM y
US$ 1.500 MM según escenario.
234
Capítulo IX: Necesidades futuras de Tecnologías de Información en Chile
9.10.1Requerimiento de TIC
Las principales demandas de I+D en el área de tecnologías de información
para este cluster son:
•Tecnología en riego, cosecha, sistemas anti-heladas
•Tecnología en selección de frutas y empaque
•Tecnología en camiones y barcos (sistema de frío)
De acuerdo a los estudios realizados con especialistas en fruticultura, los
principales déficits en programas de I+D son:
•Falta de visión de largo plazo
•Insuficiente coordinación entre agentes
•Insuficiente esfuerzo en investigación aplicada
•Asignación de incentivos ineficiente
•Insuficiente flexibilidad para la ejecución de investigaciones
•Insuficiente transferencia de resultados de investigaciones
•Escasa investigación aplicada a necesidades particulares de productores chilenos
El principal requerimiento señalado por la industria es la creación, difusión y
transferencia de paquetes técnicos/tecnológicos estandarizados por región y por
especie frutal / variedad.
El financiamiento de estas inversiones es un punto crítico en Chile, se espera
que tanto el Estado como el sector privado prioricen la Inversión y Desarrollo
para así poder llegar al nivel de países líderes en esta área, como se aprecia en la
siguiente figura:
2.00%
1.50%
1.00%
0.50%
0.00%
1.69%
1.16%
0.70%
Chile
Nueva Zelanda
Australia
Fuente: Zespri, Hort New Zealand
Figura 16. Inversión en I+D como porcentaje del PIB de la economía
235
Capítulo IX: Necesidades futuras de Tecnologías de Información en Chile
9.11 Turismo
Chile debe aspirar a generar ingresos entre US$ 2.700 y US$ 4.000 millones
en 2012 con una inversión acumulada estimada entre US$ 170 y 320 millones El
turismo receptivo será el principal motor de crecimiento del sector en los próximos
años
Chile tiene atractivos turísticos singulares que le entregan ventajas para
el posicionamiento turístico internacional en torno a conceptos de naturaleza y
outdoors:
•Principal oportunidad de Chile está en capturar mayor valor por turista
•Crecimiento en arribos internacionales aparece como segunda palanca
•Duración promedio de estadía con menor importancia dados altos
números actuales
Los principales desafíos se concentran en:
•Mayor promoción turística en el extranjero
•Mayor desarrollo de oferta de actividades y de productos en el destino
•Aumento de capacidades de gestión y de servicios de capital humano
•Mayor ordenamiento institucional en lo político y territorial
•Aumento de asociatividad en el sector
9.11.1Requerimiento de TIC
Las necesidades de I+D relacionadas con tecnologías para este cluster son:
•Sofisticar mecanismos de investigación y desarrollo para actividades de
turismo
•Mejora de las plataformas transversales de comunicación con el cliente,
lo cual genera un alto impacto dado que la iniciativa es esencialmente I+D
aplicada para la industria.
236
Capítulo IX: Necesidades futuras de Tecnologías de Información en Chile
9.12 Servicios Financieros
Los servicios financieros han evolucionado significativamente en los últimos
años a través de la globalización de negocios, avances tecnológicos y cambios
regulatorios, convirtiéndose en un sector altamente complejo y globalizado.
Chile tiene un mercado financiero desarrollado, pero de tamaño reducido
para estándares mundiales. Esta condición implica que convertir al sector financiero
en un sector exportable esté acotado sólo a algunas áreas (por ej.: derivados de
industrias particulares, como minería)
El impacto de un mayor desarrollo del sector tendrá importantísimos efectos
en el resto de la economía.
9.12.1Requerimiento de TIC
Desarrollar nuevas tecnológicas para crear y ampliar canales financieros, las
cuales permitan mejorar y/o superar los actuales de canales de comunicación con
el cliente (Internet, cajeros automáticos, call centers, etc.).
El mercado financiero entrega grandes oportunidades de desarrollo de
tecnologías avanzadas, y en la actualidad no existen iniciativas directas para su uso
en el sector.
Dos grandes ejemplos de avances en TIC implementados por esta industria son
los pórticos de las carreteras concesionadas y el sistema de pago de Transantiago.
237
BIBLIOGRAFIA
Revistas y Publicaciones:
Filippo Giorgi. Regionalización de la información sobre el cambio climático
para la evaluación de impactos y la adaptación a los mismos, Abril 2008.
Jorge E. Allende, Jorge Babel, Server Matínez, Tito Ureta. Análisis y
proyecciones de la ciencia chilena 2005.
Kevin E. Trenberth. Necesidades de observación para la protección y
adaptación climáticas. Boletín OMM. Enero de 2008.
CEAZA, Memorias 2008.
Organización Meteorológica Mundial, Guide lines Data management.
Rob Batchelder, industry analyst and president of Relevance.
Rodrigo Delgado y Claudio Baeza, C/CATT-BRAMS description for EELA-2
Grid School.
The Earth System Grid: Supporting the Next Generation of Climate Modeling
Research.
World Climate News OMM. Climate prediction and information for decisionmaking. Enero de 2009.
William Wrigth. Observando el Clima: Desafíos para el siglo XXI. Boletin
OMM. Enero de 2008.
Xuebin Zhang, Francis W. Zwiers y Thomas C. Peterson. La adaptación
imperativa: ¿está preparada la ciencia climática? Boletín de la OMM.
239
Entrevistas presénciales y escritas:
Ángel Muñoz, Sub-Director, Centro de Modelado Científico, Universidad del
Zulia, Venezuela.
Claudio Baeza, CMM, Universidad de Chile.
Don E. Middleton, Scientific Computing Division, National Center for
Atmospheric Research (NCAR).
Eugênio S. Almeida, Centro de Previsão de Tempo e Estudos, Climaticos
(CPTEC), Instituto Nacional de Pesquisas Espaciais (INPE). Ministério da
Ciência e Tecnologia (MCT), Brasil.
Juan Quintana. Oficina de Estudios Meteorológicos, Dirección Meteorológica
de Chile.
Laura Gallardo. Profesora Asociada, Departamento de Geofísica, Universidad
de Chile.
Maisa Rojas, Departamento Geofísica, Universidad de Chile.
Mark Falvey, Investigador Asociado, Departamento de Geofísica, Universidad
de Chile.
Melitta Fiebig, Investigador Institucional, Modelación Atmosférica, CEAZA.
René Garreaud. Profesor Asociado, Departamento de Geofísica, Universidad
de Chile.
Ricardo Alcafuz. Oficina de Modelamiento y Desarrollo, Dirección
Meteorológica de Chile.
Rodrigo Delgado Urzúa, Ingeniero de Proyectos, Laboratorio de Medio
Ambiente, CMM, U. de Chile.
Presentaciones:
Eugênio S. Almeida, Grid approach for environmental science in Braz
Frank Schmitz, A short Overview of KIT and SCC and the Future of Grid
Computing.
240
Rodrigo Delgado Urzúa, Implementación computacional de modelos
atmosféricos.
Páginas web:
http://applications.eu-eela.eu/application_details.php?ID=51
http://arxiv.org/pdf/0712.2262
http://www.atmet.com
http://www.ceaza.cl
http://www.cecs.cl
www.ciifen-int.org/images/stories/file/Proyecto%20BID_CIIFEN.pdf
www.ciifen-int.org/images/stories/file/Proyecto%20BID_CIIFEN.pdf
http://www.cmc.org.ve/documentos/GridONE2.pdf
http://www.dgf.uchile.cl/ACT19
http://datagrid.ucar.edu/esg/about/docs/ESGAMS_final.pdf
http://datagrid.ucar.edu/esg/about/docs/ewa.esg_sc01_chervenak_
final.pdf
http://www.dgf.uchile.cl/ACT19/
http://www.earthsystemgrid.org
http://eu-datagrid.web.cern.ch
http://www.eu-eela.eu
http://www.eu-egee.org
http://www.euindiagrid.eu
http://www.eurogrid.org
http://www.finep.gov.b
http://www.genesi-dr.eu/ 241
http://www.grid.phys.uvic.ca
http://www.iag.usp.br/
http://www.ime.usp.br/
http://www.iop.org/EJ/article/1742-6596/46/1/070/jpconf6_46_
070.pdf?request-id=eb75c3ad-2c5e-4e0f-a54a-f601d1ba4716
http://www.meteochile.cl/
http://opendap.org
http://www.opensciencegrid.org/
https://portal.leadproject.org
http://saemc.cmm.uchile.cl/
http://www7.cptec.inpe.br
http://www.jmarcano.com/varios/desastre/monzon.html.
Consultado 24 de mayo de 2009.
Major Hurricanes, Typhoons, Cyclones, and other Storms since 1900.
Encarta. Consultado el 24 de mayo de 2009. (http://encarta.msn.com/
media_701500587_761565992_-1_1/Major_Hurricanes_Typhoons_
Cyclones_and_other_Storms_since_1900.html)
Guiney, John L.; Lawrence, Miles B. (28 de enero de 1999). Hurricane Mitch
22 October - 05 November 1998. National Hurricane Center. Consultado el
24 de mayo de 2009. (http://www.nhc.noaa.gov/1998mitch.html)
The Deadliest Atlantic Tropical Cyclones, 1492-1996. National Hurricane
Center - National Weather Service. Consultado el 24 de mayo de 2009.
(http://www.nhc.noaa.gov/pastdeadlyapp1.shtml)
Landsea, Chris. Which is the most intense tropical cyclone on record? Atlantic
Oceanographic and Meteorological Laboratory, Hurricane. Consultado el 24
de mayo de 2009. (http://www.aoml.noaa.gov/hrd/tcfaq/E1.html)
Super Typhoon Paka’s (1997) Surface Winds Over Guam. Office of the Federal
Coordinator of Meteorological Services (17 de agosto de 1998). Consultado
el 24 de mayo de 2009. (http://www.aoml.noaa.gov/hrd/project98/sh_
proj1.html)
Landsea, Chris.Which are the largest and smallest tropical cyclones on
242
record? Atlantic Oceanographic and Meteorological Laboratory, Hurricane
Research Division. Consultado el 24 de mayo de 2009. (http://www.aoml.
noaa.gov/hrd/tcfaq/E5.html)
Hurricane Inikiki Natural Disaster Survey Report. Central Pacific Hurricane
Center - National Weather Service. Consultado el 24 de mayo de 2009.
(http://www.prh.noaa.gov/cphc/summaries/1992.php#Iniki)
Lawrence, Miles B. (7 de noviembre de 1997). Hurricane Pauline 5 - 10 October
1997. National Hurricane Center - National Weather Service. Consultado el
24 de mayo de 2009. (http://www.nhc.noaa.gov/1997pauline.html)
Hurricane Kenna 22 - 26 October 2002. National Hurricane Center - National
Weather Service. Consultado el 24 de mayo de 2009. (http://www.nhc.
noaa.gov/2002kenna.shtml)
Tropical Weather Summary. National Hurricane Centre - National Weather
Service. Consultado el 24 de mayo de 2009. (http://www.nhc.noaa.gov/
archive/2005/tws/MIATWSAT_aug.shtml)
Knabb, Richard D.; Rhome, Jamie R.; Brown, Daniel P. (20 de diciembre de
2005). Tropical Cyclone Report - Hurricane Katrina 23-30 August 2005 (PDF).
National Hurricane Center - National Weather Service. Consultado el 24 de
mayo de 2009. (http://www.nhc.noaa.gov/pdf/TCR-AL122005_Katrina.
pdf)
Biociencias
Sitios Web
BioMD (EELA 2, UFRJ, Brasil)
http://applications.eu-eela.eu/application_details.php?l=20&ID=50
BGBLAST (Italia)
geneva2007.healthgrid.org
BioSys (EELA 2, UCI y CIM, Cuba)
http://applications.eu-eela.eu/application_details.php?l=20&ID=68
BioNMF (EELA-2, UCM, España)
243
http://bionmfeela.dacya.ucm.es
BIG, BLAST en Grid (EELA 2, UPV, España)
http://sacmis.itaca.upv.es:8080/PortalBiG/Inicio/index.jsp
CardioGrid Portal (EELA 2, UBA, Argentina)
http://applications.eu-eela.eu/application_details.php?l=20&ID=15
DicomGrid (EELA 2, InCor-USP, Brasil)
http://applications.eu-eela.eu/application_details.php?l=20&ID=9
DYNADRUG (DEISA, National Research Council (CNR), Istituto di Chimica del
Riconoscimento Molecolare, Italy)
http://www.deisa.eu/science/deci/projects2009-2010/DYNADRUG
http://applications.eu-eela.eu/application_details.php?l=20&ID=55
MHOLline (EELA-2, UFRJ, Brasil)
http://applications.eu-eela.eu/application_details.php?l=20&ID=25
Squid - a simple bioinformatics grid (BMC Bioinformatics 2005, 6, 197)
http://www.dbbm.fiocruz.br/labwim/bioinfoteam/templates/archives/
squid/squid.html
Dist-SOM-PORTRAIT (EELA 2, UnB, Brasil)
http://applications.eu-eela.eu/application_details.php?l=20&ID=63
Biomedical Research Informatics Delivered by Grid Enables Services
BRIDGES (Glasgow, Edinburgh)
http://www.brc.dcs.gla.ac.uk/projects/bridges/index.html
DRI/mammogrid (EELA 2, MAAT, CETA.CEIMAT, España)
http://applications.eu-eela.eu/application_details.php?l=20&ID=32
DistBLAST (EELA 2, UnB, Brasil)
http://applications.eu-eela.eu/application_details.php?l=20&ID=49
G-HHMER (EELA 2, UNIANDES, Colombia)
244
http://applications.eu-eela.eu/application_details.php?l=20&ID=57
G-InterProScan (EELA-2, UNIANDES, Colombia)
http://applications.eu-eela.eu/app_list.php?l=20
GrEMBOSS (EELA-2, UNAM, México)
http://applications.eu-eela.eu/application_details.php?l=20&ID=11
GRIP (EELA-2, UFRO, Chile)
http://cmcc.ufro.cl/doku.php?id=Tratamiento_De_Imagenes
Heart Simulator (EELA 2, UFJF, Brasil)
http://applications.eu-eela.eu/application_details.php?l=20&ID=12
HeMolab (EELA 2, LNCC, Brasil)
http://www.lncc.br/prjhemo/main.htm
HPC Structure (EELA 2, CIP, Perú)
Integra-EPI (EELA 2, Mackenzie, Brasil)
http://telemedicina.unifesp.br/set/projetos/integraepi/entrada.php
eIMRT (EELA 2, CESGA, España)
http://eimrt.cesga.es
ESSM (BalticaGrid, República de Latvia)
http://www.balticgrid.eu
fMRI (EELA 2, UA, Portugal)
http://applications.eu-eela.eu/application_details.php?l=20&ID=10
eDiamond (www.ediamond.ox.ac.uk)
GAMOS (EELA-2, CIEMAT, España)
http://applications.eu-eela.eu/application_details.php?l=20&ID=33
GBIO (Laboratory of Bioinformatics and nmR for Structure Lyon, Francia)
gbio.ibcp.fr/ws
245
Grid Bio Portal (EELA-2, UPV, España)
Grid Enable BLAST (Proyecto de magíster en Francia)
www-sop.inria.fr
Grid – BLAST (Royal Institute of Technology, Suecia)
http://kthgridproxy.biotech.kth.se/grid_blast/index.html
GriPPS Grid Protein Pattern Scanning (Proyecto francés)
gripps.ibcp.fr
Grid Protein Sequence @nalysis (PBIL NPS, Lyon)
gpsa-pbil.ibcp.fr
HA-HELIX (DEISA, Università degli Studi di Torino, Italy)
http://www.deisa.eu/science/deci/projects2009-2010/HA-HELIX
MEGASIM (Cambridge University, UK)
http://www.deisa.eu/science/deci/projects2009-2010/MEGASIM
Molecular Modelling and Grid Computing (BIo-ICT, Italia)
www.cnr-bioinformatics.it
TotalEnz (University of Bristol, School of Chemistry, Bristol, UK)
http://www.deisa.eu/science/deci/projects2009-2010/TotEnz2
GenocodisGrid (EELA 2, UCM, España)
http://genecodis.dacya.ucm.es
Phylogenetics (EELA-2, UPV, España)
http://applications.eu-eela.eu/application_details.php?l=20&ID=39
Phylogrid (EELA-2, CEIMAT, España)
The Virtual Laboratory Project (WEHI and Monash U., Melbourne)
www.buyya.com/vlab
Comb-e-chem (Reino Unido)
246
www.combechem.org
BioCoRe (University of Illinois, EE.UU)
www.ks.uiuc.edu/Research/biocore
InvCell (EELA 2, UFJF, Brasil)
http://applications.eu-eela.eu/application_details.php?l=20&ID=61
INVTissue (EELA 2, UFJF, Brasil)
http://applications.eu-eela.eu/application_details.php?l=20&ID=62
MetaDock (EELA 2, UNAM, México)
Action-Grid www.action-grid.eu
EELA http://www.eu-eela.eu/
Proyecto UCRAV http://www.ucrav.cl/
Footnotes
1
http://www.cmc.org.ve/documentos/GridONE2.pdf
2 http://www.cmc.org.ve/documentos/GridONE2.pdf
3 http://www.cmc.org.ve/documentos/GridONE2.pdf
4 http://datagrid.ucar.edu/esg/about/docs/ewa.esg_sc01_
chervenak_final.pdf
5 http://datagrid.ucar.edu/esg/about/docs/ESGAMS_final.pdf
6 http://arxiv.org/pdf/0712.2262
7 http://www.iop.org/EJ/article/1742-6596/46/1/070/jpconf6_46_
070.pdf?request-id=eb75c3ad-2c5e-4e0f-a54a-f601d1ba4716
8 “Acceso y Gestión del conjunto de datos de los modelos climáticos, entregando también servicios de colaboración”.- 247
248
Paper Supporting the Next Generation of Climate Modeling Research
9
Publicación “The Earth System Grid: Supporting the Next Generation of Climate Modeling Research”
10
http://www.opensciencegrid.org/About/Learn_About_Us/OSG_
Organization/Members_and_Partners
11
http://www.opensciencegrid.org/About/Learn_About_Us/
Outreach
12
Stormy weather: grid computing powers fine-scale climate modeling, publicado en http://www.opensciencegrid.
org/About/What_We%27re_Doing/Research_Highlights/
Stormy_Weather
13
Imagen obtenida de http://wrf-model.org/plots/realtime_
hurricane4km.php
14
https://portal.leadproject.org/gridsphere/gridsphere?cid=intro
15
https://portal.leadproject.org/gridsphere/
gridsphere?cid=purpose
16
https://portal.leadproject.org/gridsphere/gridsphere?cid=lead-
grid
17
CAM-WRF, http://applications.eu-eela.eu/application_details.
php?ID=5
18
BRAMS,http://applications.eu-eela.eu/application_details.
php?ID=19
19
http://seghidro.lsd.ufcg.edu.br
20
http://www.atmet.com
21
http://www.ime.usp.br/
22
http://www.iag.usp.br/
23
http://www7.cptec.inpe.br
24
http://www.finep.gov.br
25
http://www.atmet.com
26 http://project.eu-egee.org/index.php?id=104
27
http://technical.eu-egee.org/index.php?id=255
28
http://technical.eu-egee.org/index.php?id=134
29
El Middleware es un software de conectividad que ofrece un conjunto de servicios que hacen posible el funcionamiento de a
plicaciones distribuidas sobre plataformas heterogéneas.
30
Traducción para Production Service infrastructure.
31
Traducción para Pre-Production Service (PPS).
32
The EGEE Network Operations Centre (ENOC)
33
http://www.genesi-dr.eu/
34
http://genesi-dr.terradue.com/news/_images.asp
35
Lowest Arctic ice coverage in history, http://genesi-dr.terradue.
com/news/_images.asp?id=18
36
Earth roughness and humidity captured by TerraSAR, http://
genesi-dr.terradue.com/news/_images.asp?id=22
37
Sand and dust from the Sahara Desert,
http://genesi-dr.terradue.com/news/_images.asp?id=16
38
Glory Over Pacific Ocean Clouds, http://genesi-dr.terradue.com/
news/_images.asp?id=15
39
http://www.eurogrid.org/wp2.html
40
http://www.euchinagrid.org/partners-engl.htm
41
http://www.euchinagrid.org/IPv6/index.html
42
http://www.euchinagrid.org/work_package.html
43
http://www.euindiagrid.eu/partner_listing
44
http://www.euindiagrid.eu/applications/earth-atmospheric-sciences
45
Viento que sopla en el sureste de Asia. En invierno sopla de la tierra al mar y es seco y frío, mientras que en verano sopla desde el océano a la tierra siendo cálido y húmedo, y trae abundantes lluvias: el monzón ha provocado grandes inundaciones.
249
250
46
http://www.worldcommunitygrid.org/about_us/
viewOurPartners.do
47
http://www.worldcommunitygrid.org/projects_showcase/ach/
viewAchMain.do?SearchParam=climate
48
http://www.csag.uct.ac.za/worldcommunitygrid
49
http://www.worldcommunitygrid.org/forums/wcg/
listthreads?forum=281
50
http://applications.eu-eela.eu/application_details.php?ID=51
51
Esquema facilitado por Melitta Fiebig.
52
Imagen entregada por Melitta Fiebig
53
http://saemc.cmm.uchile.cl/
54
www.ciifen-int.org/images/stories/file/Proyecto%20BID_CIIFEN.pdf
55
http://www.dgf.uchile.cl/ACT19
56
Memorias 2008 de CEAZA, disponible en http://www.ceaza.cl/
images/docs/memoria_ceaza_2008.pdf
57
Memorias 2008 de CEAZA, obra citada.
58
Memorias 2008 de CEAZA, obra citada.
59
http://www.ceaza.cl/index.php?option=com_content&task=vie
w&id=381&Itemid=84
60
http://www.ceaza.cl/index.php?option=com_content&task=cat
egory&sectionid=12&id=97&Itemid=84
61
Información proporcionada por Melitta Fiebig.
62
http://www.ceaza.cl/index.php?option=com_content&task=cat
egory&sectionid=16&id=79&Itemid=84
63
Información proporcionada por Melitta Fiebig.
64
http://www.ceaza.cl/index.php?option=com_content&task=cat
egory&sectionid=16&id=77&Itemid=84
65
http://www.ceaza.cl/index.php?option=com_content&task=cat
egory&sectionid=13&id=309&Itemid=84
66
Información proporcionada por Melitta Fiebig.
67
Porción de la superficie de la tierra donde el agua esta en forma solida.
68
http://www.uchile.cl
69
http://www.udec.cl
70
http://www.meteochile.cl
71
http://www.dgf.uchile.cl/ACT19
72
http://www.dgf.uchile.cl/ACT19
251

Documentos relacionados

Nuevas capacidades en el descubrimiento de recursos

Nuevas capacidades en el descubrimiento de recursos aunque existen iniciativas que tratan de usar técnicas aisladas para manejar algunas propiedades no funcionales o de calidad de servicio. En la presente tesis se proponen nuevas capacidades en el m...

Más detalles