Sistemas modulares: Evolución de la confiabilidad

Transcripción

Sistemas modulares: Evolución de la confiabilidad
Sistemas modulares:
Evolución de la
confiabilidad
Por Neil Rasmussen
Suzanne Niles
Informe interno
N° 76
Resumen ejecutivo
La naturaleza demostró desde los comienzos que, en un sistema complejo, los diseños
modulares son los que sobreviven y se desarrollan. Un importante factor que contribuye a esa
capacidad es la ventaja clave en términos de confiabilidad que ofrece la tolerancia a las fallas,
en virtud de la cual un sistema modular, ante la falla de ciertos módulos, puede seguir
operando con los módulos que funcionan correctamente mientras se realizan las reparaciones
necesarias. En el campo de los centros de datos, la noción de diseño modular ya se ha
instalado en las nuevas arquitecturas que ofrecen tolerancia a las fallas para servidores y
sistemas de almacenamiento. A medida que los centros de datos siguen evolucionando y
adoptando elementos del diseño de la naturaleza, la infraestructura física para redes críticas
(NCPI) también debe evolucionar para dar cabida a nuestras estrategias de supervivencia,
recuperación y crecimiento.
2005 American Power Conversion. Todos los derechos reservados. Queda prohibida la utilización, reproducción, fotocopiado,
transmisión o almacenamiento en cualquier sistema de recuperación de cualquier tipo de esta publicación, en todo o en parte, sin el
consentimiento escrito del titular del derecho de autor. www.apc.com
Rev 2005-0
2
Introducción
La modularidad es una técnica establecida para organizar y simplificar un sistema complejo. Desde los
ejemplos más elementales (las pilas de una linterna) hasta los más complejos (las células de un
organismo), el éxito histórico de la modularidad es difícil de cuestionar. No obstante, cuando se trata de
sistemas creados por el hombre que están por atravesar un proceso de transición evolutiva del diseño
monolítico al modular, puede haber escepticismo y comienzos lentos hasta que la modularidad se instale y
comience a rendir los frutos inherentes a su probada eficacia.
La infraestructura física para redes críticas (NCPI) de los centros de datos se encuentra en esa etapa de
transición. Mientras que las ventajas evidentes desde el punto de vista físico de la arquitectura de bloques
de construcción –escalabilidad, flexibilidad, simplicidad y transportabilidad– se comprenden con facilidad y
no suelen cuestionarse demasiado, en la industria bajo análisis un aspecto del diseño modular se ha
convertido en objeto de debate: la confiabilidad.
La aplicación de la simple modalidad clásica de análisis de la confiabilidad de sistemas a esta nueva
forma de hacer las cosas (“más partes implican mayor riesgo de fallas”) resulta, en el mejor de los casos,
incompleta y, en el peor de los casos, engañosa. En este informe s e pretende ilustrar, mediante estudios
de casos, el hecho de que la modularidad no solo brinda los beneficios que resultan más obvios y fáciles
de entender, sino un beneficio más sutil, menos comprendido y más importante en términos de
confiabilidad: la tolerancia a las fallas. La capacidad de tolerancia a las fallas inherente al diseño modular
proporciona una nueva y potente defensa contra las fallas, al introducir en los sistemas complejos una
estrategia de confiabilidad que no solo resulta adecuada, sino superior a lo buscado.
Estudio de caso tomado de la naturaleza: Primeras
formas de vida
Foto cortesía de David Walker, Brian
Darnton
La historia de la modularidad es mucho más antigua que
Primera forma de vida unicelular compleja
los centros de datos y las pilas de linternas. Algunos de los
sistemas no modulares más antiguos –los organis mos
unicelulares – vivían en la Tierra hace tres mil millones de
años. El registro fósil de esos organismos revela que
desarrollaron conchas, tentáculos, bocas, brazos, pinzas y
otras tantas estructuras intrincadas. Algunos adquirieron
tamaños sorprendente s, hasta seis pulgadas (15
centímetros) de ancho. Esos complejos diseños
2005 American Power Conversion. Todos los derechos reservados. Queda prohibida la utilización, reproducción, fotocopiado,
transmisión o almacenamiento en cualquier sistema de recuperación de cualquier tipo de esta publicación, en todo o en parte, sin el
consentimiento escrito del titular del derecho de autor. www.apc.com
Rev 2005-0
3
unicelulares monolíticos dominaron la cadena alimentaria elemental de la Tierra durante miles de
millones de años.
Más tarde, hace unos 500 millones de años, surgieron los organismos multicelulares. En tan solo
decenas de millones de años, evolucionaron tan rápido que echaron por tierra tres mil millones de años de
evolución de los complicados organismos unicelulares y, reemplazando a estos últimos, se convirtieron en
la forma de vida dominante.
La modularidad como ventaja de los organismos multicelulares
¿Por qué prevaleció la estructura modular y multicelular sobre
la arraigada estructura monolítica?
•
•
•
•
•
Escalabilidad y capacidad de crecimiento. El
crecimiento de los sistemas, tanto en términos de
tamaño como de incorporación de nuevas
capacidades, se lograba con el solo agregado de
módulos (células) que podían interactuar con las
existentes empleando interfaces estándar.
Primera forma de vida multicelular
Proceso de duplicación más simple. Duplicar cierta
cantidad de células más pequeñas y menos complejas era más sencillo, rápido y confiable que
duplicar un única célula complicada.
Capacidad de contar con funciones especializadas por módulo. La delegación y especialización
de las tareas de las células proporcionaba los n iveles de eficacia y eficiencia propios del trabajo en
equipo. En los primeros organismos multicelulares, un tipo de célula podía cumplir la función de
locomoción, otro, la de protección, otro, la de percepción de la presencia de alimento, y así
sucesivamente.
Rápida adaptación al entorno. Mediante el agregado, la eliminación o la modificación de células,
era posible poner a prueba cambios estructurales incrementales con mayor rapidez, a fin de
adoptarlos o rechazarlos.
Tolerancia a las fallas. Gracias a las células redundantes, no se degradaba el sistema ante la falla
de células individuales, lo que permitía la "reparación” concurrente de células sin tiempo de
inactividad del sistema (discapacidad o muerte en este caso).
El último atributo mencionado arriba, la tolerancia a las fallas, es una ventaja clave en términos de
confiabilidad de los sistemas modulares respecto de los monolíticos. La modularidad divide un sistema
en piezas más pequeñas, lo que facilita la redundancia de los componentes, a fin de q ue ante la falla de
uno, o varios, de ellos no se vea afectado de manera adversa el funcionamiento del sistema. Con un
simple raspón, la piel humana puede perder cientos de células; sin embargo, nuestro cuerpo no deja de
funcionar a causa de esa pérdida. Otras células siguen adelante mientras se hacen las reparaciones
necesarias. Los humanos no inventamos la modularidad: somos modulares. Con billones de módulos
(células) por persona, día a día vivimos en carne propia las ventajas de la tolerancia a las fallas.
2005 American Power Conversion. Todos los derechos reservados. Queda prohibida la utilización, reproducción, fotocopiado,
transmisión o almacenamiento en cualquier sistema de recuperación de cualquier tipo de esta publicación, en todo o en parte, sin el
consentimiento escrito del titular del derecho de autor. www.apc.com
Rev 2005-0
4
En los tiempos en que los centros de datos estaban
compuestos de grandes computadoras
(mainframe), los dispositivos de almacenamiento
eran voluminosos discos duros de diseño
exclusivo, con platos metálicos de 14 pulgadas
ubicados uno sobre otro, elaborados mecanismos
Mainframe IBM 3370
Almacenamiento en disco
Foto © IBM Archives,
reproducción autorizada
Estudio de caso tomado del campo de la informática:
Unidades de disco
de lectura y escritura, y gabinetes del tamaño de
una lavadora. En 1978, en IBM patentaron la idea de usar sistemas de discos más pequeños, pero no la
llevaron adelante porque pensaron que una estructura de ese tipo nunca sería tan confiable como los
diseños monolíticos convencionales. El estudio y la puesta en práctica de la tolerancia a las fallas recién
empezaban a desarrollarse, y básicamente estaban restringidas a l a industria aeroespacial, en la que la
falla de componentes de sistemas electrónicos podía costar vidas.1
En 1987, los investigadores de Berkeley advirtieron la creciente brecha entre la velocidad computacional y
la velocidad de acceso para almacenamiento , y vieron el surgimiento de las unidades de disco externas
para las computadoras personales como una oportunidad para emplearlas como bloques de construcción
de un sistema que ofreciera tasas de transferencia de datos más veloces. Un año más tarde presentaron
un estudio histórico, "Razones para implementar Conjuntos de discos redundantes económicos (RAID)” (A
Case for Redundant Arrays of Inexpensive Disks (RAID)), en el que proponían diversos esquemas para
escritura de datos (“niveles RAID”) que podían emplear esos sistemas para almacenar, recuperar y
restablecer datos. En 1990, la teoría y el hardware se fundieron en la utilización de los discos de 5,25
pulgadas para computadoras personales, que habían evolucionado tanto como para ofrecer la capacidad,
el rendimiento y la confiabilidad necesarios para su uso en los primeros sistemas RAID. Esos nuevos
dispositivos de almacenamiento modulares ofrecían distintas relaciones entre redundancia y velocidad de
lectura y escritura, y ocupaban una fracción del espacio en el piso necesario para instalar los grandes
dispositivos de almacenamiento que reemplazaron.
1
Hoy, en el marco de una realidad en la que las operaciones informáticas son el centro de casi toda industria, incluidas
las áreas de salud y actividades militares, los centros de datos pueden ser esenciales. Y tanto es así que una falla podría
ocasionar la pérdida de vidas. Por lo tanto, la tolerancia a las fallas es cada vez más importante para su diseño, incluso
independientemente de lo que dictaminen los intereses económicos.
2005 American Power Conversion. Todos los derechos reservados. Queda prohibida la utilización, reproducción, fotocopiado,
transmisión o almacenamiento en cualquier sistema de recuperación de cualquier tipo de esta publicación, en todo o en parte, sin el
consentimiento escrito del titular del derecho de autor. www.apc.com
Rev 2005-0
5
La modularidad como ventaja de los sistemas RAID
¿Por qué prevalecieron los sistemas RAID sobre los antiguos
dispositivos de almacenamiento monolíticos?
•
•
•
•
•
Escalabilidad y capacidad de crecimiento. Es posible
aumentar fácilmente la capacidad de almacenamiento
aumentando la cantidad de módulos por sistema, o
agregando sistemas.
Sistema RAID
Proceso de duplicación más simple. Es mucho más fácil producir las múltiples unidades
pequeñas que funcionan como módulos del sistema RAID que las grandes y complicadas
unidades de antes.
Capacidad de contar con funciones especializadas por módulo. Las diferentes unidades de un
sistema RAID pueden emplearse para obtener mayor capacidad de almacenamiento, velocidad de
acceso o redundancia, según cuál sea el nivel RAID definido para el sistema. Asimismo, los
sistemas RAID en sí mismos pueden considerarse módulos en una escala mayor, y puede
asignarse una aplicación diferente a cada sistema RAID.
Rápida adaptación al entorno. Es posible agregar o eliminar unidades, y modificar fácilmente el
nivel RAID para contemplar las relaciones deseadas entre capacidad, velocidad y redundancia.
Tolerancia a las fallas. Los esquemas de escritura de datos de los sistemas RAID incorporan
niveles de redundancia tales que permiten recuperar datos cuando falla una unidad.
Para sorpresa de sus diseñadores, la entusiasta recepción de los sistemas RAID en el mercado no se
debió tanto a la mayor velocidad que ofrecían –el objetivo que impulsó su diseño– sino a la mayor
confiabilidad que proporcionaba la característica de tolerancia a las fallas. Hasta que los autores del
estudio de 1988 mostraron las posibilidades de tolerancia a las fallas del diseño RAID –durante
presentaciones en vivo no hacían más que retirar una unidad sin que se interrumpiera el funcionamiento
del sistema–, había predominado la forma típica, aunque errónea, de interpretar la confiabilidad, previa al
desarrollo del concepto de tolerancia a las fallas: un sistema integrado por unidades múltiples debía ser
menos confiable porque tenía más piezas.
Estudio de caso tomado del campo de la informática:
Servidores Blade
Los servidores Blade son el elemento central en el proceso de transición hacia el diseño modular que está
registrándose mientras escribimos el presente informe. Durante muchos años, los servidores
autosoportados tradicionales crecieron en tamaño y velocidad, y les fueron asignadas cada vez más tareas
a medida que la informática en red s e expandía. A medida que surgían nuevas necesidades se
incorporaban servidores en los centros de datos, por lo general como solución rápida, sin demasiada
coordinación ni planificación. No era raro que los operadores de centros de datos advirtieran que se habían
2005 American Power Conversion. Todos los derechos reservados. Queda prohibida la utilización, reproducción, fotocopiado,
transmisión o almacenamiento en cualquier sistema de recuperación de cualquier tipo de esta publicación, en todo o en parte, sin el
consentimiento escrito del titular del derecho de autor. www.apc.com
Rev 2005-0
6
agregado servidores sin su conocimiento. La consecuente complejidad de los bloques y el cableado cada
vez generaba más confusión, errores e inflexibilidad.
Los servidores Blade, cuya aparición data de 2001, son un
ejemplo puro y muy simple de la arquitectura modular: las
unidades de un chasis de servidores Blade son idénticas
desde el punto de vista físico, tienen procesadores
idénticos, y pueden configurarse y emplearse para
cualquier fin que desee el usuario. Su lanzamiento sumó
muchos de los b eneficios de la modularidad al campo de
los servidores: escalabilidad, facilidad de duplicación,
Servidores convencionales
funciones especializadas y adaptabilidad.
Pero si bien esas ventajas clásicas de la arquitectura modular han hecho que los servidores Blade tengan
cada vez más presencia en los centros de datos, su máximo potencial no se aprovechará hasta tanto no se
implemente de manera generalizada una capacidad clave del diseño modular: la tolerancia a las fallas. No
hace mucho que se encuentran disponibles en el mercado con valores accesibles los servidores Blade
que ofrecen tolerancia a las fallas –servidores que tienen incorporada una lógica de “failover” para
transferir la operación de las unidades que presentan fallas a las que funcionan correctamente –. Los
niveles de confiabilidad de esos servidores sobrepasarán los alcanzados con las técnicas habituales en la
actualidad, que consisten en emplear software redundante y clusters de servidores individuales. Así, los
servidores Blade constituirán la arquitectura de servidores dominante en los centros de datos. Con la
automatización de la función de tolerancia a las fallas, los analistas de la industria pronostican una rápida
migración a los servidores Blade en el curso de los próximos cinco años.
La modularidad como ventaja de los servidores Blade
¿Por qué prevalecerán los servidores Blade sobre los servidores autosoportados más voluminosos?
•
•
Escalabilidad y capacidad de crecimiento. Es posible aumentar
fácilmente la capacidad computacional mediante la incorporación
de módulos (unidades Blade).
Proceso de duplicación más simple. Es mucho más fácil producir
múltiples unidades Blade pequeñas que servidores enteros. El
suministro de energía, los ventiladores del sistema de
refrigeración, las conexiones de la red y otros componentes de
respaldo se encuentran centralizados en el chasis y son
compartidos por las unidades Blade, lo que simplifica la
estructura.
Servidor Blade
(10 unidades Blade en un
chasis)
2005 American Power Conversion. Todos los derechos reservados. Queda prohibida la utilización, reproducción, fotocopiado,
transmisión o almacenamiento en cualquier sistema de recuperación de cualquier tipo de esta publicación, en todo o en parte, sin el
consentimiento escrito del titular del derecho de autor. www.apc.com
Rev 2005-0
7
•
•
•
Capacidad de contar con funciones especializadas por módulo. Cada unidad Blade
independiente pueden configurarse con las a plicaciones de software que desee el usuario.
Rápida adaptación al entorno. Es posible agregar o eliminar unidades Blade en función de las
necesidades de negocios o financieras, así como reconfigurarlas para ejecutar distintas
aplicaciones.
Tolerancia a las fallas. Gracias a la lógica de “failover” incorporada, que transfiere sin
inconvenientes la operación de las unidades que presentan fallas a otras, es posible hacer frente a
la falla de una unidad de manera automática.
La cambiante definición de falla en el campo de los
sistemas informáticos
Los estudios de casos precedentes revelan el predominio del diseño modular sobre el complejo diseño
monolítico, que responde a motivos inherentes a la naturaleza de la modularidad. Uno de esos motivos, la
tolerancia a las fallas, tiene gran importancia para el futuro de los centros de datos. Cuando todos los
servidores y dispositivos de almacenamiento de los centros de datos ofrezcan la característica de
tolerancia a las fallas, cambiará la definición de falla en el contexto informático.
Imaginemos dos casos de fallas diferentes que pueden producirse en un centro de datos (Figura 1). A la
derecha se ilustra la falla de todos los racks, como la que se produciría en el caso de que fallara la única
UPS grande que protege todo el centro de datos, lo que causaría la caída de la carga. A la derecha se
muestra la falla de un rack. En los centros de datos convencionales, a los ojos de los gerentes de
Sistemas, en ambos casos se trataría de la misma falla, porque –en el caso de la falla de un rack– la
interdependencia de servidores, sistemas de discos, switches y routers seguramente causaría efectos en
cascada que dejarían inactivo todo el centro de datos.
A medida que comienzan a imponerse los nuevos diseños modulares basados en conjuntos de
componentes tanto para la actividad computacional como para el almacenamiento, los gerentes de
Sistemas comienzan a ver la falla ilustrada a la izquierda –un rack– como un tipo de falla “menos mala”,
dado que la redundancia de recursos ahora ofrece la posibilidad de supervivencia del centro de datos
incluso ante la falla de las unidades independientes. A medida que las arquitecturas que ofrecen tolerancia
a las fallas se difundan, los centros de datos admitirán una mayor cantidad de fallas de unidades sin que
se produzca la caída total de los sistemas. Cuando sea un hecho la capacidad de tolerar fallas sin
inconvenientes que prometen desde sus comienzos los servidores Blade, los centros de datos podrán
permanecer activos ante la falla de un rack, o incluso de dos, tres o más.
2005 American Power Conversion. Todos los derechos reservados. Queda prohibida la utilización, reproducción, fotocopiado,
transmisión o almacenamiento en cualquier sistema de recuperación de cualquier tipo de esta publicación, en todo o en parte, sin el
consentimiento escrito del titular del derecho de autor. www.apc.com
Rev 2005-0
8
Figura 1 – Dos casos de fallas que pueden producirse en un centro de datos
Vista de planta, cuatro hileras de ocho racks cada una
Falla un rack
Fallan todos los racks
Implicaciones para la NCPI
El nuevo paradigma de la gestión de fallas –la expectativa de que inevitablemente algunos módulos
fallarán, combinada con un esquema sólido que permita superar las fallas – tiene implicaciones respecto
del modo en que la nueva arquitectura informática debería verse protegida por su infraestructura física para
redes críticas. Por ejemplo, a medida que los centros de datos ofrecen mayor tolerancia a las fallas en su
capa informática, resultará insatisfactorio ofrecer protección de energía con una única UPS grande, dado
que la falla de esa UPS haría caer todo el sistema, un resultado innecesario en un centro de datos
tolerante a las fallas capaz de superar la pérdida de un rack. Si las unidades UPS se encuentran
distribuidas en todo el centro de datos, a razón de una UPS por rack, la falla de cualquiera de las unidades
UPS solo interrumpirá el funcionamiento de un rack, no de todo el sistema. A pesar del mayor número de
unidades UPS, que aumenta las probabilidades de fallas de unidades UPS independientes, el sistema
puede tolerar esas fallas. Si para que quede fuera de funcionamiento todo el sistema deben fallar tres
racks, deberán fallar tres unidades UPS simultáneamente para que se produzca la caída del sistema,
evento muy poco probable, mucho menos probable que la falla de una única UPS grande. Por ese motivo,
la teoría de la confiabilidad respalda enfáticamente las arquitecturas de energía y refrigeración modulares
distribuidas a medida que los sistemas informáticos ofrecen mayor grado de tolerancia a las fallas.
NCPI monolítica vs. NCPI modular
La arquitectura de la infraestructura física para redes críticas (NCPI) ha permanecido en gran medida
invariable en los 30 años de historia de los centros de datos. Desde las salas de cómputos más
pequeñas hasta las infraestructuras empresariales más grandes, el modelo persistente de infraestructura
2005 American Power Conversion. Todos los derechos reservados. Queda prohibida la utilización, reproducción, fotocopiado,
transmisión o almacenamiento en cualquier sistema de recuperación de cualquier tipo de esta publicación, en todo o en parte, sin el
consentimiento escrito del titular del derecho de autor. www.apc.com
Rev 2005-0
9
física ha consistido en una “planta” centralizada para el suministro
de protección de energía y refrigeración. La implementación de esa
clase de infraestructura da como resultado una configuración única y
monolítica de equipos y conexiones. Al reemplazar una arquitectura
como la descrita por un diseño modular, no solo se posibilita que la
NCPI respalde adecuadamente los equipos informáticos modulares
y tolerantes a las fallas, sino que los propios componentes de la
NCPI pueden aprovechar los beneficios de la modularidad, incluidas
UPS monolítica centralizada
las ventajas de confiabilidad que ofrece la tolerancia a las fallas.
La modularidad como ventaja de la NCPI
¿Por qué reemplazará la NCPI modular a la NCPI monolítica convencional?
•
Escalabilidad y capacidad de crecimiento. Una NCPI modular puede dimensionarse para
contemplar los requisitos informáticos del centro de datos en un momento dado, y crecer en
función de las necesidades. Esta ventaja es especialmente importante en relación con l a NCPI,
dado que, según las prácticas tradicionales, se implementan sistemas de energía y refrigeración
para ofrecer soporte a los requisitos informáticos máximos proyectados, lo que genera un
importante desperdicio tanto en concepto de gastos de capital como operativos.
•
Proceso de duplicación más simple. El diseño modular implica producir una gran cantidad de
unidades pequeñas, en lugar de una pequeña cantidad de grandes unidades. El mayor volumen
de producción implica menos defectos; el diseño más simple y pequeño implica mayor grado de
automatización y menos trabajo manual durante la producción, lo que implica menos defectos.
•
Capacidad de contar con funciones especializadas por módulo. Las unidades de protección de
energía y refrigeración pueden producirse en una variedad de configuraciones para satisfacer las
necesidades específicas de disponibilidad y refrigeración de diferentes partes del centro de datos.
•
Rápida adaptación al entorno. Con la incorporación de nuevos
equipos y los cambios de los componentes informáticos cada dos
o tres años, los elementos del centro de datos se revisan
permanentemente. Los nuevos equipos pueden tener diferentes
tamaños o formas, diferentes requisitos de energía o
refrigeración, diferentes tomacorrientes, etcétera. Es posible
UPS modular por rack
expandir o reconfigurar la NCPI modular fácilmente para contemplar los requisitos de IT
cambiantes.
2005 American Power Conversion. Todos los derechos reservados. Queda prohibida la utilización, reproducción, fotocopiado,
transmisión o almacenamiento en cualquier sistema de recuperación de cualquier tipo de esta publicación, en todo o en parte, sin el
consentimiento escrito del titular del derecho de autor. www.apc.com
Rev 2005-0
10
•
Tolerancia a las fallas. Así como los equipos informáticos tolerantes a fallas permiten la operación
continua del centro de datos cuando falla un com ponente informático, los equipos tolerantes a
fallas de la NCPI permiten la operación continua de los sistemas de energía o refrigeración cuando
falla un componente de la NCPI. La tolerancia a las fallas se logra mediante la implementación de
unidades de N CPI redundantes, o mediante la redundancia interna de los componentes que
integran esas unidades de NCPI, por ejemplo, trabajando con módulos de potencia adicionales en
una UPS.
Al igual que en los estudios de casos anteriores, los primeros cuatro atributos precedentes son
necesarios para el éxito del diseño, pero el quinto –la tolerancia a las fallas – es esencial. Más aun, como
el centro de datos depende absolutamente de la energía y la refrigeración para su funcionamiento, es tan
importante contar con niveles de confiabilidad basados en la tolerancia a las fallas en la NCPI como en los
equipos informáticos que esta protege. Un centro de datos tolerante a fallas que no cuente con el respaldo
de una NCPI tolerante a las fallas no tendría más sentido que un puente colgante con un pedestal sólido
pero con cables débiles.
Conclusión
La transición del diseño monolítico al modular constituye un camino evolutivo natural para los sistemas
complejos, a causa de las ventajas que ofrece el segundo en cuanto a eficiencia, flexibilidad y
confiabilidad. El análisis de casos de éxito permite advertir más fácilmente las posibilidades que ofrece la
modularidad para introducir mejoras importantes, incluso revolucionarias en sistemas que fueron
monolíticos desde su concepción y que nunca fueron comprendidos de otra forma. La tolerancia a las
fallas y otros atributos clave de la modularidad –escalabilidad, adaptabilidad, y capacidad de
especialización y duplicación– son tan evidentes, e inevitables, en los sistemas modulares creados por el
hombre como lo eran en los naturales.
El mundo informático ya ha sido testigo de las ventajas mencionadas con el surgimiento de diseños
modulares para esquemas de almacenamiento y tareas computacionales: sistemas RAID y servidores
Blade. Y más importante aun, los centros de datos ya están preparados para seguir el ejemplo de
industrias como la aeroespacial, e implementar en todos sus sistemas la ventaja de la modularidad que
se aplica a los sistemas de misión crítica desde la década de 1970: la tolerancia a las fallas. En la noción
de tolerancia a las fallas se admite el hecho de que el control cuidadoso de la calidad de los componentes
es solo el primer paso hacia la confiabilidad de los sistemas, y que la operación continua de los sistemas
ante la falla de componentes es la táctica más importante en materia de confiabilidad.
2005 American Power Conversion. Todos los derechos reservados. Queda prohibida la utilización, reproducción, fotocopiado,
transmisión o almacenamiento en cualquier sistema de recuperación de cualquier tipo de esta publicación, en todo o en parte, sin el
consentimiento escrito del titular del derecho de autor. www.apc.com
Rev 2005-0
11
A medida que la modularidad y la tolerancia a las fallas se convierten en el nuevo modelo de diseño de
centros de datos, la infraestructura física para redes críticas debe avanzar en la misma dirección, tanto para
proteger los centros de datos con eficacia como para aprovechar los beneficios de la modularidad a fin de
mejorar sus propios niveles de eficiencia, flexibilidad y confiabilidad.
Informes internos relacionados
Informe interno de APC Nº 117, “Infraestructura física para redes críticas: Optimización del valor de negocio”
Informe interno de APC Nº 116, “Estandarización y modularidad en la Infraestructura física para redes
críticas”
Acerca de los autores
Neil Rasmussen es uno de los fundadores y Director de Tecnología de American Power Conversion. En
APC, administra el mayor presupuesto mundial de Investigación y Desarrollo dedicado al tema de la
infraestructura de energía, refrigeración y racks para redes críticas; los principales centros de desarrollo de
productos se ubican en Massachusetts, Missouri, Dinamarca, Rhode Island, Taiwán e Irlanda. En la
actualidad, lidera los proyectos de APC para el desarrollo de soluciones modulares escalables para
centros de datos.
Antes de fundar APC en el año 1981, Neil recibió los títulos de Bachelor y Master en Ingeniería Eléctrica del
MIT, donde realizó su tesis sobre el análisis de una fuente de potencia de 200 mW para un reactor de
fusión Tokamak. Desde 1979 hasta 1981, trabajó para MIT Lincoln Laboratories en sistemas de
almacenamiento energético de volante y sistemas de energía eléctrica solar.
Suzanne Niles es autora de informes internos para el Centro de Estudios de la Infraestructura Física para
Redes Críticas (NCPI) de APC. Estudió matemáticas en el Wellesley College y obtuvo el título de Bachelor
en Ciencias Informáticas en el MIT, con una tesis sobre reconocimiento de caracteres manuscritos. Ha
contribuido a la formación de públicos diversos por más de 25 años utilizando diferentes medios, desde
manuales de software hasta fotografías y canciones para niños.
2005 American Power Conversion. Todos los derechos reservados. Queda prohibida la utilización, reproducción, fotocopiado,
transmisión o almacenamiento en cualquier sistema de recuperación de cualquier tipo de esta publicación, en todo o en parte, sin el
consentimiento escrito del titular del derecho de autor. www.apc.com
Rev 2005-0
12

Documentos relacionados