Normas y Tendencias de Centro de Cómputo

Transcripción

Normas y Tendencias de Centro de Cómputo
Normatividad y tecnología
NORMAS Y TENDENCIAS
DE CENTROS DE CÓMPUTO
RCDD, Carlos Iván Zuluaga Vélez
Objetivos
Presentar la normatividad vigente respecto
a la infraestructura de centros de cómputo
Presentar las tendencias mundiales
actuales con respecto a la infraestructura
de centros de cómputo
Presentar un análisis de las anomalías más
comunes de los centros de cómputo en
latino América
Dar pautas para que los asistentes analicen
sus propias infraestructuras
Definiciones de Data Center
Norma ANSI/TIA 942:
Es un edificio o porción de un edificio cuya
función primaria es alojar una sala de
cómputo y sus áreas de soporte.
Search Data Center
Un Data Center es un área centralizada para
el almacenamiento, manejo y distribución de
los datos e información organizada alrededor
de un área de conocimiento o un negocio
particular. Un data center privado puede
existir dentro de las instalaciones de una
empresa o puede ser una instalación
especializada.
Antecedentes
Los centros de cómputo son el cerebro de
los sistemas de información de las
empresas, operando 24x7x365 con
requerimientos de altísima confiabilidad.
Cuando una empresa presenta un paro no
programado, se enfrenta a una situación
de sobrevivencia. Los costos y riesgos de
no recuperación son altos y ponen en
peligro la continuidad de muchas
compañías.
Algunas Estadísticas
Situació
a luego de un
Situación de una compañí
compañía
paro prolongado NO PROGRAMADO
Inicio
de falla
Tiempo má
máximo que
soporta la empresa sin
poner en riesgo su
integridad
Estadísticas causas Downtime
Fuente: AFCOM
Inversión en infraestructura vs.
Costos de down time
Fuente: AFCOM
Costos de Tiempo Fuera
(Down Time)
Fuente: EC&M Maagazine 2004
Normatividad - Definiciones
Código:
Es un documento emitido por las
autoridades locales o nacionales. Está
destinado a proteger la vida de las
personas y la integridad de las
edificaciones y activos. Tiene fuerza de
ley y es de obligatorio cumplimiento.
Normalmente es el documento que
utilizan los abogados y las compañías
de seguros para evaluar siniestros.
Normatividad - Definiciones
Norma (Estándar):
Son las condiciones mínimas
aceptables que determina una industria
para garantizar un adecuado
funcionamiento de un sistema
No tiene fuerza de ley pero
normalmente su cumplimiento está
atado a las garantías de los fabricantes
Normatividad
Retie. Reglamento Técnico de Instalaciones
Eléctricas, 2005
Código Eléctrico Colombiano, NTC 2050, 1986
Acuerdo 20 del Distrito, Código de Construcción
NFPA 70 National Electrical Code (NEC), 2005
ANSI/TIA 942, Telecommunications
Infrastructure for Data Centers Standard.
Manual de Métodos de Distribución de
Telecomunicaciones (TDMM) de Bicsi. Capítulo
8, “Equipment Room”.
Normatividad
NFPA 75 Standard for the Protection of Electronic
Computer/Data Processing Equipment, 2.003 Edition.
IEEE 1100-2005, Recommended Practice for Powering
and Grounding Sensitive Electronic Equipment.
TIA/EIA 568 B2.1 Commercial Building
Telecommunications Wiring Standards.
TIA/EIA 569A Commercial Building Standard for
Telecommunications Pathways and Spaces.
Thermal Guide for Data Processing Environments.
ASHRAE (American Society of Heating, Refrigerating and
Air Conditioning Engineers, Inc)
Recomendaciones de fabricantes de equipos de cómputo
para instalación de sus equipos (site prep).
Niveles (Tiers) de data centers,
según ANSI-TIA 942
Nivel
(Tier) I. Básico:
Rutas
únicas
Sin componentes redundantes
Es susceptible de interrupciones por actividades
planeadas y no planeadas. La UPS, aires y
generadores son módulos simples y tienen múltiples
puntos sencillos de falla. Las cargas críticas pueden
ser expuestas a apagones durante mantenimientos
preventivos o correctivos. Errores de operación o
fallas espontáneas de la los componentes de
infraestructura causarán interrupciones en el centro
de cómputo.
Niveles (Tiers) de data centers,
según ANSI-TIA 942
Nivel
(Tier) II. Componentes redundantes :
Rutas únicas
Componentes redundantes
Son significativamente menos susceptibles de
interrupciones que el Tier 1 por actividades
planeadas y no planeadas. El diseño de UPS y
Generadores necesita redundancia N+1, pero
tienen un solo camino de distribución. El
mantenimiento de las rutas críticas de potencia y
otras partes de la infraestructura, requerirán de
un proceso de “shut down”
Niveles (Tiers) de data centers,
según ANSI-TIA 942
Nivel (Tier) III. Permite hacer
mantenimientos sin interrupciones:
Rutas duales o múltiples
Sistema multimódulo
Doble ruta de alimentación de potencia
Pérdida de redundancia durante falla o
mantenimiento.
Permite realizar actividades de mantenimiento planeadas
sin tener que suspender servicios de hardware. Esto
incluye labores de mantenimiento preventivo, correctivo,
adición o remoción de equipos. Tiene suficiente
disponibilidad en uno de los caminos cuando se estén
haciendo trabajos al otro. No queda con redundancia
cuando se hacen esos trabajos. Normalmente se diseña
con opción de convertirse en Tier 4 cuando las operaciones
del negocio así lo exijan.
Niveles (Tiers) de data centers,
según ANSI-TIA 942
Nivel (Tier) IV. Tolerante de Fallas
Múltiples rutas
Componentes redundantes
Fuente dual de potencia crítica garantizada
No hay pérdida de redundancia durante una
falla sencilla o mantenimiento
Proporciona la seguridad de no presentar interrupciones
en las cargas críticas durante actividades planeadas o no.
Conserva la redundancia aun durante labores de
mantenimiento a uno de los caminos. La única forma de
tener un “shut down” es mediante la activación del Botón
de Apagado de Emergencia (EPO) que exigen los códigos.
El estándar ANSI/TIA/942, (Telecommunications Infrastructure for Data Center) divide en cuatro
subsistemas los aspectos de infraestructura física de los Data Center: Telecomunicaciones,
Arquitectónico, Eléctrico y Mecánico; y clasifica en cuatro niveles (tiers) la configuración de
estos subsistemas.
Infraestructura Data Center
Subsistemas
Niveles (tiers)
I
Telecomunicaciones
x
Arquitectónico
x
x
Eléctrico
Mecánico
ANSI: American National Standards Institute
TIA: Telecommunications Industry Association
II
x
III
IV
PRINCIPALES CARACTERÍSTICAS DE LOS “TIERS” SEGÚN LA NORMA
ANSI/TIA 942
SUBSISTEMA ARQUITECTÓNICO
Tier 1
Tier 2
Tier 3
No debe haber historias
de inundación
durante los últimos
100 años y de 50
años a menos de
91 metros
Proximidad a áreas de inundación
registradas por las autoridades
NA
No permitido
dentro de
áreas
Proximidades a autopistas
NA
NA
No menos de 91 metros
Tier 4
No debe haber
historias de
inundación
durante los
últimos 100
años a menos
de 91 metros
No menos de 0.8 Km
Proximidad a aeropuertos
NA
NA
No menos de 1.6 Kms y
no más de 48 Kms
No menos de 8 Kms
y no mas de 48
Kms
Areas de parqueo de visitantes y
empleados separados
NA
NA
Si, físicamente
separadas por una
barrera o pared
18.3 mts de
separación con
barreras físicas
Edificio con diferentes dueños
NA
Permitido si no
hay riesgos
en los
ocupantes
Permitido si todos los
ocupantes son
compañías de TC
Debe cumplir con requerimientos de NFPA
75
NA
Si
Si
Permitido si todos
los ocupantes
son compañías
de data centers
o TC
Si
Subsistema Arquitectónico
Evaluación de Riesgos
Evaluación de los diferentes riesgos en los aspectos de
infraestructura que causen pérdidas o daño a los sistemas y
equipos del Data Center.
VANDALISMO
FUEGO
POLVO
INUNDACIÓN
INTRUSOS
PRINCIPALES CARACTERÍSTICAS DE LOS “TIERS” SEGÚN LA NORMA
ANSI/TIA 942
Tier 1
Tier 2
Tier 3
Tier 4
No
No
Si
Si
1
1
Uno activo uno
pasivo
Dos activos
Alimentación sencilla
Alimentación sencilla
Alimentación dual
Alimentación dual
Redundancia en generador
N
N
N+1
2N
Cables de alimentación de
equipos de cómputo y
comunicaciones
Uno
Dos
Dos
Dos
No tiene
No tiene
SUBSISTEMA ELÉCTRICO
Permite hacer mantenimientos
sin shut down
Número de rutas de
alimentación
Acometida de proveedor
externo de energía
Puntos sencillos de falla
Autonomía de combustible
Redundancia en UPS
Topología de UPS
Botón de apagado de
emergencia (EPO)
Uno o mas puntos
sencillos de falla
para el sistema
para sistemas de
distribución que
alimentan equipo
eléctrico o HVAC
Uno o mas puntos
sencillos de falla
para el sistema
para sistemas de
distribución que
alimentan equipo
eléctrico o HVAC
8 horas
24 horas
72 horas
96 horas
N
N+1
N+1
2N
módulo sencillo
Paralelo redundante
o distribuido
redundante
Paralelo redundante
o distribuido
redundante
Paralelo redundante
o distribuido
redundante
Si
Si
Si
Si
Topología Típica - Tier I (Eléctrica)
Topología Típica - Tier II (Eléctrica)
Topología Típica - Tier III (Eléctrica)
Topología Típica - Tier IV (Eléctrica)
PRINCIPALES CARACTERISTICAS DE LOS TIERS SEGÚN LA NORMA
ANSI/TIA 942
Subsistema Telecomunicaciones
Tier I
Tier II
Tier III
Tier IV
Entrada de Proveedores de acceso
diversificadas con mínimo 20
metros de separación
No
Si
Si
Si
Cuarto de entrada de TC
secundario
No
No
Si
Si
Rutas de backbone redundantes
No
No
Si
Si
Routers y switches con fuente de
alimentación redundante
No
Si
Si
Si
Subsistema de
Telecomunicaciones
PRINCIPALES CARACTERISTICAS DE LOS TIERS SEGÚN LA NORMA
ANSI/TIA 942
Sub Sistema Mecánico
Tier 2
Tier 3
Tier 4
No tiene unidades
redundantes
Una unidad
redundante por
área crítica
Cantidad de
unidades AC
suficiente para
mantener el área
crítica durante la
pérdida de una
fuente de potencia
eléctrica
Cantidad de unidades
AC suficiente para
mantener el área
crítica durante la
pérdida de una fuente
de potencia eléctrica
Alimentación eléctrica para
equipos de aire
Camino sencillo
Camino sencillo
Múltiples caminos
Múltiples caminos
Tuberías para refrigerantes
Camino sencillo
Camino sencillo
Camino doble
Camino doble
Si
Si
Si
Si
Redundancia de unidades de aire
acondicionado
Sistemas de extinción automática
con supresión por agua o agente
limpio
Tier 1
Problemas más comunes en
Latino América
Desconocimiento de los códigos y normas.
Mínima utilización de barreras cortafuegos.
Muy poca documentación.
Ausencia del botón de parada de emergencia (EPO)
exigido por los códigos.
Falta de entrenamiento en casos de emergencia con
empleados y visitantes.
Diseños sobredimensionados en infraestructura eléctrica.
Múltiple puntos sencillos de falla en redes eléctricas y
aire acondicionado.
Desconocimiento de guías de ASHRAE para diseño de
flujo de aire.
Múltiples puntos de escape de aire acondicionado.
Poco análisis de riesgos de inundación.
Conexiones equipotenciales para la puesta a tierra
erróneas.
Problemas más comunes en
Latino América
Desconocimiento de los códigos y normas.
Mínima utilización de barreras cortafuegos.
Muy poca documentación.
Ausencia del botón de parada de emergencia (EPO)
exigido por los códigos.
Falta de entrenamiento en casos de emergencia con
empleados y visitantes.
Diseños sobredimensionados en infraestructura eléctrica.
Múltiple puntos sencillos de falla en redes eléctricas y
aire acondicionado.
Desconocimiento de guías de ASHRAE para diseño de
flujo de aire.
Múltiples puntos de escape de aire acondicionado.
Poco análisis de riesgos de inundación.
Conexiones equipotenciales para la puesta a tierra
erróneas.
Configuración apropiada de los
sistemas de acceso y seguridad
Problemas más comunes en
Latino América
Desconocimiento de los códigos y normas.
Mínima utilización de barreras cortafuegos.
Muy poca documentación.
Ausencia del botón de parada de emergencia (EPO)
exigido por los códigos.
Falta de entrenamiento en casos de emergencia con
empleados y visitantes.
Diseños sobredimensionados en infraestructura eléctrica.
Múltiple puntos sencillos de falla en redes eléctricas y
aire acondicionado.
Desconocimiento de guías de ASHRAE para diseño de
flujo de aire.
Múltiples puntos de escape de aire acondicionado.
Poco análisis de riesgos de inundación.
Conexiones equipotenciales para la puesta a tierra
erróneas.
Problemas más comunes en
Latino América
Desconocimiento de los códigos y normas.
Mínima utilización de barreras cortafuegos.
Muy poca documentación.
Ausencia del botón de parada de emergencia (EPO)
exigido por los códigos.
Falta de entrenamiento en casos de emergencia con
empleados y visitantes.
Diseños sobredimensionados en infraestructura eléctrica.
Múltiple puntos sencillos de falla en redes eléctricas y
aire acondicionado.
Desconocimiento de guías de ASHRAE para diseño de
flujo de aire.
Múltiples puntos de escape de aire acondicionado.
Poco análisis de riesgos de inundación.
Conexiones equipotenciales para la puesta a tierra
erróneas.
Flujo de aire en
el Data Center
Problemas más comunes en
Latino América
Desconocimiento de los códigos y normas.
Mínima utilización de barreras cortafuegos.
Muy poca documentación.
Ausencia del botón de parada de emergencia (EPO)
exigido por los códigos.
Falta de entrenamiento en casos de emergencia con
empleados y visitantes.
Diseños sobredimensionados en infraestructura eléctrica.
Múltiple puntos sencillos de falla en redes eléctricas y
aire acondicionado.
Desconocimiento de guías de ASHRAE para diseño de
flujo de aire.
Múltiples puntos de escape de aire acondicionado.
Poco análisis de riesgos de inundación.
Conexiones equipotenciales para la puesta a tierra
erróneas.
Problemas más comunes en
Latino América
Desconocimiento de los códigos y normas.
Mínima utilización de barreras cortafuegos.
Muy poca documentación.
Ausencia del botón de parada de emergencia (EPO)
exigido por los códigos.
Falta de entrenamiento en casos de emergencia con
empleados y visitantes.
Diseños sobredimensionados en infraestructura eléctrica.
Múltiple puntos sencillos de falla en redes eléctricas y
aire acondicionado.
Desconocimiento de guías de ASHRAE para diseño de
flujo de aire.
Múltiples puntos de escape de aire acondicionado.
Poco análisis de riesgos de inundación.
Conexiones equipotenciales para la puesta a tierra
erróneas.
Evaluación de riesgos
de inundación y fugas
de agua por factores
internos y externos
Problemas más comunes en
Latino América
Desconocimiento de los códigos y normas.
Mínima utilización de barreras cortafuegos.
Muy poca documentación.
Ausencia del botón de parada de emergencia (EPO)
exigido por los códigos.
Falta de entrenamiento en casos de emergencia con
empleados y visitantes.
Diseños sobredimensionados en infraestructura eléctrica.
Múltiple puntos sencillos de falla en redes eléctricas y
aire acondicionado.
Desconocimiento de guías de ASHRAE para diseño de
flujo de aire.
Múltiples puntos de escape de aire acondicionado.
Poco análisis de riesgos de inundación.
Conexiones equipotenciales para la puesta a tierra
erróneas.
TENDENCIAS ACTUALES
Altísima densidad de equipos, lo que genera grandes consumos
de energía y altas temperaturas en muy poco espacio.
Los fabricantes de equipo de cómputo están buscando hacer más
eficientes en consumo de energía sus equipos.
Los fabricantes de equipos de HVAC están buscando alternativas más
eficientes.
Los administradores de los data centers están buscando minimizar las
pérdidas de aire acondicionado.
Para los diseños de control de temperatura y humedad, se está
imponiendo el sistema de CFD.
Certificación de los data centers (UPTIME INSTITUTE, ICREA)
Énfasis en la Prevención y Recuperación de Desastres.
Mantenimiento Predictivo reemplaza al Preventivo.
Monitoreo Remoto de todos los sistemas de infraestructura y
reducción de la intervención humana.
Assessments anuales de infraestructura
El Data Center del Futuro
Fuente: Liebert Corp.
Conclusiones
Para realizar los diseños de los centros de cómputo es obligatorio
cumplir con los códigos y muy recomendable cumplir con los
estándares.
La norma ANSI-TIA 942 clasifica en cuatro niveles la infraestructura
de centros de cómputo siendo el “tier 1” el básico y el “tier 4” a
prueba de fallas
La norma ANSI-TIA 942 divide la infraestructura en los subsistemas
de Telecomunicaciones, Arquitectónico, Eléctrico y Mecánico.
La herramienta básica para una empresa determinar en que nivel
debe tener su centro de cómputo, es el costo de una interrupción
(“Down Time”)
Para incrementar la confiabilidad de una infraestructura se deben
eliminar los “puntos sencillos de falla”.
La tendencia actual es tener equipos de alto consumo en muy poco
espacio, lo que genera soluciones específicas para alta densidad.
El mantenimiento preventivo y las revisiones anuales de
infraestructura son una buena práctica para minimizar los riesgos de
interrupciones.
Existen instituciones internacionales que certifican infraestructuras de
centros de cómputo.
MUCHAS GRACIAS!!!
Carlos Iván Zuluaga Vélez
Teléfono (57-1) 368 94 84
Email: [email protected]
www.gzingenieria.com