Normas y Tendencias de Centro de Cómputo
Transcripción
Normas y Tendencias de Centro de Cómputo
Normatividad y tecnología NORMAS Y TENDENCIAS DE CENTROS DE CÓMPUTO RCDD, Carlos Iván Zuluaga Vélez Objetivos Presentar la normatividad vigente respecto a la infraestructura de centros de cómputo Presentar las tendencias mundiales actuales con respecto a la infraestructura de centros de cómputo Presentar un análisis de las anomalías más comunes de los centros de cómputo en latino América Dar pautas para que los asistentes analicen sus propias infraestructuras Definiciones de Data Center Norma ANSI/TIA 942: Es un edificio o porción de un edificio cuya función primaria es alojar una sala de cómputo y sus áreas de soporte. Search Data Center Un Data Center es un área centralizada para el almacenamiento, manejo y distribución de los datos e información organizada alrededor de un área de conocimiento o un negocio particular. Un data center privado puede existir dentro de las instalaciones de una empresa o puede ser una instalación especializada. Antecedentes Los centros de cómputo son el cerebro de los sistemas de información de las empresas, operando 24x7x365 con requerimientos de altísima confiabilidad. Cuando una empresa presenta un paro no programado, se enfrenta a una situación de sobrevivencia. Los costos y riesgos de no recuperación son altos y ponen en peligro la continuidad de muchas compañías. Algunas Estadísticas Situació a luego de un Situación de una compañí compañía paro prolongado NO PROGRAMADO Inicio de falla Tiempo má máximo que soporta la empresa sin poner en riesgo su integridad Estadísticas causas Downtime Fuente: AFCOM Inversión en infraestructura vs. Costos de down time Fuente: AFCOM Costos de Tiempo Fuera (Down Time) Fuente: EC&M Maagazine 2004 Normatividad - Definiciones Código: Es un documento emitido por las autoridades locales o nacionales. Está destinado a proteger la vida de las personas y la integridad de las edificaciones y activos. Tiene fuerza de ley y es de obligatorio cumplimiento. Normalmente es el documento que utilizan los abogados y las compañías de seguros para evaluar siniestros. Normatividad - Definiciones Norma (Estándar): Son las condiciones mínimas aceptables que determina una industria para garantizar un adecuado funcionamiento de un sistema No tiene fuerza de ley pero normalmente su cumplimiento está atado a las garantías de los fabricantes Normatividad Retie. Reglamento Técnico de Instalaciones Eléctricas, 2005 Código Eléctrico Colombiano, NTC 2050, 1986 Acuerdo 20 del Distrito, Código de Construcción NFPA 70 National Electrical Code (NEC), 2005 ANSI/TIA 942, Telecommunications Infrastructure for Data Centers Standard. Manual de Métodos de Distribución de Telecomunicaciones (TDMM) de Bicsi. Capítulo 8, “Equipment Room”. Normatividad NFPA 75 Standard for the Protection of Electronic Computer/Data Processing Equipment, 2.003 Edition. IEEE 1100-2005, Recommended Practice for Powering and Grounding Sensitive Electronic Equipment. TIA/EIA 568 B2.1 Commercial Building Telecommunications Wiring Standards. TIA/EIA 569A Commercial Building Standard for Telecommunications Pathways and Spaces. Thermal Guide for Data Processing Environments. ASHRAE (American Society of Heating, Refrigerating and Air Conditioning Engineers, Inc) Recomendaciones de fabricantes de equipos de cómputo para instalación de sus equipos (site prep). Niveles (Tiers) de data centers, según ANSI-TIA 942 Nivel (Tier) I. Básico: Rutas únicas Sin componentes redundantes Es susceptible de interrupciones por actividades planeadas y no planeadas. La UPS, aires y generadores son módulos simples y tienen múltiples puntos sencillos de falla. Las cargas críticas pueden ser expuestas a apagones durante mantenimientos preventivos o correctivos. Errores de operación o fallas espontáneas de la los componentes de infraestructura causarán interrupciones en el centro de cómputo. Niveles (Tiers) de data centers, según ANSI-TIA 942 Nivel (Tier) II. Componentes redundantes : Rutas únicas Componentes redundantes Son significativamente menos susceptibles de interrupciones que el Tier 1 por actividades planeadas y no planeadas. El diseño de UPS y Generadores necesita redundancia N+1, pero tienen un solo camino de distribución. El mantenimiento de las rutas críticas de potencia y otras partes de la infraestructura, requerirán de un proceso de “shut down” Niveles (Tiers) de data centers, según ANSI-TIA 942 Nivel (Tier) III. Permite hacer mantenimientos sin interrupciones: Rutas duales o múltiples Sistema multimódulo Doble ruta de alimentación de potencia Pérdida de redundancia durante falla o mantenimiento. Permite realizar actividades de mantenimiento planeadas sin tener que suspender servicios de hardware. Esto incluye labores de mantenimiento preventivo, correctivo, adición o remoción de equipos. Tiene suficiente disponibilidad en uno de los caminos cuando se estén haciendo trabajos al otro. No queda con redundancia cuando se hacen esos trabajos. Normalmente se diseña con opción de convertirse en Tier 4 cuando las operaciones del negocio así lo exijan. Niveles (Tiers) de data centers, según ANSI-TIA 942 Nivel (Tier) IV. Tolerante de Fallas Múltiples rutas Componentes redundantes Fuente dual de potencia crítica garantizada No hay pérdida de redundancia durante una falla sencilla o mantenimiento Proporciona la seguridad de no presentar interrupciones en las cargas críticas durante actividades planeadas o no. Conserva la redundancia aun durante labores de mantenimiento a uno de los caminos. La única forma de tener un “shut down” es mediante la activación del Botón de Apagado de Emergencia (EPO) que exigen los códigos. El estándar ANSI/TIA/942, (Telecommunications Infrastructure for Data Center) divide en cuatro subsistemas los aspectos de infraestructura física de los Data Center: Telecomunicaciones, Arquitectónico, Eléctrico y Mecánico; y clasifica en cuatro niveles (tiers) la configuración de estos subsistemas. Infraestructura Data Center Subsistemas Niveles (tiers) I Telecomunicaciones x Arquitectónico x x Eléctrico Mecánico ANSI: American National Standards Institute TIA: Telecommunications Industry Association II x III IV PRINCIPALES CARACTERÍSTICAS DE LOS “TIERS” SEGÚN LA NORMA ANSI/TIA 942 SUBSISTEMA ARQUITECTÓNICO Tier 1 Tier 2 Tier 3 No debe haber historias de inundación durante los últimos 100 años y de 50 años a menos de 91 metros Proximidad a áreas de inundación registradas por las autoridades NA No permitido dentro de áreas Proximidades a autopistas NA NA No menos de 91 metros Tier 4 No debe haber historias de inundación durante los últimos 100 años a menos de 91 metros No menos de 0.8 Km Proximidad a aeropuertos NA NA No menos de 1.6 Kms y no más de 48 Kms No menos de 8 Kms y no mas de 48 Kms Areas de parqueo de visitantes y empleados separados NA NA Si, físicamente separadas por una barrera o pared 18.3 mts de separación con barreras físicas Edificio con diferentes dueños NA Permitido si no hay riesgos en los ocupantes Permitido si todos los ocupantes son compañías de TC Debe cumplir con requerimientos de NFPA 75 NA Si Si Permitido si todos los ocupantes son compañías de data centers o TC Si Subsistema Arquitectónico Evaluación de Riesgos Evaluación de los diferentes riesgos en los aspectos de infraestructura que causen pérdidas o daño a los sistemas y equipos del Data Center. VANDALISMO FUEGO POLVO INUNDACIÓN INTRUSOS PRINCIPALES CARACTERÍSTICAS DE LOS “TIERS” SEGÚN LA NORMA ANSI/TIA 942 Tier 1 Tier 2 Tier 3 Tier 4 No No Si Si 1 1 Uno activo uno pasivo Dos activos Alimentación sencilla Alimentación sencilla Alimentación dual Alimentación dual Redundancia en generador N N N+1 2N Cables de alimentación de equipos de cómputo y comunicaciones Uno Dos Dos Dos No tiene No tiene SUBSISTEMA ELÉCTRICO Permite hacer mantenimientos sin shut down Número de rutas de alimentación Acometida de proveedor externo de energía Puntos sencillos de falla Autonomía de combustible Redundancia en UPS Topología de UPS Botón de apagado de emergencia (EPO) Uno o mas puntos sencillos de falla para el sistema para sistemas de distribución que alimentan equipo eléctrico o HVAC Uno o mas puntos sencillos de falla para el sistema para sistemas de distribución que alimentan equipo eléctrico o HVAC 8 horas 24 horas 72 horas 96 horas N N+1 N+1 2N módulo sencillo Paralelo redundante o distribuido redundante Paralelo redundante o distribuido redundante Paralelo redundante o distribuido redundante Si Si Si Si Topología Típica - Tier I (Eléctrica) Topología Típica - Tier II (Eléctrica) Topología Típica - Tier III (Eléctrica) Topología Típica - Tier IV (Eléctrica) PRINCIPALES CARACTERISTICAS DE LOS TIERS SEGÚN LA NORMA ANSI/TIA 942 Subsistema Telecomunicaciones Tier I Tier II Tier III Tier IV Entrada de Proveedores de acceso diversificadas con mínimo 20 metros de separación No Si Si Si Cuarto de entrada de TC secundario No No Si Si Rutas de backbone redundantes No No Si Si Routers y switches con fuente de alimentación redundante No Si Si Si Subsistema de Telecomunicaciones PRINCIPALES CARACTERISTICAS DE LOS TIERS SEGÚN LA NORMA ANSI/TIA 942 Sub Sistema Mecánico Tier 2 Tier 3 Tier 4 No tiene unidades redundantes Una unidad redundante por área crítica Cantidad de unidades AC suficiente para mantener el área crítica durante la pérdida de una fuente de potencia eléctrica Cantidad de unidades AC suficiente para mantener el área crítica durante la pérdida de una fuente de potencia eléctrica Alimentación eléctrica para equipos de aire Camino sencillo Camino sencillo Múltiples caminos Múltiples caminos Tuberías para refrigerantes Camino sencillo Camino sencillo Camino doble Camino doble Si Si Si Si Redundancia de unidades de aire acondicionado Sistemas de extinción automática con supresión por agua o agente limpio Tier 1 Problemas más comunes en Latino América Desconocimiento de los códigos y normas. Mínima utilización de barreras cortafuegos. Muy poca documentación. Ausencia del botón de parada de emergencia (EPO) exigido por los códigos. Falta de entrenamiento en casos de emergencia con empleados y visitantes. Diseños sobredimensionados en infraestructura eléctrica. Múltiple puntos sencillos de falla en redes eléctricas y aire acondicionado. Desconocimiento de guías de ASHRAE para diseño de flujo de aire. Múltiples puntos de escape de aire acondicionado. Poco análisis de riesgos de inundación. Conexiones equipotenciales para la puesta a tierra erróneas. Problemas más comunes en Latino América Desconocimiento de los códigos y normas. Mínima utilización de barreras cortafuegos. Muy poca documentación. Ausencia del botón de parada de emergencia (EPO) exigido por los códigos. Falta de entrenamiento en casos de emergencia con empleados y visitantes. Diseños sobredimensionados en infraestructura eléctrica. Múltiple puntos sencillos de falla en redes eléctricas y aire acondicionado. Desconocimiento de guías de ASHRAE para diseño de flujo de aire. Múltiples puntos de escape de aire acondicionado. Poco análisis de riesgos de inundación. Conexiones equipotenciales para la puesta a tierra erróneas. Configuración apropiada de los sistemas de acceso y seguridad Problemas más comunes en Latino América Desconocimiento de los códigos y normas. Mínima utilización de barreras cortafuegos. Muy poca documentación. Ausencia del botón de parada de emergencia (EPO) exigido por los códigos. Falta de entrenamiento en casos de emergencia con empleados y visitantes. Diseños sobredimensionados en infraestructura eléctrica. Múltiple puntos sencillos de falla en redes eléctricas y aire acondicionado. Desconocimiento de guías de ASHRAE para diseño de flujo de aire. Múltiples puntos de escape de aire acondicionado. Poco análisis de riesgos de inundación. Conexiones equipotenciales para la puesta a tierra erróneas. Problemas más comunes en Latino América Desconocimiento de los códigos y normas. Mínima utilización de barreras cortafuegos. Muy poca documentación. Ausencia del botón de parada de emergencia (EPO) exigido por los códigos. Falta de entrenamiento en casos de emergencia con empleados y visitantes. Diseños sobredimensionados en infraestructura eléctrica. Múltiple puntos sencillos de falla en redes eléctricas y aire acondicionado. Desconocimiento de guías de ASHRAE para diseño de flujo de aire. Múltiples puntos de escape de aire acondicionado. Poco análisis de riesgos de inundación. Conexiones equipotenciales para la puesta a tierra erróneas. Flujo de aire en el Data Center Problemas más comunes en Latino América Desconocimiento de los códigos y normas. Mínima utilización de barreras cortafuegos. Muy poca documentación. Ausencia del botón de parada de emergencia (EPO) exigido por los códigos. Falta de entrenamiento en casos de emergencia con empleados y visitantes. Diseños sobredimensionados en infraestructura eléctrica. Múltiple puntos sencillos de falla en redes eléctricas y aire acondicionado. Desconocimiento de guías de ASHRAE para diseño de flujo de aire. Múltiples puntos de escape de aire acondicionado. Poco análisis de riesgos de inundación. Conexiones equipotenciales para la puesta a tierra erróneas. Problemas más comunes en Latino América Desconocimiento de los códigos y normas. Mínima utilización de barreras cortafuegos. Muy poca documentación. Ausencia del botón de parada de emergencia (EPO) exigido por los códigos. Falta de entrenamiento en casos de emergencia con empleados y visitantes. Diseños sobredimensionados en infraestructura eléctrica. Múltiple puntos sencillos de falla en redes eléctricas y aire acondicionado. Desconocimiento de guías de ASHRAE para diseño de flujo de aire. Múltiples puntos de escape de aire acondicionado. Poco análisis de riesgos de inundación. Conexiones equipotenciales para la puesta a tierra erróneas. Evaluación de riesgos de inundación y fugas de agua por factores internos y externos Problemas más comunes en Latino América Desconocimiento de los códigos y normas. Mínima utilización de barreras cortafuegos. Muy poca documentación. Ausencia del botón de parada de emergencia (EPO) exigido por los códigos. Falta de entrenamiento en casos de emergencia con empleados y visitantes. Diseños sobredimensionados en infraestructura eléctrica. Múltiple puntos sencillos de falla en redes eléctricas y aire acondicionado. Desconocimiento de guías de ASHRAE para diseño de flujo de aire. Múltiples puntos de escape de aire acondicionado. Poco análisis de riesgos de inundación. Conexiones equipotenciales para la puesta a tierra erróneas. TENDENCIAS ACTUALES Altísima densidad de equipos, lo que genera grandes consumos de energía y altas temperaturas en muy poco espacio. Los fabricantes de equipo de cómputo están buscando hacer más eficientes en consumo de energía sus equipos. Los fabricantes de equipos de HVAC están buscando alternativas más eficientes. Los administradores de los data centers están buscando minimizar las pérdidas de aire acondicionado. Para los diseños de control de temperatura y humedad, se está imponiendo el sistema de CFD. Certificación de los data centers (UPTIME INSTITUTE, ICREA) Énfasis en la Prevención y Recuperación de Desastres. Mantenimiento Predictivo reemplaza al Preventivo. Monitoreo Remoto de todos los sistemas de infraestructura y reducción de la intervención humana. Assessments anuales de infraestructura El Data Center del Futuro Fuente: Liebert Corp. Conclusiones Para realizar los diseños de los centros de cómputo es obligatorio cumplir con los códigos y muy recomendable cumplir con los estándares. La norma ANSI-TIA 942 clasifica en cuatro niveles la infraestructura de centros de cómputo siendo el “tier 1” el básico y el “tier 4” a prueba de fallas La norma ANSI-TIA 942 divide la infraestructura en los subsistemas de Telecomunicaciones, Arquitectónico, Eléctrico y Mecánico. La herramienta básica para una empresa determinar en que nivel debe tener su centro de cómputo, es el costo de una interrupción (“Down Time”) Para incrementar la confiabilidad de una infraestructura se deben eliminar los “puntos sencillos de falla”. La tendencia actual es tener equipos de alto consumo en muy poco espacio, lo que genera soluciones específicas para alta densidad. El mantenimiento preventivo y las revisiones anuales de infraestructura son una buena práctica para minimizar los riesgos de interrupciones. Existen instituciones internacionales que certifican infraestructuras de centros de cómputo. MUCHAS GRACIAS!!! Carlos Iván Zuluaga Vélez Teléfono (57-1) 368 94 84 Email: [email protected] www.gzingenieria.com