Contingencia y recuperación
Transcripción
Contingencia y recuperación
01/04/2013 | Ingelan | 934 302 989 Monitorización de la Infraestructura de Sistemas de Información/Operación Laboratorio “Realidades y necesidades distintas requieren de planteamientos y soluciones diferentes” Monitorizar los sistemas de información/operación permite detectar e identificar cambios a lo largo del tiempo, y con ello se consigue: Asegurar de que se cumplen las condiciones establecidas, que el rendimiento y utilización de la infraestructura está dentro de un rango previsto detectar niveles anormales de actividad y/o cambios no autorizados para que, en caso anómalo se advierta al grupo adecuado. Monitorizar la infraestructura permite también comprobar el nivel de servicio que se está prestando y garantizar que casa con los requisitos de calidad y rendimiento acordados. Custom Network Manager (CNM) es una Herramienta de Monitorización de la Infraestructura IT en su sentido más amplio que suministra la más amplia gama de prestaciones para garantizar una cuidadosa y exhaustiva monitorización de la infraestructura, por muy compleja que pueda ser. Bien implementada onsite, en las instalaciones del cliente, bien como instrumento para suministrar servicios gestionados, CNM facilita la gestión de los avisos, alertas y comunicaciones necesarias para asegurar los objetivos. Versión 3 – Noviembre 2013 2 Funciones soportadas CNM gestiona los siguientes componentes, que se describen en los apartados correspondientes: Inventario IT Central de Alertas Plataforma para el Análisis de Impacto Plataforma para la Gestión de la Capacidad Plataforma para el ‘Troubleshooting’ Repositorio Centralizado de Conocimiento Caracterización de Dispositivos (Campos BD Dispositivos) Notas y referencias a documentación externa Tickets de Operación Gestor de Tareas Reporting Plataforma de Inventario Permite identificar y caracterizar los dispositivos que han de ser controlados y monitorizados Dispone de campos definibles por el usuario a fin de acumular toda la información útil que permita una gestión eficiente y adecuada. La lista es exportable/importable a/desde .csv. Central de Alertas Éste módulo realiza la monitorización de toda la infraestructura con generación de alertas cuando se producen incidencias con los dispositivos o se superan los umbrales de funcionamiento definidos por el usuario. Las situaciones de alerta se monitorizan continuamente y las alertas desaparecen automáticamente (pasan al histórico) cuando desaparece la condición de alerta. Las Alertas generadas se pueden convertir en Avisos específicos vía e-mail, SMS o Trap SNMP. A las alertas generadas se les puede poner un ACK y/o vincular un ticket de incidencia. Cada alerta tiene asociado un Dashboard con información detallada de la alerta. Módulo de Análisis de Comportamiento La recogida continuada de datos se presenta de forma gráfica en ventana diaria (últimos 7 días), semanal, mensual y anual con lo que se dispone de información histórica de comportamiento de cualquier métrica definida en el sistema. Esta información unida a la capacidad que proporcionan las vistas para presentar agrupaciones de métricas en base a cualquier criterio permite medir el impacto sobre partes de la infraestructura de cualquier cambio o modificación introducida en la misma. Nuevos equipos, nuevas aplicaciones, ampliaciones de infraestructura, cambios de ubicación, cambios de configuración, etc…, son aspectos que pueden modificar el comportamiento de otras partes de la infraestructura de manera no anticipada o incluso no deseada. Ingelan – Monitorización de la Infraestructura de Sistemas de Información/Operación – Enero de 2014 3 Como solución CNM puede desplegarse como solución bajo el control de los servicios de explotación de la compañía. Esta forma de operar permite prestar una atención exhaustiva a los usuarios y garantizar la proactividad, identificando las causas-raiz de los problemas a fin de que puedan solventarse antes de que se compliquen. Plataforma de Gestión de la Capacidad Disponer de información de cómo evoluciona en el tiempo el nivel de ocupación de los recursos es la base necesaria para realizar una adecuada gestión de la capacidad de los sistemas. La información histórica disponible en forma gráfica de todas y cada una de las métricas monitorizadas proporciona la información necesaria para estimar cuando se agotarán determinados recursos y poder tomar las medidas oportunas para racionalizar el uso o ampliar la capacidad antes de que ocurra. Plataforma de Troubleshooting La central de alertas avisa del momento en que se produce una incidencia y proporciona información de la afectación de la misma. Cuando se analiza la incidencia en busca de la causa es fundamental poder disponer de información de estados anteriores para poder entender cómo se ha llegado a una determinada situación. No se puede prever una avería hardware pero si que se puede prever un mal funcionamiento debido a la degradación de una o varias métricas, de uno o varios dispositivos, y una vez observado el comportamiento se pueden establecer umbrales de alerta para avisar cuando el proceso se esté reproduciendo para tomar medidas correctivas antes de que se produzca la incidencia. En ocasiones la degradación podrá ser debida a un problema específico relativo al comportamiento de los dispositivos observados pero en ocasiones puede ser el fruto de una modificación o ampliación realizada en alguna otra parte de la infraestructura. Las vistas proporcionan los mecanismos para poder agrupar lo que pensamos puede ser causa y efecto, y observar el comportamiento para determinar si realmente existe relación. Ingelan – Monitorización de la Infraestructura de Sistemas de Información/Operación – Enero de 2014 Como servicio Esta alternativa, basada en la prestación del servicio de monitorización y supervisión por parte de una compañía externa capaz de prestarlo, permite abaratar costes debido a las economías de escala que puede significar compartir los recursos con otras compañías. En la definición del Nivel de Servicio (SLA) habrán de contemplarse ámbito, parámetros a supervisar, acciones previstas en caso de problemas, indicadores de rendimiento y otros extremos que ayuden a clarificar las responsabilidades en cada caso. 4 Repositorio Centralizado de Conocimiento La información necesaria para explotar adecuadamente una infraestructura IT suele estar dispersa en la organización. Inventario de equipos, Contratos de Mantenimiento, Manuales, Configuraciones, Cambios de configuraciones, Personas Responsables, detalles de contacto, procedimientos de actuación, …, es información que en el mejor de los casos está documentada pero dispersa y en el peor de los casos solo está, o al menos una parte de ella, en la cabeza de quienes explotan diariamente la infraestructura. Estas situaciones crean una fuerte dependencia de las personas que explotan la infraestructura y no sirve a los intereses de la organización. El CNM permite la gestión centralizada del conocimiento y proporciona los mecanismos para que el conocimiento quede vinculado a la infraestructura y no a las personas que la operan. Los mecanismos que permiten la gestión y la centralización del conocimiento son los siguientes: Base de Datos de dispositivos con todos los campos necesarios para caracterizarlos adecuadamente, p.ej: nombre, nº activo, nº serie, función, ubicación, responsable, contacto, empresa mantenimiento, … La información contenida en la base de datos se presenta en formato de ficha como el primer item de la documentación de un dispositivo. Notas fechadas y vinculadas a: Dispositivos: o Descripciones del dispositivo y sus funciones. o Notas de operación (Cambios de configuración HW o SW) o Referencias a documentación externa: Manuales, Procedimientos, … o Referencias a documentación subida al CNM. Métricas: o Descripción de la métrica y de lo que mide. o Anotaciones adicionales… Monitores: o Descripción del monitor, de qué representa la alerta y una descripción genérica de lo que puede implicar. o Anotaciones adicionales… Alertas: o Las alertas en el CNM tienen asociadas un icono de documentación con la particularidad de que la documentación presentada se compone automáticamente a partir de la documentación de la métrica/monitor, más la documentación del dispositivo (incluidos los tickets) Vistas: o Descripción de la vista, de por qué se crea, de que es lo que pretende representar. o Notas de operación (Cambios de configuración HW o SW) o Referencias a documentación externa: Manuales, Procedimientos, … o Otras anotaciones … La vista incluye además toda la información vinculada a los dispositivos incluidos en la vista. Tickets de operación: o Cuando salta una alerta en el CNM es posible asociarle un ticket a la alerta con una descripción de lo qué se ha hecho, a quién se ha avisado, de cómo se ha resuelto, … o Todos los tickets vinculados a las alertas generadas por un determinado dispositivo quedan asociados al dispositivo y cuando se revisa la documentación del dispositivo aparecen todos los tickets vinculados al mismo. Esta información es muy útil para resolver con mayor rapidez las incidencias repetitivas y para analizar el nivel de ‘accidentalidad’ de un determinado dispositivo. Ingelan – Monitorización de la Infraestructura de Sistemas de Información/Operación – Enero de 2014 5 Gestor de Tareas Incluido en el CNM hay un gestor de tareas cuya finalidad es la de ofrecer una plataforma capaz de ejecutar tareas programadas sobre los dispositivos dados de alta en el CNM. Las tareas se crean a partir de la programación de la ejecución de las aplicaciones existentes en el CNM o de la programación de otras acciones como es la generación de un report de alertas. Existen esencialmente 2 tipos de aplicaciones: o o Las aplicaciones de Sistema que ya están creadas y operativas en el contexto del CNM. Las aplicaciones de usuario que se generan a partir de la ejecución de un script creado y subido al CNM por el usuario. Las tareas se programan para ser ejecutadas una vez en un momento concreto del tiempo o de forma periódica. Son ejemplos de tareas programadas a partir de las aplicaciones de sistema: o o o El barrido periódico de los Servidores para obtener un listado del software instalado, de los puertos TCP abiertos o de los procesos en curso. A nivel de red la ejecución de un CDP sobre los switches Cisco de la infraestructura para obtener el listado de dispositivos Cisco conectados. La obtención de la configuración de dispositivos Cisco y la validación periódica para la identificación de cambios de configuración. Reporting CNM incluye una muy completa funcionalidad de reporting de las alertas producidas en un intervalo de tiempo determinado. El configurador de informes permite seleccionar el conjunto de dispositivos a considerar y el periodo de tiempo que deba tenerse en cuenta. El report proporciona información sumarizada de alertas por naturaleza de la métrica, por severidad, por ticket (si se le ha asociado) y por ACK (Si se le ha puesto un ACK). Pueden incluirse tablas detalladas de alertas, con número y tiempos de duración agrupadas por causa+severidad, por tipo de dispositivo+severidad y finalmente por dispositivo individual+severidad con un SLA asociado a cada pareja alerta/dispositivo. Además, el informe incluye la relación pormenorizada de todas las alertas de cada dispositivo en un formato fácil de manejar. Ingelan – Monitorización de la Infraestructura de Sistemas de Información/Operación – Enero de 2014 Nuestra Metodología Nos permite realizar proyectos más rápidamente, de una forma más precisa y dentro de un presupuesto ajustado a las necesidades de nuestros clientes, debido a: a) Hemos capitalizado nuestra experiencia recogiendo y reuniendo las necesidades de cada sector y tipo. Al iniciar un Proyecto no partimos de cero, y nuestros interlocutores suprimen los requerimientos no aplicables y eventualmente añaden los específicos de su organización b) Conociendo la tecnología podemos aconsejar acerca de las alternativas más adecuadas en función de las coberturas que se quiera proporcionar y de los presupuestos disponibles c) Con ello somos capaces de minimizar duración y costes maximizando el alcance y el aprovechamiento de la inversión 6 Características: Simplicidad de configuración y uso Ingelan Francesc Carbonell, 21-23 Esc.A Ent.3 Tel: 934 302 989 Fax: 934 306 300 Mail: [email protected] “Hacemos que las cosas ocurran” Visite nuestra página Web: http://www.ingelan.com Síganos en: Si monitorizar un elevado número de dispositivos, introducir la información de caracterización, configurar métricas, definir y aplicar monitores, generar avisos, modelar la infraestructura, añadir o vincular documentación, operar con la información, configurar tareas periódicas, etc…, no fuese extremadamente simple, el CNM sería una más de muchas herramientas de monitorización que acaban en un rincón, desactualizadas y sin que nadie les preste atención porque no se les pueden dedicar los recursos necesarios para explotar y mantener la plataforma actualizada. Resumen y Beneficios: Arquitectura HW/SW en formato Appliance Intel o Maquina Virtual VMware. Interfaz de consola Web. Multiusuario/Multiempresa/Multidepartamento Monitorización Multifabricante/Multidispositivo. Recolección de métricas de todo tipo. Disponibilidad (Ping), SNMP, TCP/IP, WMI, de Aplicación y cualquier otra métrica medible a través de la ejecución de scripts. Recepción de eventos (Traps, Mensajes Syslog y Correo). Generación de alertas en base a recolección de métricas y recepción de eventos. Generación de avisos (e-mail, sms y traps) a partir de las alertas. De foma automática o de forma manual. Vistas horizontales de la infraestructura IT. Vistas de Servicio, de Conectividad, Capacidad, Disponibilidad, etc…, sobre fondos gráficos incorporados por el usuario a la herramienta. Mecanismos para incorporar documentación y referenciar documentación externa. En dispositivos, vistas, métricas y monitores. Ticketing básico para las alertas. Arquitectura escalable desde decenas a miles de dispositivos. Programación de Tareas a partir de aplicaciones de sistema o de usuario. Reporting ad-hoc o programado (Tarea) de alertas de un periodo de tiempo en base a la totalidad o a una selección específica de dispositivos de interés. Arquitectura multi-consola permitiendo la visión y la gestión unificada de varias plataformas CNM a la vez. Cada plataforma es totalmente autónoma y funcional en su contexto de operación. En situaciones de operación internacional con diferencia horaria permite que el centro activo, según horario, tome el control de operación del conjunto de las plataformas. Roadmap En un muy próximo futuro, CNM soportará prestaciones adicionales: De la misma forma que ahora se puede generar un aviso (Mail, SMS, Trap SNMP) como respuesta a una alerta, será posible, en breve, disparar la ejecución automática de una aplicación en respuesta a la alerta. Envío de avisos al finalizar la ejecución de una tarea con un enlace al resultado de la ejecución. Ampliación del concepto de reporting y SLA al contexto de las Vistas como agrupación especifica de métricas. Utilización de reglas para determinar el estado de alerta de una vista a partir de la combinación de los estados de alerta de las métricas incluidas en la vista. (Reglas AND y OR). © 2013 - Información propietaria y confidencial de Ingelan – Local Area Network Engineering