Contingencia y recuperación

Transcripción

Contingencia y recuperación
01/04/2013 | Ingelan | 934 302 989
Monitorización
de la
Infraestructura
de Sistemas de Información/Operación
Laboratorio
“Realidades y necesidades distintas requieren de
planteamientos y soluciones diferentes”
Monitorizar los sistemas de información/operación permite detectar e
identificar cambios a lo largo del tiempo, y con ello se consigue:
Asegurar de que se cumplen las condiciones establecidas, que el
rendimiento y utilización de la infraestructura está dentro de un rango
previsto detectar niveles anormales de actividad y/o cambios no
autorizados para que, en caso anómalo se advierta al grupo adecuado.
Monitorizar la infraestructura permite también comprobar el nivel de
servicio que se está prestando y garantizar que casa con los requisitos de
calidad y rendimiento acordados.
Custom Network Manager (CNM) es una Herramienta de Monitorización de la
Infraestructura IT en su sentido más amplio que suministra la más amplia gama
de prestaciones para garantizar una cuidadosa y exhaustiva monitorización de
la infraestructura, por muy compleja que pueda ser.
Bien implementada onsite, en las instalaciones del cliente, bien como
instrumento para suministrar servicios gestionados, CNM facilita la gestión de
los avisos, alertas y comunicaciones necesarias para asegurar los objetivos.
Versión 3 – Noviembre 2013
2
Funciones soportadas
CNM gestiona los siguientes componentes, que se describen en los apartados
correspondientes:
Inventario IT
Central de Alertas
Plataforma para el Análisis de Impacto
Plataforma para la Gestión de la Capacidad
Plataforma para el ‘Troubleshooting’
Repositorio Centralizado de Conocimiento
Caracterización de Dispositivos (Campos BD Dispositivos)
Notas y referencias a documentación externa
Tickets de Operación
Gestor de Tareas
Reporting
Plataforma de Inventario
Permite identificar y caracterizar los dispositivos que han de ser controlados y
monitorizados
Dispone de campos definibles por el usuario a fin de acumular toda la información
útil que permita una gestión eficiente y adecuada.
La lista es exportable/importable a/desde .csv.
Central de Alertas
Éste módulo realiza la monitorización de toda la infraestructura con generación de
alertas cuando se producen incidencias con los dispositivos o se superan los umbrales
de funcionamiento definidos por el usuario.
Las situaciones de alerta se monitorizan continuamente y las alertas desaparecen
automáticamente (pasan al histórico) cuando desaparece la condición de alerta.
Las Alertas generadas se pueden convertir en Avisos específicos vía e-mail, SMS o Trap
SNMP. A las alertas generadas se les puede poner un ACK y/o vincular un ticket de
incidencia. Cada alerta tiene asociado un Dashboard con información detallada de la
alerta.
Módulo de Análisis de Comportamiento
La recogida continuada de datos se presenta de forma gráfica en ventana diaria (últimos
7 días), semanal, mensual y anual con lo que se dispone de información histórica de
comportamiento de cualquier métrica definida en el sistema.
Esta información unida a la capacidad que proporcionan las vistas para presentar
agrupaciones de métricas en base a cualquier criterio permite medir el impacto sobre
partes de la infraestructura de cualquier cambio o modificación introducida en la
misma.
Nuevos equipos, nuevas aplicaciones, ampliaciones de infraestructura, cambios de
ubicación, cambios de configuración, etc…, son aspectos que pueden modificar el
comportamiento de otras partes de la infraestructura de manera no anticipada o incluso
no deseada.
Ingelan – Monitorización de la Infraestructura de Sistemas de Información/Operación – Enero de 2014
3
Como solución
CNM puede desplegarse como
solución bajo el control de los
servicios de explotación de la
compañía.
Esta forma de operar permite
prestar una atención exhaustiva a
los usuarios y garantizar la
proactividad, identificando las
causas-raiz de los problemas a fin
de que puedan solventarse antes
de que se compliquen.
Plataforma de Gestión de la Capacidad
Disponer de información de cómo evoluciona en el tiempo el nivel de ocupación de los
recursos es la base necesaria para realizar una adecuada gestión de la capacidad de los
sistemas.
La información histórica disponible en forma gráfica de todas y cada una de las métricas
monitorizadas proporciona la información necesaria para estimar cuando se agotarán
determinados recursos y poder tomar las medidas oportunas para racionalizar el uso o
ampliar la capacidad antes de que ocurra.
Plataforma de Troubleshooting
La central de alertas avisa del momento en que se produce una incidencia y proporciona
información de la afectación de la misma.
Cuando se analiza la incidencia en busca de la causa es fundamental poder disponer de
información de estados anteriores para poder entender cómo se ha llegado a una
determinada situación. No se puede prever una avería hardware pero si que se puede
prever un mal funcionamiento debido a la degradación de una o varias métricas, de uno
o varios dispositivos, y una vez observado el comportamiento se pueden establecer
umbrales de alerta para avisar cuando el proceso se esté reproduciendo para tomar
medidas correctivas antes de que se produzca la incidencia.
En ocasiones la degradación podrá ser debida a un problema específico relativo al
comportamiento de los dispositivos observados pero en ocasiones puede ser el fruto de
una modificación o ampliación realizada en alguna otra parte de la infraestructura.
Las vistas proporcionan los mecanismos para poder agrupar lo que pensamos puede ser
causa y efecto, y observar el comportamiento para determinar si realmente existe
relación.
Ingelan – Monitorización de la Infraestructura de Sistemas de Información/Operación – Enero de 2014
Como servicio
Esta alternativa, basada en la
prestación del servicio de
monitorización y supervisión por
parte de una compañía externa
capaz de prestarlo, permite
abaratar costes debido a las
economías de escala que puede
significar compartir los recursos
con otras compañías.
En la definición del Nivel de
Servicio (SLA) habrán de
contemplarse ámbito, parámetros
a supervisar, acciones previstas en
caso de problemas, indicadores de
rendimiento y otros extremos que
ayuden a clarificar las
responsabilidades en cada caso.
4
Repositorio Centralizado de Conocimiento
La información necesaria para explotar adecuadamente una infraestructura IT suele
estar dispersa en la organización. Inventario de equipos, Contratos de Mantenimiento,
Manuales, Configuraciones, Cambios de configuraciones, Personas Responsables,
detalles de contacto, procedimientos de actuación, …, es información que en el mejor de
los casos está documentada pero dispersa y en el peor de los casos solo está, o al menos
una parte de ella, en la cabeza de quienes explotan diariamente la infraestructura.
Estas situaciones crean una fuerte dependencia de las personas que explotan la
infraestructura y no sirve a los intereses de la organización. El CNM permite la gestión
centralizada del conocimiento y proporciona los mecanismos para que el conocimiento
quede vinculado a la infraestructura y no a las personas que la operan. Los mecanismos
que permiten la gestión y la centralización del conocimiento son los siguientes:
Base de Datos de dispositivos con todos los campos necesarios para caracterizarlos
adecuadamente, p.ej: nombre, nº activo, nº serie, función, ubicación, responsable,
contacto, empresa mantenimiento, … La información contenida en la base de datos
se presenta en formato de ficha como el primer item de la documentación de un
dispositivo.
Notas fechadas y vinculadas a:
Dispositivos:
o Descripciones del dispositivo y sus funciones.
o Notas de operación (Cambios de configuración HW o SW)
o Referencias a documentación externa: Manuales, Procedimientos, …
o Referencias a documentación subida al CNM.
Métricas:
o Descripción de la métrica y de lo que mide.
o Anotaciones adicionales…
Monitores:
o Descripción del monitor, de qué representa la alerta y una descripción genérica
de lo que puede implicar.
o Anotaciones adicionales…
Alertas:
o Las alertas en el CNM tienen asociadas un icono de documentación con la
particularidad de que la documentación presentada se compone
automáticamente a partir de la documentación de la métrica/monitor, más la
documentación del dispositivo (incluidos los tickets)
Vistas:
o Descripción de la vista, de por qué se crea, de que es lo que pretende
representar.
o Notas de operación (Cambios de configuración HW o SW)
o Referencias a documentación externa: Manuales, Procedimientos, …
o Otras anotaciones …
La vista incluye además toda la información vinculada a los dispositivos
incluidos en la vista.
Tickets de operación:
o Cuando salta una alerta en el CNM es posible asociarle un ticket a la alerta con
una descripción de lo qué se ha hecho, a quién se ha avisado, de cómo se ha
resuelto, …
o Todos los tickets vinculados a las alertas generadas por un determinado
dispositivo quedan asociados al dispositivo y cuando se revisa la documentación
del dispositivo aparecen todos los tickets vinculados al mismo. Esta información
es muy útil para resolver con mayor rapidez las incidencias repetitivas y para
analizar el nivel de ‘accidentalidad’ de un determinado dispositivo.
Ingelan – Monitorización de la Infraestructura de Sistemas de Información/Operación – Enero de 2014
5
Gestor de Tareas
Incluido en el CNM hay un gestor de tareas cuya finalidad es la de ofrecer una
plataforma capaz de ejecutar tareas programadas sobre los dispositivos dados de alta
en el CNM.
Las tareas se crean a partir de la programación de la ejecución de las aplicaciones
existentes en el CNM o de la programación de otras acciones como es la generación
de un report de alertas. Existen esencialmente 2 tipos de aplicaciones:
o
o
Las aplicaciones de Sistema que ya están creadas y operativas en el contexto
del CNM.
Las aplicaciones de usuario que se generan a partir de la ejecución de un
script creado y subido al CNM por el usuario.
Las tareas se programan para ser ejecutadas una vez en un momento concreto del
tiempo o de forma periódica. Son ejemplos de tareas programadas a partir de las
aplicaciones de sistema:
o
o
o
El barrido periódico de los Servidores para obtener un listado del software
instalado, de los puertos TCP abiertos o de los procesos en curso.
A nivel de red la ejecución de un CDP sobre los switches Cisco de la
infraestructura para obtener el listado de dispositivos Cisco conectados.
La obtención de la configuración de dispositivos Cisco y la validación
periódica para la identificación de cambios de configuración.
Reporting
CNM incluye una muy completa funcionalidad de reporting de las alertas producidas
en un intervalo de tiempo determinado.
El configurador de informes permite seleccionar el conjunto de dispositivos a
considerar y el periodo de tiempo que deba tenerse en cuenta.
El report proporciona información sumarizada de alertas por naturaleza de la
métrica, por severidad, por ticket (si se le ha asociado) y por ACK (Si se le ha puesto
un ACK).
Pueden incluirse tablas detalladas de alertas, con número y tiempos de duración
agrupadas por causa+severidad, por tipo de dispositivo+severidad y finalmente por
dispositivo individual+severidad con un SLA asociado a cada pareja
alerta/dispositivo.
Además, el informe incluye la relación pormenorizada de todas las alertas de cada
dispositivo en un formato fácil de manejar.
Ingelan – Monitorización de la Infraestructura de Sistemas de Información/Operación – Enero de 2014
Nuestra Metodología
Nos permite realizar proyectos más
rápidamente, de una forma más
precisa y dentro de un presupuesto
ajustado a las necesidades de nuestros
clientes, debido a:
a) Hemos capitalizado nuestra
experiencia recogiendo y
reuniendo las necesidades de cada
sector y tipo. Al iniciar un
Proyecto no partimos de cero, y
nuestros interlocutores suprimen
los requerimientos no aplicables y
eventualmente añaden los
específicos de su organización
b) Conociendo la tecnología
podemos aconsejar acerca de las
alternativas más adecuadas en
función de las coberturas que se
quiera proporcionar y de los
presupuestos disponibles
c) Con ello somos capaces de
minimizar duración y costes
maximizando el alcance y el
aprovechamiento de la inversión
6
Características: Simplicidad de configuración y uso
Ingelan
Francesc Carbonell, 21-23 Esc.A Ent.3
Tel: 934 302 989
Fax: 934 306 300
Mail: [email protected]
“Hacemos que las cosas ocurran”
Visite nuestra página Web:
http://www.ingelan.com
Síganos en:
Si monitorizar un elevado número de dispositivos, introducir la información de
caracterización, configurar métricas, definir y aplicar monitores, generar avisos,
modelar la infraestructura, añadir o vincular documentación, operar con la
información, configurar tareas periódicas, etc…, no fuese extremadamente simple, el
CNM sería una más de muchas herramientas de monitorización que acaban en un
rincón, desactualizadas y sin que nadie les preste atención porque no se les pueden
dedicar los recursos necesarios para explotar y mantener la plataforma actualizada.
Resumen y Beneficios:
Arquitectura HW/SW en formato Appliance Intel o Maquina Virtual VMware.
Interfaz de consola Web. Multiusuario/Multiempresa/Multidepartamento
Monitorización Multifabricante/Multidispositivo.
Recolección de métricas de todo tipo. Disponibilidad (Ping), SNMP, TCP/IP,
WMI, de Aplicación y cualquier otra métrica medible a través de la ejecución de
scripts.
Recepción de eventos (Traps, Mensajes Syslog y Correo).
Generación de alertas en base a recolección de métricas y recepción de eventos.
Generación de avisos (e-mail, sms y traps) a partir de las alertas. De foma
automática o de forma manual.
Vistas horizontales de la infraestructura IT. Vistas de Servicio, de Conectividad,
Capacidad, Disponibilidad, etc…, sobre fondos gráficos incorporados por el
usuario a la herramienta.
Mecanismos para incorporar documentación y referenciar documentación
externa. En dispositivos, vistas, métricas y monitores.
Ticketing básico para las alertas.
Arquitectura escalable desde decenas a miles de dispositivos.
Programación de Tareas a partir de aplicaciones de sistema o de usuario.
Reporting ad-hoc o programado (Tarea) de alertas de un periodo de tiempo en
base a la totalidad o a una selección específica de dispositivos de interés.
Arquitectura multi-consola permitiendo la visión y la gestión unificada de varias
plataformas CNM a la vez. Cada plataforma es totalmente autónoma y funcional
en su contexto de operación. En situaciones de operación internacional con
diferencia horaria permite que el centro activo, según horario, tome el control
de operación del conjunto de las plataformas.
Roadmap
En un muy próximo futuro, CNM soportará prestaciones adicionales:
De la misma forma que ahora se puede generar un aviso (Mail, SMS, Trap
SNMP) como respuesta a una alerta, será posible, en breve, disparar la
ejecución automática de una aplicación en respuesta a la alerta.
Envío de avisos al finalizar la ejecución de una tarea con un enlace al resultado
de la ejecución.
Ampliación del concepto de reporting y SLA al contexto de las Vistas como
agrupación especifica de métricas.
Utilización de reglas para determinar el estado de alerta de una vista a partir
de la combinación de los estados de alerta de las métricas incluidas en la vista.
(Reglas AND y OR).
© 2013 - Información propietaria y confidencial de Ingelan – Local Area Network Engineering

Documentos relacionados