Monitorización
Transcripción
Monitorización
Monitorización Feb 2012 La gestión y monitorización de la replicación es una de las acciones básicas a realizar para que el proyecto de Alta Disponibilidad sea exitoso. Tras la configuración de los objetos a replicar será necesario comprobar diariamente que Quick-EDD/HA está funcionando sin latencias en el envío o aplicación de cambios. Cualquier retraso detectado deberá ser analizado y resuelto a la mayor brevedad posible. Quick-EDD/HA nos ofrece dos pantallas potentes para gestionar esta monitorización Opción 5 frente a un entorno. Display info La opción 5 frente a un entorno nos mostrará información sobre los puntos temporales en los que se encuentra la replicación respecto a las entradas de diario y la cantidad de información pendiente de leer, enviar y aplicar en base a transacciones de diario. Partimos de un entorno en funcionamiento (en este caso DT): Con opción 5 frente al entorno veremos la pantalla que nos da información sobre las entradas de diario que se están creando en origen, las entradas enviadas, recibidas y aplicadas: FAQ Quick-Software-Line 1/7 Monitorización Feb 2012 El detalle de esta pantalla es el siguiente: - Parte izquierda de la pantalla Información de origen o Read Entry: Última entrada de diario generada en el sistema origen. En este caso vemos una entrada del dia 01/03/2012 a las 18:29:22. Siempre nos mostrará la última acción que se ha generado en el sistema. o Entry: en este caso vemos la última entrada de diario (Nota: TODOS LOS DIARIOS SE LEEN CONJUNTAMENTE) leída por los trabajos Jxx de este entorno. En este caso es una entrada del día 24/02/2012 a las 01:53:12. Este retraso se debe a que el entorno estuvo parado varios días por lo que con F5 esta entrada se irá actualizando progresivamente. Si en una replicación siempre activa hubiera diferencias significaría que Quick-EDD/HA no puede leer las entradas de diario a la misma velocidad que se generan por lo que habría que crear más entornos o bien aumentar el número de trabajos Jxx de dicho entorno. o Backlog: diferencia en días, horas, minutos… entre la última entrada de diario generada en el sistema y la última entrada leída por QuickEDD/HA. En este caso tenemos 6 días 16 horas, 36 minutos y 10,34 segundos. Con F5 esta entrada se irá actualizando progresivamente. o Origin: Datos sobre la última entrada de diario leída, se muestra el número de secuencia y el diario y receptor en el que nos encontramos. En Entry nos ha mostrado también el tipo de entrada (TZC). o Object: Nos indicaría el objeto sobre el cual se hace referencia en la entrada de diario. o Wait: Nos muestra el número de entradas pendientes de leer y enviar de todos los diarios. En este caso 397.440 entradas. Es decir, desde el día 24/02 las 01:53 al día 01/03 a las 18:29 se produjeron este número FAQ Quick-Software-Line 2/7 Monitorización Feb 2012 de entradas en todos los diarios que deben ser leídos por este entorno. En cuanto a detección de problemas esta opción es la más importante en el sistema origen ya que indica la cantidad de información que se podría perder en caso de caída no planificada en este momento. La diferencia en tiempo es importante, pero las entradas no se generan de forma uniforme a lo largo del tiempo si no que pueden existir picos de trabajo donde en un intervalo muy pequeño de tiempo se generen millones de transacciones. Por lo tanto, será el número de transacciones pendientes el aspecto clave a controlar y deberá ser siempre inferior a 10.000 entradas. Un mayor número de entradas constante puede ser indicativo de que no se están leyendo y enviando las entradas a la velocidad adecuada por lo que debería tratar de mejorarse el rendimiento (consultar la FAQ correspondiente). o Totals y 60s: nos indica el número de entradas de diario que, de media, se están leyendo y enviando por segundo desde que se arrancó el entorno (Totals) y en el último minuto (60s). Este número de transacciones irá variando dependiendo de la velocidad a la que se van leyendo dichas entradas. En este caso vemos que de media se leen y envían 2.172 entradas por segundo desde que se arrancó el entorno y 5.070 en el último minuto. o Bajo Wait vemos la estimación que Quick-EDD/HA nos da en cuanto a la hora en que se habrán leído y enviado todas las entradas pendientes. - Parte derecha de la pantalla Información de destino o Vemos igual que en el caso anterior cual es la última entrada generada en el sistema origen. o Entry: nos indica cual es la última entrada de diario recibida y aplicada en el sistema destino (o si no pertenece a ningún objeto replicado la última simplemente recibida e ignorada). En este caso corresponde a una entrada que en el sistema origen se generó el día 23/02/2012 a las 21:19:09h. o Backlog: igual que en el caso anterior nos da la diferencia horaria entre la última entrada generada y la última entrada gestionada (ignorada o aplicada) en destino. o Así mismo se da el detalle de la acción que registro dicha entrada. o Wait: en este caso se indica el número de entradas que ya ha recibido el sistema destino pero que están pendientes de aplicación (el proceso de replicación puede ser más lento que el de recepción ya que se prioriza el envío para que las entradas YA RESIDAN en el sistema de respaldo; más información en las FAQ correspondientes a Rendimiento y SRS). Esta es la principal información a analizar en destino ya que nos indica el número de transacciones aún pendientes de aplicar. En caso de contingencia no podríamos dar acceso a los usuarios hasta que todas estas entradas hayan sido aplicadas. En este caso no hay entradas pendientes ya que las leídas hasta ese momento en origen no corresponden con objetos replicados. Un gran número de entradas en FAQ Quick-Software-Line 3/7 Monitorización Feb 2012 este parámetro (más de 10.000 de forma constante) o un número creciente de entradas será indicativo de que el sistema de respaldo no es capaz de aplicar las transacciones a la misma velocidad a la que se reciben. Por tanto será necesario aumentar el número de trabajos de aplicación (Xxx) o crear nuevos entornos para aumentar el paralelismo en la aplicación de cambios. o Totals y 60s: nos indica el número de entradas de diario que, de media, se están aplicando en el sistema de respaldo por segundo desde que se arrancó el entorno (Totals) y en el último minuto (60s). Este número de transacciones irá variando dependiendo de la velocidad a la que se van aplicando dichas entradas. Como en este caso, hasta ese momento, todas las entradas leídas han sido ignoradas al no tener relación con objetos replicados, los números mostrados son 0. o Backlog: nos da información sobre el tiempo transcurrido entre la última entrada generada en el diario de origen y la última entrada aplicada y confirmada en destino. Tras unos segundos y haciendo F5 vemos que estas entradas se van actualizando quedando pendientes 241.319 entradas, habiendose leído y enviado a una media de 4.180 entradas por segundo (4.632 en el último minuto), etc… La parte de destino no ha cambiado ya que siguen leyendose entradas que no afectan a objetos replicados por este entorno. FAQ Quick-Software-Line 4/7 Monitorización Feb 2012 Finalmente se han enviado (a 3.786 entradas por segundo de media) y aplicado (a 133 entradas por segundo) todas las entradas pendientes. Como leemos todos los diarios y solo replicamos ciertos objetos muchas de las entradas se ignoran y ya no son siquiera enviadas, por ello, la aplicación de transacciones siempre será inferior a la lectura de las mismas en origen. Para ver con más detalle esta circunstancia: FAQ Quick-Software-Line 5/7 Monitorización Feb 2012 Opción 9 frente a un entorno. Activity info La opción 9 frente a un entorno nos mostrará información sobre la actividad que desarrolla Quick-EDD/HA en cuanto a entradas de diario y tipo de transacciones aplicadas (inserciones, actualizaciones, borrados…). Partimos de un entorno en funcionamiento (en este caso DT): En la parte superior de esta pantalla vemos información similar a la obtenida con la opción 5 (Display) en cuanto a que se muestran las entradas de diario, el diario, el receptor, el número de secuencia, el tipo de transacción, el trabajo que realizó la transacción y el objeto sobre el que se produjo (así como el miembro, número de registro, etc…). FAQ Quick-Software-Line 6/7 Monitorización Feb 2012 En la parte izquierda se muestra la información de origen (última entrada de diario producida en el sistema, última entrada leída y enviada así como todo el detalle de dicha entrada) mientras que en la parte derecha se muestra la información de destino (última entrada de diario recibida en el sistema, última entrada aplicada así como todo el detalle de dicha entrada). En la parte inferior de la pantalla vemos información relativa a la actividad realizada por Quick-EDD/HA: - Read Entry: cantidad de entradas de diario leídas en origen. - Processed: cantidad de entradas de diario referentes a objetos replicados y por tanto procesadas por el sistema destino o Para estas dos opciones se muestra también información sobre la cantidad de información tratada y el número de entradas por segundo leídas y aplicadas en cada caso desde el último arranque del entorno. FAQ - Ignored: entradas de diario ignoradas puesto que se tratan de entradas referentes a objetos no replicados en el entorno. - Adds: número de Inserciones realizadas en destino sobre objetos replicados. - Updates: número de actualizaciones realizadas en destino sobre objetos replicados. - Deletes: número de borrados realizados en destino sobre objetos replicados. - Running: entradas pendientes de aplicar (en funcionamiento siempre mostrará como mínimo 1 entrada) - Others: entradas correspondiente a otro tipo de operaciones. - Errors: entradas aplicadas con error en el sistema destino. Al producirse un error Quick-EDD/HA desencadena automáticamente una operación de Sync (comparar e igualar) sobre el objeto por lo que simplemente es un contador informativo y no implica que el objeto quede en estado erroneo si no que en la mayoría de las ocasiones la operación de syncrho deja el objeto idéntico entre los dos sistemas. - Hold: entradas pendientes para objetos que se quedan en estado nok (error) - Diferred: si activamos SRS pueden quedar entradas pendientes de aplicación mientras se realizan acciones que requieren acceso a los objetos de destino. - Repaired: número de entradas que han generado una “reparación” en objetos de destino (entradas que no se pueden aplicar directamente pero que no desencadenan una operación de sync). Quick-Software-Line 7/7