Monitorización

Transcripción

Monitorización
Monitorización
Feb 2012
La gestión y monitorización de la replicación es una de las
acciones básicas a realizar para que el proyecto de Alta
Disponibilidad sea exitoso.
Tras la configuración de los objetos a replicar será necesario comprobar
diariamente que Quick-EDD/HA está funcionando sin latencias en el envío o
aplicación de cambios. Cualquier retraso detectado deberá ser analizado y
resuelto a la mayor brevedad posible. Quick-EDD/HA nos ofrece dos pantallas
potentes para gestionar esta monitorización
Opción 5 frente a un entorno. Display info
La opción 5 frente a un entorno nos mostrará información sobre los puntos
temporales en los que se encuentra la replicación respecto a las entradas de diario y
la cantidad de información pendiente de leer, enviar y aplicar en base a
transacciones de diario.
Partimos de un entorno en funcionamiento (en este caso DT):
Con opción 5 frente al entorno veremos la pantalla que nos da información sobre las
entradas de diario que se están creando en origen, las entradas enviadas, recibidas
y aplicadas:
FAQ
Quick-Software-Line
1/7
Monitorización
Feb 2012
El detalle de esta pantalla es el siguiente:
-
Parte izquierda de la pantalla Información de origen
o Read Entry: Última entrada de diario generada en el sistema origen. En
este caso vemos una entrada del dia 01/03/2012 a las 18:29:22.
Siempre nos mostrará la última acción que se ha generado en el
sistema.
o Entry: en este caso vemos la última entrada de diario (Nota: TODOS
LOS DIARIOS SE LEEN CONJUNTAMENTE) leída por los trabajos Jxx
de este entorno. En este caso es una entrada del día 24/02/2012 a las
01:53:12. Este retraso se debe a que el entorno estuvo parado varios
días por lo que con F5 esta entrada se irá actualizando
progresivamente. Si en una replicación siempre activa hubiera
diferencias significaría que Quick-EDD/HA no puede leer las entradas
de diario a la misma velocidad que se generan por lo que habría que
crear más entornos o bien aumentar el número de trabajos Jxx de
dicho entorno.
o Backlog: diferencia en días, horas, minutos… entre la última entrada de
diario generada en el sistema y la última entrada leída por QuickEDD/HA. En este caso tenemos 6 días 16 horas, 36 minutos y 10,34
segundos. Con F5 esta entrada se irá actualizando progresivamente.
o Origin: Datos sobre la última entrada de diario leída, se muestra el
número de secuencia y el diario y receptor en el que nos encontramos.
En Entry nos ha mostrado también el tipo de entrada (TZC).
o Object: Nos indicaría el objeto sobre el cual se hace referencia en la
entrada de diario.
o Wait: Nos muestra el número de entradas pendientes de leer y enviar
de todos los diarios. En este caso 397.440 entradas. Es decir, desde el
día 24/02 las 01:53 al día 01/03 a las 18:29 se produjeron este número
FAQ
Quick-Software-Line
2/7
Monitorización
Feb 2012
de entradas en todos los diarios que deben ser leídos por este entorno.
En cuanto a detección de problemas esta opción es la más
importante en el sistema origen ya que indica la cantidad de
información que se podría perder en caso de caída no planificada en
este momento. La diferencia en tiempo es importante, pero las
entradas no se generan de forma uniforme a lo largo del tiempo si no
que pueden existir picos de trabajo donde en un intervalo muy pequeño
de tiempo se generen millones de transacciones. Por lo tanto, será el
número de transacciones pendientes el aspecto clave a controlar y
deberá ser siempre inferior a 10.000 entradas. Un mayor número de
entradas constante puede ser indicativo de que no se están leyendo y
enviando las entradas a la velocidad adecuada por lo que debería
tratar de mejorarse el rendimiento (consultar la FAQ correspondiente).
o Totals y 60s: nos indica el número de entradas de diario que, de media,
se están leyendo y enviando por segundo desde que se arrancó el
entorno (Totals) y en el último minuto (60s). Este número de
transacciones irá variando dependiendo de la velocidad a la que se van
leyendo dichas entradas. En este caso vemos que de media se leen y
envían 2.172 entradas por segundo desde que se arrancó el entorno y
5.070 en el último minuto.
o Bajo Wait vemos la estimación que Quick-EDD/HA nos da en cuanto a
la hora en que se habrán leído y enviado todas las entradas
pendientes.
-
Parte derecha de la pantalla Información de destino
o Vemos igual que en el caso anterior cual es la última entrada generada
en el sistema origen.
o Entry: nos indica cual es la última entrada de diario recibida y aplicada
en el sistema destino (o si no pertenece a ningún objeto replicado la
última simplemente recibida e ignorada). En este caso corresponde a
una entrada que en el sistema origen se generó el día 23/02/2012 a las
21:19:09h.
o Backlog: igual que en el caso anterior nos da la diferencia horaria entre
la última entrada generada y la última entrada gestionada (ignorada o
aplicada) en destino.
o Así mismo se da el detalle de la acción que registro dicha entrada.
o Wait: en este caso se indica el número de entradas que ya ha recibido
el sistema destino pero que están pendientes de aplicación (el proceso
de replicación puede ser más lento que el de recepción ya que se
prioriza el envío para que las entradas YA RESIDAN en el sistema de
respaldo; más información en las FAQ correspondientes a Rendimiento
y SRS). Esta es la principal información a analizar en destino ya que
nos indica el número de transacciones aún pendientes de aplicar. En
caso de contingencia no podríamos dar acceso a los usuarios hasta
que todas estas entradas hayan sido aplicadas. En este caso no hay
entradas pendientes ya que las leídas hasta ese momento en origen no
corresponden con objetos replicados. Un gran número de entradas en
FAQ
Quick-Software-Line
3/7
Monitorización
Feb 2012
este parámetro (más de 10.000 de forma constante) o un número
creciente de entradas será indicativo de que el sistema de respaldo no
es capaz de aplicar las transacciones a la misma velocidad a la que se
reciben. Por tanto será necesario aumentar el número de trabajos de
aplicación (Xxx) o crear nuevos entornos para aumentar el paralelismo
en la aplicación de cambios.
o Totals y 60s: nos indica el número de entradas de diario que, de media,
se están aplicando en el sistema de respaldo por segundo desde que
se arrancó el entorno (Totals) y en el último minuto (60s). Este número
de transacciones irá variando dependiendo de la velocidad a la que se
van aplicando dichas entradas. Como en este caso, hasta ese
momento, todas las entradas leídas han sido ignoradas al no tener
relación con objetos replicados, los números mostrados son 0.
o Backlog: nos da información sobre el tiempo transcurrido entre la última
entrada generada en el diario de origen y la última entrada aplicada y
confirmada en destino.
Tras unos segundos y haciendo F5 vemos que estas entradas se van actualizando
quedando pendientes 241.319 entradas, habiendose leído y enviado a una media de
4.180 entradas por segundo (4.632 en el último minuto), etc…
La parte de destino no ha cambiado ya que siguen leyendose entradas que no
afectan a objetos replicados por este entorno.
FAQ
Quick-Software-Line
4/7
Monitorización
Feb 2012
Finalmente se han enviado (a 3.786 entradas por segundo de media) y aplicado (a
133 entradas por segundo) todas las entradas pendientes.
Como leemos todos los diarios y solo replicamos ciertos objetos muchas de las
entradas se ignoran y ya no son siquiera enviadas, por ello, la aplicación de
transacciones siempre será inferior a la lectura de las mismas en origen.
Para ver con más detalle esta circunstancia:
FAQ
Quick-Software-Line
5/7
Monitorización
Feb 2012
Opción 9 frente a un entorno. Activity info
La opción 9 frente a un entorno nos mostrará información sobre la actividad que
desarrolla Quick-EDD/HA en cuanto a entradas de diario y tipo de transacciones
aplicadas (inserciones, actualizaciones, borrados…).
Partimos de un entorno en funcionamiento (en este caso DT):
En la parte superior de esta pantalla vemos información similar a la obtenida con la
opción 5 (Display) en cuanto a que se muestran las entradas de diario, el diario, el
receptor, el número de secuencia, el tipo de transacción, el trabajo que realizó la
transacción y el objeto sobre el que se produjo (así como el miembro, número de
registro, etc…).
FAQ
Quick-Software-Line
6/7
Monitorización
Feb 2012
En la parte izquierda se muestra la información de origen (última entrada de diario
producida en el sistema, última entrada leída y enviada así como todo el detalle de
dicha entrada) mientras que en la parte derecha se muestra la información de
destino (última entrada de diario recibida en el sistema, última entrada aplicada así
como todo el detalle de dicha entrada).
En la parte inferior de la pantalla vemos información relativa a la actividad realizada
por Quick-EDD/HA:
-
Read Entry: cantidad de entradas de diario leídas en origen.
-
Processed: cantidad de entradas de diario referentes a objetos replicados y
por tanto procesadas por el sistema destino
o Para estas dos opciones se muestra también información sobre la
cantidad de información tratada y el número de entradas por segundo
leídas y aplicadas en cada caso desde el último arranque del entorno.
FAQ
-
Ignored: entradas de diario ignoradas puesto que se tratan de entradas
referentes a objetos no replicados en el entorno.
-
Adds: número de Inserciones realizadas en destino sobre objetos replicados.
-
Updates: número de actualizaciones realizadas en destino sobre objetos
replicados.
-
Deletes: número de borrados realizados en destino sobre objetos replicados.
-
Running: entradas pendientes de aplicar (en funcionamiento siempre mostrará
como mínimo 1 entrada)
-
Others: entradas correspondiente a otro tipo de operaciones.
-
Errors: entradas aplicadas con error en el sistema destino. Al producirse un
error Quick-EDD/HA desencadena automáticamente una operación de Sync
(comparar e igualar) sobre el objeto por lo que simplemente es un contador
informativo y no implica que el objeto quede en estado erroneo si no que en la
mayoría de las ocasiones la operación de syncrho deja el objeto idéntico entre
los dos sistemas.
-
Hold: entradas pendientes para objetos que se quedan en estado nok (error)
-
Diferred: si activamos SRS pueden quedar entradas pendientes de aplicación
mientras se realizan acciones que requieren acceso a los objetos de destino.
-
Repaired: número de entradas que han generado una “reparación” en objetos
de destino (entradas que no se pueden aplicar directamente pero que no
desencadenan una operación de sync).
Quick-Software-Line
7/7

Documentos relacionados