miércoles, 2 de mayo de 2012

Como monitorear si un respaldo corrio en las ultimas 24hrs

OEM tiene bastantes métricas que puedes usar para monitorear tu base de datos, pero que pasa cuando quieres monitorear si en las ultimas 24 o 36 horas no ha corrido tu respaldo de producción,

OEM tiene algo llamado métricas definidas por el usuario,  UDM por sus siglas en ingles, y es algo muy útil para lo que te mencione al principio

Para que funcione esta métrica, tienes que utilizar RMAN como herramienta de respaldo, no funciona si usas el comando "alter tablespace ... begin backup;".

Primero , vamos a utilizar este query para sacar el tiempo que ha transcurrido desde que finalizo el ultimo respaldo

select nvl((sysdate-min(t2)),0)*24 time_since_bu from 
( select max(b.checkpoint_time) t2 
from v$backup_datafile b, v$tablespace ts, v$datafile f 
where included_in_database_backup='YES' and completion_time>sysdate-90 
and f.file#=b.file# and f.ts#=ts.ts# group by f.file# );


Una vez que definimos el query vamos a utilizar, en OEM Grid Control 11g en el tabulador de HOME de tu base de datos vas a encontrar en la parte inferior derecha  varias ligas, y ahí se encuentra ladeUser-Defined Metrics .  Si estas utilizando otra versión de OEM, esta liga se puede encontrar en el lado izquierdo u en otra parte del tabulador HOME.

Ya que entraste a la sección de UDM, vas a darle click a Create, y ahí te va a llevar a la definición de la métrica, que en mi caso es de la siguiente manera


Cuando termines de definir tu UDM, tienes que definir una regla de notificación , si no, no vas a recibir
la alerta en tu correo, solamente sera mostrada en OEM

En la parte superior izquierda de OEM, vas a ver una liga llamada Preferences, al darle click ahi vas a ver una parte que se llama Notification, y ahi le das Create

Ya para acabar, le vas a dar un nombre a tu regla, y vas a seleccionar de la parte de metricas, a tu UDM que creaste, y de igual manera, selecciona el estado Critic y Warning para recibir alerts.



Y listo, vas a recibir una alerta similar a esta en tu correo cuando tu respaldo no haya corrido y finalizado en las ultimas 25hrs.

Metric Column
User-Defined Numeric Metric
Metric Value
VERIFICAR_RESPALDO
Timestamp
02-05-12 02:36:00
Severity
WARNING
Message
El Ultimo Respaldo se tomo hace 25.41 hrs