Mudanças entre as edições de "Rotina de Manutenção das TPOL"

De LCAD
Ir para: navegação, pesquisa
Linha 3: Linha 3:
  
 
#Inicio
 
#Inicio
 
 
#Identificar a TPOL com problema ainda no Rack.
 
#Identificar a TPOL com problema ainda no Rack.
 
 
#Conectar o monitor e teclado (ainda no Rack) para eliminar defeitos faceis,  
 
#Conectar o monitor e teclado (ainda no Rack) para eliminar defeitos faceis,  
 
como por exemplo parada no '''fsck''' ou similar. Se esse for o caso, reparar dar um
 
como por exemplo parada no '''fsck''' ou similar. Se esse for o caso, reparar dar um

Edição das 16h43min de 17 de setembro de 2007

Os seguintes passos devem ser seguidos para a manutenção de uma TPOL:

  1. Inicio
  2. Identificar a TPOL com problema ainda no Rack.
  3. Conectar o monitor e teclado (ainda no Rack) para eliminar defeitos faceis,

como por exemplo parada no fsck ou similar. Se esse for o caso, reparar dar um reboot, monitorar a sua volta com o QMON (verificar a queue), lancar o evento no Histórico de Manutencao das TPOL e ir para o passo 99.

  1. Defeito mais complexo: retirar a TPOL do Rack para a bancada e

efetuar procedimentos de diagnostico (analise do hardware, fsck com boot pode CD live Linux, etc...).

Deletar a queue da TPOL no QMON para evitar que o SGE tente utiliza-la.
  1. No caso de defeito de hardware (exceto HD) ou fsck externo, apos o reparo testar TPOL ainda

na bancada com o stress por no minimo 4 horas, com a finalidade de atestar a estabilidade do hardware com carga. Concluido o teste, retornar com a TPOL para o Rack, monitorar a sua volta com o QMON (verificar a queue), lancar o evento no Histórico de Manutencao das TPOL e ir para o passo 99.

  1. No caso de defeito HD, proceder com o dd das imagens de recuperacao das TPOL (ver instrucoes aqui).

Apos o reparo testar TPOL ainda na bancada com o stress por no minimo 4 horas, com a finalidade de atestar a estabilidade do hardware com carga. Concluido o teste, retornar com a TPOL para o Rack, criar sua queue no QMON a partir da opcao de Clone de uma queue boa , monitorar a sua volta com o QMON (verificar a queue), lancar o evento no Histórico de Manutencao das TPOL e ir para o passo 99.

  1. Fim