Mudanças entre as edições de "Rotina de Manutenção das TPOL"

De LCAD
Ir para: navegação, pesquisa
m
Linha 1: Linha 1:
 
[[category:Suporte]]
 
[[category:Suporte]]
'''0''' - Inicio
 
  
'''1''' - Identificar a TPOL com problema ainda no Rack.
+
Os seguintes passos devem ser seguidos para a manutenção de uma TPOL:
  
'''2''' - Conectar o monitor e teclado (ainda no Rack) para eliminar defeitos faceis,  
+
:'''0''' - Inicio
 +
 
 +
:'''1''' - Identificar a TPOL com problema ainda no Rack.
 +
 
 +
:'''2''' - Conectar o monitor e teclado (ainda no Rack) para eliminar defeitos faceis,  
 
como por exemplo parada no '''fsck''' ou similar. Se esse for o caso, reparar dar um
 
como por exemplo parada no '''fsck''' ou similar. Se esse for o caso, reparar dar um
 
reboot, monitorar a sua volta com o QMON (verificar a queue), lancar o evento no [[Historico_de_Manutencao_das_TPOL | Histórico de Manutencao das TPOL]] e ir para o passo 99.
 
reboot, monitorar a sua volta com o QMON (verificar a queue), lancar o evento no [[Historico_de_Manutencao_das_TPOL | Histórico de Manutencao das TPOL]] e ir para o passo 99.
  
'''3''' - Defeito mais complexo: retirar a TPOL do Rack para a bancada e  
+
:'''3''' - Defeito mais complexo: retirar a TPOL do Rack para a bancada e  
 
efetuar procedimentos de diagnostico (analise do hardware, '''fsck''' com boot pode CD live Linux,  
 
efetuar procedimentos de diagnostico (analise do hardware, '''fsck''' com boot pode CD live Linux,  
 
etc...).
 
etc...).
'''Deletar a queue da TPOL no QMON para evitar que o SGE tente utiliza-la.'''
+
:'''Deletar a queue da TPOL no QMON para evitar que o SGE tente utiliza-la.'''
  
'''4''' - No caso de defeito de hardware (exceto HD) ou '''fsck''' externo,  apos o reparo testar TPOL ainda
+
:'''4''' - No caso de defeito de hardware (exceto HD) ou '''fsck''' externo,  apos o reparo testar TPOL ainda
 
na bancada com o '''stress''' por no minimo 4 horas, com a finalidade de atestar a estabilidade do hardware com carga.
 
na bancada com o '''stress''' por no minimo 4 horas, com a finalidade de atestar a estabilidade do hardware com carga.
 
Concluido o teste,  retornar com a TPOL para o Rack, monitorar a sua volta com o QMON (verificar a queue), lancar o evento no
 
Concluido o teste,  retornar com a TPOL para o Rack, monitorar a sua volta com o QMON (verificar a queue), lancar o evento no
 
[[Historico_de_Manutencao_das_TPOL | Histórico de Manutencao das TPOL]]  e ir para o passo 99.
 
[[Historico_de_Manutencao_das_TPOL | Histórico de Manutencao das TPOL]]  e ir para o passo 99.
  
'''5''' - No caso de defeito HD, proceder com o '''dd''' das imagens de recuperacao das TPOL (ver instrucoes aqui).
+
:'''5''' - No caso de defeito HD, proceder com o '''dd''' das imagens de recuperacao das TPOL (ver instrucoes aqui).
 
Apos o reparo testar TPOL ainda na bancada com o '''stress''' por no minimo 4 horas, com a finalidade de atestar a estabilidade do hardware com carga. Concluido o teste,  retornar com a TPOL para o Rack, '''criar sua queue no QMON a partir da opcao de Clone de uma queue boa''' , monitorar a sua volta com o QMON (verificar a queue), lancar o evento no [[Historico_de_Manutencao_das_TPOL | Histórico de Manutencao das TPOL]]  e ir para o passo 99.
 
Apos o reparo testar TPOL ainda na bancada com o '''stress''' por no minimo 4 horas, com a finalidade de atestar a estabilidade do hardware com carga. Concluido o teste,  retornar com a TPOL para o Rack, '''criar sua queue no QMON a partir da opcao de Clone de uma queue boa''' , monitorar a sua volta com o QMON (verificar a queue), lancar o evento no [[Historico_de_Manutencao_das_TPOL | Histórico de Manutencao das TPOL]]  e ir para o passo 99.
  
'''99''' - Fim
+
:'''99''' - Fim

Edição das 16h38min de 17 de setembro de 2007


Os seguintes passos devem ser seguidos para a manutenção de uma TPOL:

0 - Inicio
1 - Identificar a TPOL com problema ainda no Rack.
2 - Conectar o monitor e teclado (ainda no Rack) para eliminar defeitos faceis,

como por exemplo parada no fsck ou similar. Se esse for o caso, reparar dar um reboot, monitorar a sua volta com o QMON (verificar a queue), lancar o evento no Histórico de Manutencao das TPOL e ir para o passo 99.

3 - Defeito mais complexo: retirar a TPOL do Rack para a bancada e

efetuar procedimentos de diagnostico (analise do hardware, fsck com boot pode CD live Linux, etc...).

Deletar a queue da TPOL no QMON para evitar que o SGE tente utiliza-la.
4 - No caso de defeito de hardware (exceto HD) ou fsck externo, apos o reparo testar TPOL ainda

na bancada com o stress por no minimo 4 horas, com a finalidade de atestar a estabilidade do hardware com carga. Concluido o teste, retornar com a TPOL para o Rack, monitorar a sua volta com o QMON (verificar a queue), lancar o evento no Histórico de Manutencao das TPOL e ir para o passo 99.

5 - No caso de defeito HD, proceder com o dd das imagens de recuperacao das TPOL (ver instrucoes aqui).

Apos o reparo testar TPOL ainda na bancada com o stress por no minimo 4 horas, com a finalidade de atestar a estabilidade do hardware com carga. Concluido o teste, retornar com a TPOL para o Rack, criar sua queue no QMON a partir da opcao de Clone de uma queue boa , monitorar a sua volta com o QMON (verificar a queue), lancar o evento no Histórico de Manutencao das TPOL e ir para o passo 99.

99 - Fim