Mudanças entre as edições de "Rotina de Manutenção das TPOL"

De LCAD
Ir para: navegação, pesquisa
 
(19 revisões intermediárias por 2 usuários não estão sendo mostradas)
Linha 1: Linha 1:
'''0''' - Inicio
+
[[category:Suporte]]
 +
Os seguintes passos devem ser seguidos para a manutenção de uma TPOL:
  
'''1''' - Identificar a TPOL com problema ainda no Rack.
+
:#Início
 
+
:#Identificar a TPOL com problema ainda no Rack;
'''2''' - Conectar o monitor e teclado (ainda no Rack) para eliminar defeitos faceis,  
+
:#Conectar o monitor e teclado (ainda no Rack) para eliminar defeitos fáceis, como por exemplo parada no '''fsck''' ou similar. Se esse for o caso, reparar dar um reboot, monitorar a sua volta com o QMON (verificar a queue), lancar o evento no [[Historico_de_Manutencao_das_TPOL | Histórico de Manutenção das TPOL]] e ir para o passo 8.
como por exemplo parada no '''fsck''' ou similar. Se esse for o caso, reparar dar um
+
:#Defeito mais complexo: retirar a TPOL do Rack para a bancada e efetuar procedimentos de diagnóstico (análise do hardware, '''fsck''' com boot pode CD live Linux, etc...);
reboot, monitorar a sua volta com o QMON (verificar a queue), lancar o evento no [[Historico_de_Manutencao_das_TPOL | Histórico de Manutencao das TPOL]] e ir para o passo 99.
+
:#'''Deletar a queue da TPOL no QMON para evitar que o SGE tente utilizá-la''';
 
+
:#Consultar o [[Historico_de_Manutencao_das_TPOL | Histórico de Manutenção da TPOL]].
'''3''' - Defeito mais complexo: retirar a TPOL do Rack para a bancada e  
+
:#No caso de defeito de hardware (exceto HD) ou '''fsck''' externo,  após o reparo testar TPOL ainda na bancada com o '''stress''' por no minímo 4 horas, com a finalidade de atestar a estabilidade do hardware com carga.Concluido o teste,  retornar com a TPOL para o Rack, monitorar a sua volta com o QMON (verificar a queue), lançar o evento no [[Historico_de_Manutencao_das_TPOL | Histórico de Manutenção das TPOL]]  e ir para o passo 9;
efetuar procedimentos de diagnostico (analise do hardware, '''fsck''' com boot pode CD live Linux,  
+
:#No caso de defeito do HD, proceder com o '''dd''' das imagens de recuperação das TPOL (ver instruções aqui). Após o reparo testar TPOL ainda na bancada com o '''stress''' por no minímo 4 horas, com a finalidade de atestar a estabilidade do hardware com carga. Concluído o teste, retornar com a TPOL para o Rack, '''criar sua queue no QMON a partir da opção de Clone de uma queue boa''', monitorar a sua volta com o QMON (verificar a queue), lançar o evento no [[Historico_de_Manutencao_das_TPOL | Histórico de Manutenção das TPOL]]  e ir para o passo 8;
etc...).
+
:#Fim
'''Deletar a queue da TPOL no QMON para evitar que o SGE tente utiliza-la.'''
 
 
 
'''4''' - No caso de defeito de hardware (exceto HD) ou '''fsck''' externo,  apos o reparo testar TPOL ainda
 
na bancada com o '''stress''' por no minimo 4 horas, com a finalidade de atestar a estabilidade do hardware com carga.
 
Concluido o teste,  retornar com a TPOL para o Rack, monitorar a sua volta com o QMON (verificar a queue), lancar o evento no
 
[[Historico_de_Manutencao_das_TPOL]]  e ir para o passo 99.
 
 
 
'''5''' - No caso de defeito HD, proceder com o '''dd''' das imagens de recuperacao das TPOL (ver instrucoes aqui).
 
Apos o reparo testar TPOL ainda na bancada com o '''stress''' por no minimo 4 horas, com a finalidade de atestar a estabilidade do hardware com carga. Concluido o teste, retornar com a TPOL para o Rack, '''criar sua queue no QMON a partir da opcao de Clone de uma queue boa''' , monitorar a sua volta com o QMON (verificar a queue), lancar o evento no [[Historico_de_Manutencao_das_TPOL]]  e ir para o passo 99.
 
 
 
'''99''' - Fim
 

Edição atual tal como às 12h50min de 20 de setembro de 2007

Os seguintes passos devem ser seguidos para a manutenção de uma TPOL:

  1. Início
  2. Identificar a TPOL com problema ainda no Rack;
  3. Conectar o monitor e teclado (ainda no Rack) para eliminar defeitos fáceis, como por exemplo parada no fsck ou similar. Se esse for o caso, reparar dar um reboot, monitorar a sua volta com o QMON (verificar a queue), lancar o evento no Histórico de Manutenção das TPOL e ir para o passo 8.
  4. Defeito mais complexo: retirar a TPOL do Rack para a bancada e efetuar procedimentos de diagnóstico (análise do hardware, fsck com boot pode CD live Linux, etc...);
  5. Deletar a queue da TPOL no QMON para evitar que o SGE tente utilizá-la;
  6. Consultar o Histórico de Manutenção da TPOL.
  7. No caso de defeito de hardware (exceto HD) ou fsck externo, após o reparo testar TPOL ainda na bancada com o stress por no minímo 4 horas, com a finalidade de atestar a estabilidade do hardware com carga.Concluido o teste, retornar com a TPOL para o Rack, monitorar a sua volta com o QMON (verificar a queue), lançar o evento no Histórico de Manutenção das TPOL e ir para o passo 9;
  8. No caso de defeito do HD, proceder com o dd das imagens de recuperação das TPOL (ver instruções aqui). Após o reparo testar TPOL ainda na bancada com o stress por no minímo 4 horas, com a finalidade de atestar a estabilidade do hardware com carga. Concluído o teste, retornar com a TPOL para o Rack, criar sua queue no QMON a partir da opção de Clone de uma queue boa, monitorar a sua volta com o QMON (verificar a queue), lançar o evento no Histórico de Manutenção das TPOL e ir para o passo 8;
  9. Fim