Mudanças entre as edições de "Rotina de Manutenção das TPOL"
Linha 11: | Linha 11: | ||
efetuar procedimentos de diagnostico (analise do hardware, '''fsck''' com boot pode CD live Linux, | efetuar procedimentos de diagnostico (analise do hardware, '''fsck''' com boot pode CD live Linux, | ||
etc...). | etc...). | ||
+ | '''Deletar a queue da TPOL no QMON para evitar que o SGE tente utiliza-la.''' | ||
'''4''' - No caso de defeito de hardware (exceto HD) ou '''fsck''' externo, apos o reparo testar TPOL ainda | '''4''' - No caso de defeito de hardware (exceto HD) ou '''fsck''' externo, apos o reparo testar TPOL ainda | ||
Linha 17: | Linha 18: | ||
'''5''' - No caso de defeito HD, proceder com o '''dd''' das imagens de recuperacao das TPOL (ver instrucoes aqui). | '''5''' - No caso de defeito HD, proceder com o '''dd''' das imagens de recuperacao das TPOL (ver instrucoes aqui). | ||
− | Apos o reparo testar TPOL ainda na bancada com o '''stress''' por no minimo 4 horas, com a finalidade de atestar a estabilidade do hardware com carga. Concluido o teste, retornar com a TPOL para o Rack, monitorar a sua volta com o QMON (verificar a queue), lancar o evento no Historico de Manutencao e ir para o passo 99. | + | Apos o reparo testar TPOL ainda na bancada com o '''stress''' por no minimo 4 horas, com a finalidade de atestar a estabilidade do hardware com carga. Concluido o teste, retornar com a TPOL para o Rack, '''criar sua queue no QMON a partir da opcao de Clone de uma queue boa''' , monitorar a sua volta com o QMON (verificar a queue), lancar o evento no Historico de Manutencao e ir para o passo 99. |
'''99''' - Fim | '''99''' - Fim |
Edição das 14h32min de 17 de setembro de 2007
0 - Inicio
1 - Identificar a TPOL com problema no Rack.
2 - Conectar o monitor e teclado (ainda no Rack) para eliminar defeitos faceis, como por exemplo parada no fsck ou similar. Se esse for o caso, reparar dar um reboot, monitorar a sua volta com o QMON (verificar a queue), lancar o evento no Historico de Manutencao e ir para o passo 99.
3 - Defeito mais complexo: retirar a TPOL do Rack para a bancada e efetuar procedimentos de diagnostico (analise do hardware, fsck com boot pode CD live Linux, etc...). Deletar a queue da TPOL no QMON para evitar que o SGE tente utiliza-la.
4 - No caso de defeito de hardware (exceto HD) ou fsck externo, apos o reparo testar TPOL ainda na bancada com o stress por no minimo 4 horas, com a finalidade de atestar a estabilidade do hardware com carga. Concluido o teste, retornar com a TPOL para o Rack, monitorar a sua volta com o QMON (verificar a queue), lancar o evento no Historico de Manutencao e ir para o passo 99.
5 - No caso de defeito HD, proceder com o dd das imagens de recuperacao das TPOL (ver instrucoes aqui). Apos o reparo testar TPOL ainda na bancada com o stress por no minimo 4 horas, com a finalidade de atestar a estabilidade do hardware com carga. Concluido o teste, retornar com a TPOL para o Rack, criar sua queue no QMON a partir da opcao de Clone de uma queue boa , monitorar a sua volta com o QMON (verificar a queue), lancar o evento no Historico de Manutencao e ir para o passo 99.
99 - Fim