Mudanças entre as edições de "Rotina de Manutenção das TPOL"
m (Rotina de Manutencao das TPOL movido para Rotina de Manutenção das TPOL: Acentuação) |
m |
||
Linha 1: | Linha 1: | ||
[[category:Suporte]] | [[category:Suporte]] | ||
− | |||
− | + | Os seguintes passos devem ser seguidos para a manutenção de uma TPOL: | |
− | '''2''' - Conectar o monitor e teclado (ainda no Rack) para eliminar defeitos faceis, | + | :'''0''' - Inicio |
+ | |||
+ | :'''1''' - Identificar a TPOL com problema ainda no Rack. | ||
+ | |||
+ | :'''2''' - Conectar o monitor e teclado (ainda no Rack) para eliminar defeitos faceis, | ||
como por exemplo parada no '''fsck''' ou similar. Se esse for o caso, reparar dar um | como por exemplo parada no '''fsck''' ou similar. Se esse for o caso, reparar dar um | ||
reboot, monitorar a sua volta com o QMON (verificar a queue), lancar o evento no [[Historico_de_Manutencao_das_TPOL | Histórico de Manutencao das TPOL]] e ir para o passo 99. | reboot, monitorar a sua volta com o QMON (verificar a queue), lancar o evento no [[Historico_de_Manutencao_das_TPOL | Histórico de Manutencao das TPOL]] e ir para o passo 99. | ||
− | '''3''' - Defeito mais complexo: retirar a TPOL do Rack para a bancada e | + | :'''3''' - Defeito mais complexo: retirar a TPOL do Rack para a bancada e |
efetuar procedimentos de diagnostico (analise do hardware, '''fsck''' com boot pode CD live Linux, | efetuar procedimentos de diagnostico (analise do hardware, '''fsck''' com boot pode CD live Linux, | ||
etc...). | etc...). | ||
− | '''Deletar a queue da TPOL no QMON para evitar que o SGE tente utiliza-la.''' | + | :'''Deletar a queue da TPOL no QMON para evitar que o SGE tente utiliza-la.''' |
− | '''4''' - No caso de defeito de hardware (exceto HD) ou '''fsck''' externo, apos o reparo testar TPOL ainda | + | :'''4''' - No caso de defeito de hardware (exceto HD) ou '''fsck''' externo, apos o reparo testar TPOL ainda |
na bancada com o '''stress''' por no minimo 4 horas, com a finalidade de atestar a estabilidade do hardware com carga. | na bancada com o '''stress''' por no minimo 4 horas, com a finalidade de atestar a estabilidade do hardware com carga. | ||
Concluido o teste, retornar com a TPOL para o Rack, monitorar a sua volta com o QMON (verificar a queue), lancar o evento no | Concluido o teste, retornar com a TPOL para o Rack, monitorar a sua volta com o QMON (verificar a queue), lancar o evento no | ||
[[Historico_de_Manutencao_das_TPOL | Histórico de Manutencao das TPOL]] e ir para o passo 99. | [[Historico_de_Manutencao_das_TPOL | Histórico de Manutencao das TPOL]] e ir para o passo 99. | ||
− | '''5''' - No caso de defeito HD, proceder com o '''dd''' das imagens de recuperacao das TPOL (ver instrucoes aqui). | + | :'''5''' - No caso de defeito HD, proceder com o '''dd''' das imagens de recuperacao das TPOL (ver instrucoes aqui). |
Apos o reparo testar TPOL ainda na bancada com o '''stress''' por no minimo 4 horas, com a finalidade de atestar a estabilidade do hardware com carga. Concluido o teste, retornar com a TPOL para o Rack, '''criar sua queue no QMON a partir da opcao de Clone de uma queue boa''' , monitorar a sua volta com o QMON (verificar a queue), lancar o evento no [[Historico_de_Manutencao_das_TPOL | Histórico de Manutencao das TPOL]] e ir para o passo 99. | Apos o reparo testar TPOL ainda na bancada com o '''stress''' por no minimo 4 horas, com a finalidade de atestar a estabilidade do hardware com carga. Concluido o teste, retornar com a TPOL para o Rack, '''criar sua queue no QMON a partir da opcao de Clone de uma queue boa''' , monitorar a sua volta com o QMON (verificar a queue), lancar o evento no [[Historico_de_Manutencao_das_TPOL | Histórico de Manutencao das TPOL]] e ir para o passo 99. | ||
− | '''99''' - Fim | + | :'''99''' - Fim |
Edição das 16h38min de 17 de setembro de 2007
Os seguintes passos devem ser seguidos para a manutenção de uma TPOL:
- 0 - Inicio
- 1 - Identificar a TPOL com problema ainda no Rack.
- 2 - Conectar o monitor e teclado (ainda no Rack) para eliminar defeitos faceis,
como por exemplo parada no fsck ou similar. Se esse for o caso, reparar dar um reboot, monitorar a sua volta com o QMON (verificar a queue), lancar o evento no Histórico de Manutencao das TPOL e ir para o passo 99.
- 3 - Defeito mais complexo: retirar a TPOL do Rack para a bancada e
efetuar procedimentos de diagnostico (analise do hardware, fsck com boot pode CD live Linux, etc...).
- Deletar a queue da TPOL no QMON para evitar que o SGE tente utiliza-la.
- 4 - No caso de defeito de hardware (exceto HD) ou fsck externo, apos o reparo testar TPOL ainda
na bancada com o stress por no minimo 4 horas, com a finalidade de atestar a estabilidade do hardware com carga. Concluido o teste, retornar com a TPOL para o Rack, monitorar a sua volta com o QMON (verificar a queue), lancar o evento no Histórico de Manutencao das TPOL e ir para o passo 99.
- 5 - No caso de defeito HD, proceder com o dd das imagens de recuperacao das TPOL (ver instrucoes aqui).
Apos o reparo testar TPOL ainda na bancada com o stress por no minimo 4 horas, com a finalidade de atestar a estabilidade do hardware com carga. Concluido o teste, retornar com a TPOL para o Rack, criar sua queue no QMON a partir da opcao de Clone de uma queue boa , monitorar a sua volta com o QMON (verificar a queue), lancar o evento no Histórico de Manutencao das TPOL e ir para o passo 99.
- 99 - Fim