Roteiro de Verificação dos Serviços nas Máquinas do LCAD

De LCAD
Ir para: navegação, pesquisa

Introdução


Este roteiro tem o objetivo de criar uma rotina de verificação para alguns serviços relevantes nos equipamentos do LCAD.


Impressoras


As impressoras do LCAD estão instaladas em todas as máquinas (workstations). Para verificar o status da impressora na rede basta usar o comando PING.

Para a Impressora Lexmark T520:

ping 200.137.66.76

Para a Impressora Dell MFP1815:

ping 200.137.66.176

Lcad1


A workstation LCAD1 é a máquina que provê acesso externo ao LCAD. Alguns serviços a serem verificados nela são:


LPD - Serviço de impressão remota

service lpd status     - para ver o status do serviço (se esta rodando ou não)
  • Se o serviço estiver ok voce terá uma mensagem como esta : lpd (pid xxxx) is running...
  • Caso o serviço esteja parado voce terá a seguinte mensagem : lpd is stopped
service lpd start      - para iniciar o serviço (caso ele esteja parado)

SSH - Serviço de acesso remoto

service sshd status    - para verificar o status do serviço
  • Se o serviço estiver ok voce terá uma mensagem como esta : sshd (pid xxxxx) está rodando...
  • Caso o serviço esteja parado voce terá a seguinte mensagem : sshd está parado
service sshd start     - para iniciar o serviço (caso esteja parado)

Lcad2


A LCAD2 é a maquina que hospeda o site do LCAD (www.lcad.inf.ufes.br) e o SVN (Aplicativo para controle de Versões).

SSH - Serviço de acesso remoto

service sshd status    - para verificar o status do serviço
  • Se o serviço estiver ok voce terá uma mensagem como esta : sshd (pid xxxxx) está rodando...
  • Caso o serviço esteja parado voce terá a seguinte mensagem : sshd está parado
service sshd start     - para iniciar o serviço (caso esteja parado)

APACHE - Servidor Web

service httpd status   - para verificar o status do serviço
  • Se o serviço estiver ok voce terá uma mensagem como esta : httpd (pid xxxx xxxxx xxxxx) está rodando...
  • Caso o serviço esteja parado voce terá a seguinte mensagem : httpd está parado
service httpd start    - para iniciar o serviço (caso esteja parado)
service httpd restart  - para reiniciar o serviço

MYSQL - Banco de Dados

service mysqld status  - para verificar o status do serviço
  • Se o serviço estiver ok voce terá uma mensagem como esta : mysqld (pid xxxx) está rodando...
  • Caso o serviço esteja parado voce terá a seguinte mensagem : mysqld está parado
service mysqld start   - para iniciar o serviço (caso esteja parado)
service mysqld restart - para reiniciar o servico (em casos de travamento e outros)

NIS - Serviço de Informação de Rede

service ypbind status  - para verificar o status do serviço
  • Se o serviço estiver ok voce terá uma mensagem como esta : ypbind (pid xxxx) está rodando...
  • Caso o serviço esteja parado voce terá a seguinte mensagem : ypbind está parado
service ypbind start   - para iniciar o serviço (caso esteja parado)
service ypbind restart - para reiniciar o serviço

NFS - Sistema de Arquivo em Rede

service autofs status  - para verificar o status do serviço
  • Se o serviço estiver ok voce terá uma mensagem como esta : automount (pid xxxx) está rodando...
  • Caso o serviço esteja parado voce terá a seguinte mensagem : automount está parado
service autofs start   - para iniciar o serviço (caso esteja parado)
service autofs restart - para reiniciar o serviço

Backup


A máquina BACKUP é responsavel pelo backup das contas do LCAD. Maiores informações em Backup dos Serviços LCAD.

O script de backup é acionado de acordo com os horarios estabelecidos no CRON.


SSH - Serviço de acesso remoto

service sshd status    - para verificar o status do serviço
service sshd start     - para iniciar o serviço (caso esteja parado)

LOG do script de Backup

vi /var/log/rsnapshot.log
  • Verificar no arquivo de log pelas ocorrências:
completed successfully           - Quando o backup da conta foi finalizado com sucesso
fatal error occurred             - Quando o backup nao teve sucesso
completed, but with some errors  - Quando foi finalizado mas com alguns erros

Lcad10


Maquina responsavel pelo servico de NFS e escalonadora de Jobs para o Cluster

SSH - Serviço de acesso remoto

service sshd status    - para verificar o status do serviço
service sshd start     - para iniciar o serviço (caso esteja parado)

NTP - Serviço de Sincronização de Tempo

service ntpd status    - para verificar o status do serviço
  • Se o serviço estiver ok voce terá uma mensagem como esta : ntpd (pid xxxx) is running...
  • Caso o serviço esteja parado voce terá a seguinte mensagem : ntpd is stopped
service ntpd start     - para iniciar o serviço (caso esteja parado)
service ntpd restart   - para reiniciar o serviço

NIS - Serviço de Informação de Rede

service ypbind status  - para verificar o status do serviço
  • Se o serviço estiver ok voce terá uma mensagem como esta : ypbind (pid xxxx xxxx xxxx) is running...
  • Caso o serviço esteja parado voce terá a seguinte mensagem : ypbind is stopped
service ypbind start   - para iniciar o serviço (caso esteja parado)
service ypbind restart - para reiniciar o serviço
service ypserv status  - para verificar o status do serviço
  • Se o serviço estiver ok voce terá uma mensagem como esta : ypserv (pid xxxx) is running...
  • Caso o serviço esteja parado voce terá a seguinte mensagem : ypserv is stopped
service ypserv start   - para iniciar o serviço
service ypserv restart - para reiniciar o serviço
service portmap status  - para verificar o status do serviço
  • Se o serviço estiver ok voce terá uma mensagem como esta : portmap (pid xxxx) is running...
  • Caso o serviço esteja parado voce terá a seguinte mensagem : portmap is stopped
service portmap start   - para iniciar o serviço
service portmap restart - para reiniciar o serviço

NFS - Sistema de Arquivos em Rede

service nfs status     - para verificar o status do serviço
  • Se o serviço estiver ok voce terá uma mensagem como esta : nfsd (pid xxx xxx xxx xxx xxx xxx xxx xxx) is running...

rpc.rquotad (pid xxx) is running...

  • Caso o serviço esteja parado voce terá a seguinte mensagem : nfsd is stopped
service nfs start      - para iniciar o serviço
service nfs restart    - para reiniciar o serviço

Workstations (Lcad3-Lcad17)


SSH - Serviço de acesso remoto

service sshd status    - para verificar o status do serviço
  • Se o serviço estiver ok voce terá uma mensagem como esta : sshd (pid xxxxx) está rodando...
  • Caso o serviço esteja parado voce terá a seguinte mensagem : sshd está parado
service sshd start     - para iniciar o serviço (caso esteja parado)

NIS - Serviço de Informação de Rede

service ypbind status  - para verificar o status do serviço
  • Se o serviço estiver ok voce terá uma mensagem como esta : ypbind (pid xxxx) está rodando...
  • Caso o serviço esteja parado voce terá a seguinte mensagem : ypbind está parado
service ypbind start   - para iniciar o serviço (caso esteja parado)
service ypbind restart - para reiniciar o serviço

NFS - Sistema de Arquivo em Rede

service autofs status  - para verificar o status do serviço
  • Se o serviço estiver ok voce terá uma mensagem como esta : automount (pid xxxx) está rodando...
  • Caso o serviço esteja parado voce terá a seguinte mensagem : automount está parado
service autofs start   - para iniciar o serviço (caso esteja parado)
service autofs restart - para reiniciar o serviço

CUPS - Gerenciamento de Impressão em Redes

service cups status    - para verificar o status do serviço
  • Se o serviço estiver ok voce terá uma mensagem como esta : cupsd (pid xxxx) está rodando...
  • Caso o serviço esteja parado voce terá a seguinte mensagem : cupsd está parado
service cups start     - para iniciar o serviço (caso esteja parado)
service cups restart   - para reiniciar o serviço

Cluster


O status do Cluster pode ser verficado através do link http://www.lcad.inf.ufes.br/clusterstatus/ onde é mostrado em tempo real as máquinas fora do ar, máquinas livres e máquinas sendo utilizadas.

Basicamente as TPOLs devem respoder aos comandos de PING e RSH.

[root@lcad10 /root]# ping tpol1 ou ping 10.1.1.1
[root@lcad10 /root]# rsh tpol1  ou rsh 10.1.1.1

AR Condicionado (Sala do Cluster)


O ar condicionado da sala do cluster deve manter a temperatura constante de 18º

Roteador Wireless


  • Use o comando ping para verificar a conectividade com o dispsitivo.
ping 10.50.5.140
  • Ou simplesmente acesse ho browser:
http://10.50.5.140
  • Devera aparecer a tela de login do roteador caso contrario estara fora do ar

Impressoras (Lexmark T520 / Dell 1815dn)


  • Use o comando ping para verificar a conectividade com as impressoras (Lexmark T520 e Dell 1815dn).
  • Para a Lexmark T529 digite:
ping 200.137.66.76
  • Para a Dell 1815dn digite:
ping 200.137.66.176