Micro Manual de Utilização do Cluster

De LCAD
Revisão de 13h08min de 30 de abril de 2007 por 200.233.70.12 (discussão) (Variaveis de ambiente para uso do SGE)
Ir para: navegação, pesquisa

MICRO MANUAL DE USO DO SGE Ultima atualizaccao: 25/01/2003 Por: Alberto F. De Souza, Dijalma Fardin Jr. e Sergio Nery Simoes

Antes de usar este manual recomenda-se fortemente que o usuario leia o "Sun ONE Grid Engine Administration and User's Guide", disponivel em /usr/local/sge-5_3/doc/SGE53AdminUserDoc.pdf de enterprise (lcad10).

Variaveis de ambiente para uso do SGE!!!

Para ajustar suas variaveis de ambiente para uso do SGE use as opccoes abaixo.

No bash (sh) shell: . /usr/local/sge-5_3/default/common/settings.sh

No csh shell: source /usr/local/sge-5_3/default/common/settings.csh

Uso do SGE para executar um unico job

Um script demonstrando como usar o SGE para disparar um unico job esta disponivel em:

/usr/local/sge-5_3/exemplos/um_job.sh

Examine o arquivo. Ele contem tudo que e' necessario para disparar um job.


Uso do SGE para executar um unico job em varias maquinas simultaneamente

Um script demonstrando como usar o SGE para disparar multiplos jobs simultaneamente (jobs independentes com entradas diferentes, por exemplo) esta disponivel em:

/usr/local/sge-5_3/exemplos/multiplos_jobs.sh

Examine o arquivo. Ele contem tudo que e' necessario para disparar multiplos jobs.


Uso do SGE para executar um job paralelo mpi (lam-mpi)

Um script demonstrando como usar o SGE para disparar jobs mpi esta disponivel em:

/usr/local/sge-5_3/exemplos/mpi_job.sh

Examine o arquivo. Ele contem tudo que e' necessario para disparar jobs mpi.

Uso do SGE para executar um job paralelo treadmarks.

Um script demonstrando como usar o SGE para disparar jobs treadmarks esta disponivel em:

/usr/local/sge-5_3/exemplos/treadmarks_job.sh

Examine o arquivo. Ele contem tudo que e' necessario para disparar jobs.

Outros exemplos de uso do SGE

Existem outros exemplos de SGE em: /usr/local/sge-5_3/examples

qstat

  qstat ---> exibe os processos na fila (qw = esperando,
             t=preparando para rodar, r=executando)
  qdel numerojob ---> deleta um job de numero 'numerojob' 
             da fila