Difference between revisions of "Como rodar seu experimento"
From VeRLab Wiki
Mauferrari (talk | contribs) (→Durante a execução do seu experimento) |
Mauferrari (talk | contribs) (→Durante a execução do seu experimento) |
||
| Line 29: | Line 29: | ||
|[[File:Tmux-exemplo.jpg|300px|right]] | |[[File:Tmux-exemplo.jpg|300px|right]] | ||
|} | |} | ||
| − | Monitore o uso de recursos do seu experimento para garantir que ele não está vazando memória RAM e/ou consumindo todos recursos da máquina | + | Monitore o uso de recursos do seu experimento para garantir que ele não está vazando memória RAM e/ou consumindo todos recursos da máquina. Principalmente se a máquina for um chunkserver do storage (confira na lista de máquinas do Verlab/J na área restrita de membros). |
| + | O serviço de armazenamento distribuído, que chamamos de storage, contém todas as imagens singularity, datasets e é responsável pelo experimento de todos os colegas do Verlab/J. '''Se seu experimento exaurir os recursos computacionais das máquinas chunkserver, todo sistema de storage fica lento e atrapalha o experimento de todos!''' | ||
# use um multiplexador de terminais, por exemplo, [https://www.hostinger.com.br/tutoriais/como-usar-tmux-lista-de-comandos/ tmux] ou [https://byobu.org/ byobu] | # use um multiplexador de terminais, por exemplo, [https://www.hostinger.com.br/tutoriais/como-usar-tmux-lista-de-comandos/ tmux] ou [https://byobu.org/ byobu] | ||
#* usando um painel com htop (filtrando seu usuário, ou nome do executável) | #* usando um painel com htop (filtrando seu usuário, ou nome do executável) | ||
Revision as of 18:23, 1 April 2020
O que você precisa
- Possuir um login no laboratório
- Criar seu ambiente de execução usando o Singularity
- Procurar um servidor de processamento que atenda a seus requisitos de hardware
Antes de rodar seu experimento
- Verifique se a máquina não está com os recursos ocupados:
- Pode-se ter uma ideia geral na página da Grafana que tem link e instruções de login na área restrita do site do Verlab
- Parte 1: uso da CPU e RAM pode-se usar o htop ( como usar o htop )
- Parte 2: uso da GPU (placa de vídeo) , pode-se rodar
nvidia-smi.
Os processos que estiverem carregados na memória da GPU além o Xorg (mesmo que com zero de processamento) mostram que tem usuários utilizando e vão precisar de algum recurso de CPU e RAM para a troca de contexto de seu experimento.
- Se a máquina estiver ocupada, pode-se conversar com quem está usando para saber quando termina seu experimento ou combinar um compartilhamento do uso
Durante a execução do seu experimento
Monitore o uso de recursos do seu experimento para garantir que ele não está vazando memória RAM e/ou consumindo todos recursos da máquina. Principalmente se a máquina for um chunkserver do storage (confira na lista de máquinas do Verlab/J na área restrita de membros). O serviço de armazenamento distribuído, que chamamos de storage, contém todas as imagens singularity, datasets e é responsável pelo experimento de todos os colegas do Verlab/J. Se seu experimento exaurir os recursos computacionais das máquinas chunkserver, todo sistema de storage fica lento e atrapalha o experimento de todos!
- use um multiplexador de terminais, por exemplo, tmux ou byobu
- usando um painel com htop (filtrando seu usuário, ou nome do executável)
- usando outro painel com
watch nvidia-smi(a tela é atualizada a cada 2 segundos)
Página em construção. Os passos acima serão melhor detalhados no futuro. No momento, procure um membro da equipe de infraestrutura do VeRLab/J.