Difference between revisions of "Como rodar seu experimento"

From VeRLab Wiki
Jump to: navigation, search
(Antes de rodar seu experimento)
Line 1: Line 1:
  
== O que você precisa ==
+
= O que você precisa =
 
# Possuir um login no laboratório
 
# Possuir um login no laboratório
 
# Criar seu ambiente de execução usando o [[Singularity]]
 
# Criar seu ambiente de execução usando o [[Singularity]]
Line 6: Line 6:
 
<br><br><br>
 
<br><br><br>
  
== Antes de rodar seu experimento ==
+
= Antes de rodar seu experimento =
 
{|
 
{|
 
|[[File:Grafana-exemplo.jpg|440px|left]]
 
|[[File:Grafana-exemplo.jpg|440px|left]]
Line 25: Line 25:
 
-->
 
-->
  
== Durante a execução do seu experimento ==
+
= Durante a execução do seu experimento =
 
{|
 
{|
 
|[[File:Tmux-exemplo.jpg|300px|right]]
 
|[[File:Tmux-exemplo.jpg|300px|right]]
Line 42: Line 42:
 
<br><br><br>
 
<br><br><br>
  
== Página em construção ==
+
= Página em construção =
 
'''Os passos acima servem para a grande maioria dos experimentos, se tem necessidade de algo diferente ou mais específico, procure um membro da equipe de infraestrutura do VeRLab/J.'''
 
'''Os passos acima servem para a grande maioria dos experimentos, se tem necessidade de algo diferente ou mais específico, procure um membro da equipe de infraestrutura do VeRLab/J.'''

Revision as of 10:32, 25 November 2022

O que você precisa

  1. Possuir um login no laboratório
  2. Criar seu ambiente de execução usando o Singularity
  3. Procurar na planilha de "Dados Gerais das Máquinas" um servidor de processamentos que atenda a seus requisitos de hardware ( Disponível na área restrita aos membros Verlab/J, mesma credencial das máquinas)




Antes de rodar seu experimento

Grafana-exemplo.jpg
Tmux-exemplo.jpg
  1. Verifique se a máquina não está com os recursos ocupados:
    • Pode-se ter uma ideia geral na página da Grafana que tem link e instruções de login na área restrita do site do Verlab
      Infelizmente a Grafana está desativada no momento, precisamos de ajuda para colocar ela online novamente!
    • Parte 1: uso da CPU e RAM pode-se usar o htop ( como usar o htop )
    • Parte 2: uso da GPU (placa de vídeo) , pode-se rodar nvidia-smi .
      Os processos que estiverem carregados na memória da GPU além o Xorg (mesmo que com zero de processamento) mostram que tem usuários utilizando e vão precisar de algum recurso de CPU e RAM para a troca de contexto de seu experimento.
  2. Se a máquina estiver ocupada, pode-se conversar com quem está usando para saber quando termina seu experimento ou combinar um compartilhamento do uso




Durante a execução do seu experimento

Tmux-exemplo.jpg

Monitore o uso de recursos do seu experimento para garantir que ele não está vazando memória RAM e/ou consumindo todos recursos da máquina. Principalmente se a máquina for um chunkserver do storage (confira na lista de máquinas área restrita do site do Verlab).
O serviço de armazenamento distribuído, que chamamos de storage, contém todas as imagens singularity, datasets e é responsável pelo experimento de todos os colegas do Verlab/J.
Se seu experimento exaurir os recursos computacionais das máquinas chunkserver, todo sistema de storage fica lento e atrapalha o experimento de todos!


Para monitorar seu experimento, é sugerido:

  1. use um multiplexador de terminais, por exemplo, tmux ou byobu
    • usando um painel com htop (filtrando seu usuário, ou nome do executável)
    • usando outro painel com watch nvidia-smi (a tela é atualizada a cada 2 segundos)




Página em construção

Os passos acima servem para a grande maioria dos experimentos, se tem necessidade de algo diferente ou mais específico, procure um membro da equipe de infraestrutura do VeRLab/J.