Disk Replication
Receita para replicar discos SCSI dos nodes da SPRACE
1. Separar um dos nodes para fazer a replicaçao (vamos chamá-lo de node origem); parar o serviço condor desse node:
# /etc/init.d/condor stop (p/ o node nao receber mais jobs)
# chkconfig condor off (p/ o serviço nao subir no próximo reboot)
2. Desligar o node origem. Instalar o HD a ser replicado na 2a. baia desse node.
3. Subir o node origem com um CD recente do
RedHat (ex.: SL 4.X) em modo rescue, sem montar nenhum filesystem do HD.
4. Usar o comando:
dd if=/dev/sda of=/dev/sdb bs=512k
(Obs. 1:
bs
= block size: tamanho do bloco de dados a ser copiado do disco origem ao disco destino em cada acesso, em bytes; com essa opçao, sao transferidos blocos inteiros de 512k bytes a cada acesso aos discos. Se nao for usada essa opçao, bs será 1, ou seja a transferência ocorre byte a byte, e a cópia demora
muito mais tempo (algumas horas). Com o block size em 512k, a cópia termina em apenas ~ 15 minutos.
O valor 512KB corresponde ao tamanho do bloco de dados usado pelo Linux para gravar/ler informaçoes no disco a cada acesso).
5. Mantendo o node origem desligado, subir o node destino com o HD recém replicado, e reconfigurar os scripts:
/etc/sysconfig/network (mudar o node-name)
/etc/sysconfig/network-scripts/ifcfg-eth0 (mudar o IP-address)
6. Reboot no node destino; religar o node origem.
7. Executar uma verificaçao no novo HD do node destino, usando a ferramenta
SeaTools Enteprise Edition (Lietti disponibilizou em:
/export/tools/SEAGATE
)
/export/tools/SEAGATE/st -l (para obter o drive_name)
/export/tools/SEAGATE/st -i drive_name (ex.: /dev/sga)
/export/tools/SEAGATE/st -T 100 drive_name
Obs. 2:
-l
list all attached SCSI disks,
-i
display drive Inquiry information,
-T
execute #% (10% - 100%) long Drive Self Test (DST)
Obs. 3: Só usar o teste 3 (opçao -T) se o HD for da Seagate (
http://www.seagate.com/support/seatools)
8. Subir o serviço Condor de ambos os nodes (origem e destino):
# chkconfig condor on
# /etc/init.d/condor start
9. O acesso ao node destino através da sprace deverá acusar erro, pois as chaves rsa sao as mesmas do node origem. Para corrigir isso, basta apagar a linha correspondente ao node destino no arquivo
~/.ssh/known_hosts
(em cada home).
Para identificar qual a linha a ser apagada, pode-se usar o comando:
[user@sprace user]$ cat -n ~/.ssh/known_hosts | grep nodeXX
(
XX
é o node destino)