Desligar e Ligar a Farm.
Description
Desligar
1)Desligue o gatekeeper (na osg-ce) para que a farm não receba mais jobs:
/etc/init.d/xinetd stop
2)desligue os pools do dcache (spraid01 e spraid02)
/opt/d-cache/bin/dcache stop
3)Desligue o PhEDEx na osg-se
su -
su - phedex
Master -config ~/SITECONF/SPRACE/PhEDEx/Config.Debug stop
Master -config ~/SITECONF/SPRACE/PhEDEx/Config.Prod stop
exit
4)Desligue o dCache e o pnfs na osg-se , como root
/opt/d-cache/bin/dcache stop
/etc/init.d/pnfs stop
Feito isso você pode desligar a spraid01, spraid02 e osg-se.
shutdown -h now
5)Desligue o condor nos nodes, a partir da osg-ce como root:
clcmd /etc/init.d/condor stop
6)desligue os nodes
clcmd shutdown -h now
7)desligue a osg-ce
shutdown -h now
Ligando a farm
1) ligue a osg-ce e verifique se todos os serviços subiram corretamente. Restarte os problematicos.
2)Ligue a osg-se. Verifique se os serviços subiram corretamente (postgresql, pnfs, frontier-squid). Após estes passos é necessário
desligar a versão antiga do script de inicialização do dcache :
/etc/init.d/dcache-core stop
verifique se existe algum processo java relacionado ao dcache rodando usando ps -faux. Feito isso e
após verificar se a máquina montou o /OSG da ce:
/opt/d-cache/bin/dcache start
3) ligue a spraid01 e spraid02. Verifique se elas montaram corretamente o /OSG. Após isso, desligue o dcache que subiu com o script antigo:
/etc/init.d/dcache-pool stop
/etc/init.d/dcache-core stop
verifique usando o ps se existe algum processo java rodando. Inicie o dcache
/opt/d-cache/bin/dcache start
4)ligue os nodes de processamento, verifique se todos estão montando o /OSG corretamente . Ligue o condor
clcmd /etc/init.d/condor start
5)volte a osg-se. Ligue o
PhEDEx:
su -
su - phedex
Master -config ~/SITECONF/SPRACE/PhEDEx/Config.Debug start
Master -config ~/SITECONF/SPRACE/PhEDEx/Config.Prod start
exit
6)faça o tuning de rede
to do: modificar isso
ifconfig eth0 txqueuelen 10000
ifconfig eth1 txqueuelen 10000
repita esse último passo na spraid01 e spraid02
7)tudo correndo bem, ligue o gatekeeper (verifique se ele não está ligado antes!)
/etc/init.d/xinetd start
Fulano em dd/mm/aaaa
Coloca o que fez.
Ciclano em dd/mm/aaaa
Mais comentarios
--
MarcoAndreFerreiraDias - 09 Nov 2008