我想在Ubuntu 16.04上模拟SLURM。我不需要认真的资源管理,我只想测试一些简单的例子。我无法以通常的方式安装SLURM,我想知道是否还有其他选项。我尝试过的其他方法:
docker pull agaveapi/slurm; docker run agaveapi/slurm
/usr/lib/python2.6/site- packages/supervisor/options.py:295:UserWarning:Supervisord以root身份运行,并且正在默认位置(包括其当前工作目录)中搜索其配置文件;您可能需要指定一个“ -c”参数,该参数指定配置文件的绝对路径以提高安全性。’Supervisord以root身份运行并且正在搜索‘2017-10-29 15:27:45,436 CRIT Supervisor以root身份运行(配置文件中没有用户)2017-10-29 15:27:45,437 INFO以pid 1 2017开始受监管-10-29 15:27:46,439生成的INFO:带有pid 9的’slurmd‘2017-10-29 15:27:46,441 INFO生成的:’sshd’与pid 10 2017-10-29 15:27:46,443 INFO生成的:带有pid 11的’munge‘2017-10-29 15:27:46,443信息生成::带有pid 12的’slurmctld‘2017-10-29 15:27:46,452 INFO退出:
munge
sudo scp /etc/munge/munge.key vagrant @ server:/ home / vagrant / ssh:连接到主机服务器端口22:连接超时失去连接
所以…我们这里有一个现有群集,但是它运行的是较旧的Ubuntu版本,无法与运行17.04的我的工作站配合良好。
因此,在我的工作站上,我只是确保安装了slurmctld(后端)并slurmd安装了一个小工具slurm.conf,
slurmctld
slurmd
slurm.conf
ControlMachine=mybox # ... NodeName=DEFAULT CPUs=4 RealMemory=4000 TmpDisk=50000 State=UNKNOWN NodeName=mybox CPUs=4 RealMemory=16000
之后我重新启动slurmcltd然后slurmd。现在一切都很好:
slurmcltd
root@mybox:/etc/slurm-llnl$ sinfo PARTITION AVAIL TIMELIMIT NODES STATE NODELIST demo up infinite 1 idle mybox root@mybox:/etc/slurm-llnl$
这是一个简并的设置,我们真正的设置包含开发和生产机器以及适当的分区的混合。但这应该回答您的“可以后端真正成为客户”的问题。另外,我的机器并不是真正被调用,mybox但在任何情况下都与该问题无关。
mybox
使用Ubuntu 17.04,所有库存都可以munge进行通信(无论如何都是默认的)。
编辑 :智慧:
me@mybox:~$ COLUMNS=90 dpkg -l '*slurm*' | grep ^ii ii slurm-client 16.05.9-1ubun amd64 SLURM client side commands ii slurm-wlm-basic- 16.05.9-1ubun amd64 SLURM basic plugins ii slurmctld 16.05.9-1ubun amd64 SLURM central management daemon ii slurmd 16.05.9-1ubun amd64 SLURM compute node daemon me@mybox:~$