一尘不染

在Ubuntu 16.04上模拟SLURM

docker

我想在Ubuntu
16.04上模拟SLURM。我不需要认真的资源管理,我只想测试一些简单的例子。我无法以通常的方式安装SLURM,我想知道是否还有其他选项。我尝试过的其他方法:

  • 一个docker形象。不幸的是,docker pull agaveapi/slurm; docker run agaveapi/slurm给我错误:

/usr/lib/python2.6/site-
packages/supervisor/options.py:295:UserWarning:Supervisord以root身份运行,并且正在默认位置(包括其当前工作目录)中搜索其配置文件;您可能需要指定一个“
-c”参数,该参数指定配置文件的绝对路径以提高安全性。’Supervisord以root身份运行并且正在搜索‘2017-10-29 15:27:45,436
CRIT Supervisor以root身份运行(配置文件中没有用户)2017-10-29 15:27:45,437 INFO以pid 1
2017开始受监管-10-29 15:27:46,439生成的INFO:带有pid 9的’slurmd‘2017-10-29 15:27:46,441
INFO生成的:’sshd’与pid 10 2017-10-29 15:27:46,443 INFO生成的:带有pid
11的’munge‘2017-10-29 15:27:46,443信息生成::带有pid 12的’slurmctld‘2017-10-29
15:27:46,452 INFO退出:

sudo scp /etc/munge/munge.key vagrant @ server:/ home / vagrant /
ssh:连接到主机服务器端口22:连接超时失去连接


阅读 560

收藏
2020-06-17

共1个答案

一尘不染

所以…我们这里有一个现有群集,但是它运行的是较旧的Ubuntu版本,无法与运行17.04的我的工作站配合良好。

因此,在我的工作站上,我只是确保安装了slurmctld(后端)并slurmd安装了一个小工具slurm.conf

ControlMachine=mybox
# ...
NodeName=DEFAULT CPUs=4 RealMemory=4000 TmpDisk=50000 State=UNKNOWN
NodeName=mybox CPUs=4 RealMemory=16000

之后我重新启动slurmcltd然后slurmd。现在一切都很好:

root@mybox:/etc/slurm-llnl$ sinfo
PARTITION AVAIL  TIMELIMIT  NODES  STATE NODELIST
demo         up   infinite      1   idle mybox
root@mybox:/etc/slurm-llnl$

这是一个简并的设置,我们真正的设置包含开发和生产机器以及适当的分区的混合。但这应该回答您的“可以后端真正成为客户”的问题。另外,我的机器并不是真正被调用,mybox但在任何情况下都与该问题无关。

使用Ubuntu 17.04,所有库存都可以munge进行通信(无论如何都是默认的)。

编辑 :智慧:

me@mybox:~$ COLUMNS=90 dpkg -l '*slurm*' | grep ^ii
ii  slurm-client     16.05.9-1ubun amd64         SLURM client side commands
ii  slurm-wlm-basic- 16.05.9-1ubun amd64         SLURM basic plugins
ii  slurmctld        16.05.9-1ubun amd64         SLURM central management daemon
ii  slurmd           16.05.9-1ubun amd64         SLURM compute node daemon
me@mybox:~$
2020-06-17