原创

LSF作业调度系统故障解决方案

温馨提示:
本文最后更新于 2022年08月08日,已超过 620 天没有更新。若文章内的图片失效(无法正常加载),请留言反馈或直接联系我

背景

lsf系统是集群作业的一种系统,偶尔也会崩溃,提交不了作业。表现如下

解决方案

1.确定lsf系统状态

执行 lsload 命令查看节点负载情况,若显示以上提醒,即可重启LSF作业调度系统。

2.进入root权限

执行 lsfstartup 重启LSF作业调度系统(期间需要输入三次y)

3.重启lsf短时间后情况

显示如下closed状态是正常的;

4.耐心等几分钟

bhosts 重新查看

可以正常使用了,问题已解决。

但是具体崩溃原因还是不清楚。

正文到此结束
本文目录