LSF作业调度系统故障解决方案
温馨提示:
本文最后更新于 2022年08月08日,已超过 620 天没有更新。若文章内的图片失效(无法正常加载),请留言反馈或直接联系我。
背景
lsf系统是集群作业的一种系统,偶尔也会崩溃,提交不了作业。表现如下
解决方案
1.确定lsf系统状态
执行 lsload
命令查看节点负载情况,若显示以上提醒,即可重启LSF作业调度系统。
2.进入root权限
执行 lsfstartup
重启LSF作业调度系统(期间需要输入三次y)
3.重启lsf短时间后情况
显示如下closed状态是正常的;
4.耐心等几分钟
bhosts
重新查看
可以正常使用了,问题已解决。
但是具体崩溃原因还是不清楚。
正文到此结束
- 本文标签: Linux LSF
- 本文链接: https://blog.voiceclouds.cn/article/70
- 版权声明: 本文由广州海琳信息技术有限公司原创发布,转载请遵循《署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)》许可协议授权