在使用集群服务器进行gaussian计算的时候,突然其中一个节点状态变成了"down",随后去重启之,然后就发现该节点状态转为了“error”,再无法进行任务的分配与计算。
在调阅日志文件时并未发现有错误信息,并且用xshell远程连接的时候,依旧可以用ssh命令登陆到该节点。
除了调阅日志文件外,同样排除了硬件问题、网络连接问题,因为本人对计算机理解太少,是否是由ip或端口错误引起的问题也不清楚。
希望社区的各位可以给出解答。
万分感谢!
在使用集群服务器进行gaussian计算的时候,突然其中一个节点状态变成了"down",随后去重启之,然后就发现该节点状态转为了“error”,再无法进行任务的分配与计算。
在调阅日志文件时并未发现有错误信息,并且用xshell远程连接的时候,依旧可以用ssh命令登陆到该节点。
除了调阅日志文件外,同样排除了硬件问题、网络连接问题,因为本人对计算机理解太少,是否是由ip或端口错误引起的问题也不清楚。
希望社区的各位可以给出解答。
万分感谢!
让阿豪来帮你解答,本回答参考chatgpt3.5编写提供,如果还有疑问可以评论或留言可能原因: