痘痘飞 2021-12-02 17:31 采纳率: 42.9%
浏览 24
已结题

Rancher运行一点时间后,检测不到项目的命名空间了

错误起因

我使用了k3s+rancher做项目集群,当集群运行了一段时间之后,偶尔就会出现这个错误。

错误详情

首先就是集群下的所有项目还在,但是项目下的命名空间都检测不到了,什么工作负载、负载均衡之类的也通通检测不到了。
然后登陆宿主机使用命令行查看集群,比如kubectl get no/kubectl get po --all-namespaces,发现一切正常,之前的服务也运行正常,访问也没问题,仅仅就是rancher ui检测不到了。

错误排查

上次出现这个问题的时候,我尝试重启master节点,发现问题还在;又重启了所有节点,启动后问题就没了,一切都正常。然后就是正常运行一段时间,直到今天,问题又重现了。
我又尝试了在rancher ui上删除集群,然后重新import集群,问题也可以解决。
感觉这么重启也不是一个解决办法啊,所以问问大家有没有遇到过这个问题,或者有什么解决思路的?

  • 写回答

0条回答 默认 最新

    报告相同问题?

    问题事件

    • 系统已结题 12月10日
    • 修改了问题 12月2日
    • 创建了问题 12月2日

    悬赏问题

    • ¥60 版本过低apk如何修改可以兼容新的安卓系统
    • ¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
    • ¥50 有数据,怎么建立模型求影响全要素生产率的因素
    • ¥50 有数据,怎么用matlab求全要素生产率
    • ¥15 TI的insta-spin例程
    • ¥15 完成下列问题完成下列问题
    • ¥15 C#算法问题, 不知道怎么处理这个数据的转换
    • ¥15 YoloV5 第三方库的版本对照问题
    • ¥15 请完成下列相关问题!
    • ¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像,如何解决?