我家里一台旧电脑装PVE系统,内装ubuntu和truenas,
CPU:R7 1700x
主板:Micro-Star MS-7A37/B350M MORTAR
BIOS 版本:1.O9 (2024-03-09)
pve版本8.4
内核:6.8.12-9-pve
运行过几个小时就直接崩溃

这是报错,怎么办
我家里一台旧电脑装PVE系统,内装ubuntu和truenas,
CPU:R7 1700x
主板:Micro-Star MS-7A37/B350M MORTAR
BIOS 版本:1.O9 (2024-03-09)
pve版本8.4
内核:6.8.12-9-pve
运行过几个小时就直接崩溃

这是报错,怎么办
上午好☀️☀️☀️️
本答案参考通义千问
根据你提供的信息,PVE 报错 nmi_backtrace_stall_check_ 是一个与 NMI(Non-Maskable Interrupt) 相关的内核错误。这种错误通常表明系统在处理 NMI 时出现了异常,可能与硬件、驱动或内核配置有关。
nmi_backtrace_stall_check_
这个报错通常出现在以下几种情况:
重点: 确保 CPU 和主板 的稳定性是首要任务。
进入 BIOS 设置:
运行内存检测工具:
memtest86+ 或 MemTest86 工具测试内存是否稳定。检查 CPU 温度:
sensors 或 lm-sensors 检查 CPU 温度。重点: PVE 8.4 使用的是较新的内核(6.8.12-9-pve),但 R7 1700x 是较老的 CPU,可能与新内核存在兼容性问题。
升级 PVE 到最新版本(如果未升级):
apt update && apt full-upgrade
尝试降级内核(推荐使用 5.x 版本):
linux-image-5.15.0-101-generic):
apt install linux-image-5.15.0-101-generic
nano /etc/default/grub
# 修改 GRUB_DEFAULT="0" 或 "Advanced options for Ubuntu"
update-grub
reboot
禁用某些内核模块(可选):
/etc/default/grub 添加参数:
GRUB_CMDLINE_LINUX="nomodeset"
update-grub
重点: 由于你同时运行了 Ubuntu 和 TrueNAS,可能存在 KVM/QEMU 驱动冲突 或 虚拟机资源争用。
检查虚拟机配置:
禁用不必要的驱动:
查看日志文件:
/var/log/kern.log 或 /var/log/syslog,寻找更详细的错误信息。grep -i nmi /var/log/kern.log
重点: 如果无法解决根本问题,可以通过调整内核参数来规避 NMI 错误。
/etc/default/grub 文件:GRUB_CMDLINE_LINUX="nmi_watchdog=0"
然后执行:
update-grub
reboot
说明:
nmi_watchdog=0会禁用 NMI Watchdog,可能会减少崩溃频率,但不是根本解决方法。
| 步骤 | 说明 |
|------|------|
| 1 | 升级 PVE 并切换到稳定内核 |
| 2 | 运行 memtest86+ 测试内存 |
| 3 | 检查 CPU 温度和 BIOS 设置 |
| 4 | 禁用不必要的虚拟机资源 |
| 5 | 查看系统日志定位错误源头 |
| 问题 | 解决方案 | |------|----------| | NMI 错误 | 更新内核、检查硬件稳定性、禁用 NMI Watchdog | | 系统崩溃 | 检查内存、CPU 温度、BIOS 设置 | | 虚拟机冲突 | 减少虚拟机负载、优化资源配置 |
如果你能提供完整的日志内容(如 /var/log/kern.log 或 /var/log/syslog 的部分片段),我可以进一步帮助你分析具体原因。