姚令武 2025-11-25 10:15 采纳率: 98.5%

已采纳

银河麒麟v10安装显卡驱动后无法重建initramfs镜像

在银河麒麟v10系统中安装NVIDIA或AMD私有显卡驱动后，常出现无法重建initramfs镜像的问题，表现为执行`dracut -f`或`update-initramfs`命令时失败，提示缺少模块依赖或“Module not found in directory”错误。此问题多因驱动安装修改了内核模块路径或版本不匹配导致，致使initramfs未能正确包含显卡驱动模块，进而引发系统重启后无法正常加载驱动甚至无法启动。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

泰坦V 2025-11-25 10:26

关注

银河麒麟v10系统中私有显卡驱动安装后initramfs重建失败问题深度解析

1. 问题背景与现象描述

在银河麒麟v10（Kylin V10）操作系统中，安装NVIDIA或AMD私有显卡驱动后，常出现无法重建initramfs镜像的问题。典型表现为执行dracut -f或update-initramfs -u命令时失败，终端输出如下错误信息：

Module not found in directory /lib/modules/$(uname -r)
Failed to include module 'nvidia' or 'amdgpu'
dracut: FATAL: Module dependency resolution failed

此类问题多发生在使用官方.run脚本或DKMS方式安装闭源驱动之后，导致系统重启时内核无法加载显卡模块，进而引发黑屏、卡LOGO或直接进入救援模式。

2. 根本原因分析

该问题的核心成因可归结为以下三类：

内核模块路径变更：驱动安装过程中未将.ko模块正确拷贝至/lib/modules/$(uname -r)/extra/目录；
版本不匹配：已安装驱动对应内核版本与当前运行内核不一致（如升级内核后未重新编译驱动）；
dracut配置缺失：initramfs构建工具未被显式告知需包含nvidia/amdgpu等私有模块。

此外，银河麒麟基于CentOS/RHEL系，其默认使用dracut而非Debian系的update-initramfs，若用户误用命令或环境变量混乱，也会加剧问题复杂性。

3. 检测与诊断流程

采用分步排查法定位具体故障点：

确认当前运行内核：uname -r
检查模块是否存在：find /lib/modules/$(uname -r) -name "nvidia*.ko" || find /lib/modules/$(uname -r) -name "amdgpu*.ko"
验证模块依赖关系：modinfo nvidia
查看dracut日志：dracut -f -v |& grep -i error
检测DKMS状态：dkms status
检查initramfs内容：lsinitrd /boot/initramfs-$(uname -r).img | grep nvidia

4. 解决方案汇总表

问题类型	解决方案	适用场景	命令示例
模块未安装到标准路径	手动复制模块并depmod	.run脚本安装后	cp nvidia.ko /lib/modules/$(uname -r)/extra/ && depmod -a
DKMS未注册驱动	重新添加并构建DKMS模块	NVIDIA官方驱动	dkms install nvidia/535.113.01
dracut未包含私有模块	配置dracut.conf.d	所有闭源驱动	echo 'add_drivers+="nvidia nvidia-uvm"' > /etc/dracut.conf.d/nvidia.conf
内核版本错位	重装匹配驱动或切换内核	系统更新后	dnf remove kernel-previous && akmods --force

5. 自动化修复脚本示例

以下是一个用于自动检测并修复initramfs重建问题的Bash脚本片段：

#!/bin/bash
KERNEL_VER=$(uname -r)
MODULE_PATH="/lib/modules/${KERNEL_VER}/extra"

if ! ls $MODULE_PATH/*nvidia*.ko >/dev/null 2>&1; then
    echo "[ERROR] NVIDIA module missing in $MODULE_PATH"
    exit 1
fi

# Add driver inclusion rule
echo 'add_drivers+="nvidia nvidia-modeset nvidia-drm nvidia-uvm"' > /etc/dracut.conf.d/99-nvidia.conf

# Rebuild initramfs
dracut -f --kmoddir $MODULE_PATH $KERNEL_VER

if [ $? -eq 0 ]; then
    echo "[SUCCESS] initramfs rebuilt successfully."
else
    echo "[FAILURE] dracut execution failed."
    exit 1
fi

6. 架构级规避策略流程图

为从架构层面避免此类问题反复发生，建议采用标准化部署流程：

graph TD
    A[开始安装私有驱动] -- 使用DKMS模式 --> B{是否启用Secure Boot?}
    B -- 是 --> C[禁用SB或签名模块]
    B -- 否 --> D[注册驱动至DKMS]
    D --> E[执行akmods构建模块]
    E --> F[配置dracut包含模块]
    F --> G[重建initramfs]
    G --> H[验证模块存在于initramfs]
    H --> I[重启并测试图形界面]
    I --> J[完成]

7. 高级调试技巧

对于资深运维人员，可通过以下手段深入分析：

使用strace dracut -f追踪文件系统调用，定位模块搜索路径偏差；
通过journalctl -b -1查看上一次启动日志，确认是否因模块加载失败导致服务超时；
利用kdump捕获内核崩溃现场，分析oops信息中是否涉及nvidia驱动异常；
在UEFI固件层启用“Quiet Boot”关闭，观察early KMS阶段GPU初始化状态；
结合lspci -k验证PCI设备绑定的驱动是否为预期模块。

8. 企业级部署建议

在大规模服务器或工作站集群中部署私有显卡驱动时，应遵循如下最佳实践：

统一使用RPM包管理器封装驱动+akmod组件，确保可追溯性；
通过Ansible/Puppet自动化执行dracut配置注入；
建立内核升级与驱动重构的联动机制；
在PXE镜像中预置必要模块，避免首次启动失败；
设置监控项定期检查/boot下initramfs完整性；
保留旧版initramfs作为回滚选项；
对关键节点实施双显卡冗余策略（集显+独显）；
文档化每台设备的驱动版本与内核兼容矩阵。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

银河麒麟V10桌面版安装避坑指南：从分区到驱动配置的全流程解析
2025-10-22 06:33

yog99的博客本文提供银河麒麟V10桌面版从安装准备到驱动配置的全流程避坑指南。针对麒麟操作系统安装中常见的分区规划、驱动兼容等难点，详细解析了合理的分区方案、显卡与网络驱动安装方法，并给出系统初始优化建议，帮助用户...
【银河麒麟桌面系统】安装英伟达（NVIDIA）显卡驱动
2025-07-16 08:13

爱听雨的少年的博客本文详细介绍了在麒麟桌面操作系统V10 SP1(版本号2503)上安装NVIDIA RTX 5060显卡驱动的完整流程。主要内容包括：查看系统版本信息，从NVIDIA官网下载Linux 64位驱动，授予执行权限后运行安装程序，处理安装过程中的...
【英伟达驱动在银河麒麟各个版本下的安装步骤】
2022-04-24 15:37

t1mstr0ng的博客二、 银河麒麟桌面V10安装英伟达驱动 2 确认系统版本架构 2 英伟达官网下载驱动 2 安装前配置修改 4 安装过程 4 安装后验证 6 安装报错解决方法 6 三、 银河麒麟服务器V10安装英伟达驱动 1 确认系统版本和架构 1 ...
银河麒麟高级服务器操作系统V10SP2（ARM）安装mlnx网卡驱动
2023-11-17 10:18

熊08的博客 银河麒麟高级服务器操作系统V10SP2（ARM）安装mlnx网卡驱动
银河麒麟V10取消KVM的GPU直通配置
2025-08-26 10:07

虚伪的空想家的博客本文介绍了如何取消KVM虚拟机...通过删除vfio-pci相关配置、更新initramfs镜像、安装NVIDIA驱动等操作，最终成功将GPU控制权交还给主机，并通过nvidia-smi命令验证驱动安装成功。整个过程需要重启系统以确保配置生效。
物理机/虚拟机双场景实测：麒麟v10sp3系统安装避坑指南
2025-08-23 04:10

s8t9u0v1w的博客本文针对麒麟v10sp3操作系统在物理机和虚拟机两种异构环境下的部署，提供了详细的安装避坑指南。文章深度剖析了从介质准备、引导模式、分区策略到驱动加载、网络配置等关键环节的核心差异，并给出了典型报错的实战...
银河麒麟桌面操作系统禁用无线网卡的几种方法
2025-12-17 17:18

太极淘的博客按“i”键编辑输入，在该文件最后面添加一行“blacklist iwlwifi”内容后，按“Esc”键盘退出文本编辑模式，再输入“:wq”保存退出。步骤2：在终端执行以下命令，修改/etc/modprobe.d/blacklist.conf文件。步骤1：...
1、银河麒麟高级服务器操作系统安装
2025-08-11 17:10

IT一线民工的博客 银河麒麟服务器高级操作系统安装
修复国产电脑麒麟系统开机出现initramfs 问题
2023-11-01 16:40

默默提升实验室的博客修复国产电脑麒麟系统开机出现initramfs 问题
麒麟V10桌面版制作软Raid
2025-03-20 14:43

萝卜狐的博客使用mdadm为麒麟v10系统默认是禁用了Raid、async等相关模块。准备工作 sudo apt-get update sudo apt-get install mdadm 1.检查是否加载了Raid模块 lsmod | grep raid0 2.修改模块黑名单如果模块未加载，可能是被...
银河麒麟高级服务器操作系统保留数据盘重新安装系统（boot分区，efi，根分区必须格式化）
2025-08-23 19:53

IT一线民工的博客 银河麒麟 服务器，保留数据安装系统
[安装记录]银河kylin安装UE5.1.1步骤
2025-12-30 16:21

幻迹桑的博客本文详细介绍了在银河麒麟V10(SP1)系统上安装UnrealEngine5.1.1的开发环境搭建流程。内容包括系统安装、依赖配置、显卡驱动更新、Vulkan环境部署、VSCode编辑器安装等关键步骤。重点解决了国产Linux系统下UE5开发...
从零部署：银河麒麟高级服务器操作系统V10-SP3实战安装指南
2026-03-27 10:41

吃货组长的博客本文详细介绍了银河麒麟高级服务器操作系统V10-SP3的实战安装指南，涵盖环境准备、硬件配置、安装引导、网络与安全设置、初始化调优及常见故障排查。特别针对国产化平台提供了RAID设置、分区方案和国密算法等实用...
银河麒麟高级服务器操作系统 V11+Intel i7+NVIDIA RTX 5080+GT 710亮机卡+KVM/QEMU + libvirt 虚拟机配置 GPU 直通（VFIO）
2026-01-14 11:52

网络中的夜鹰的博客 Web 应用访问虚拟机2 → 麒麟主机 ✅ 调用大模型 API 虚拟机2 ↔ 虚拟机3 ✅ Web 应用连接数据库在银河麒麟服务器操作系统V11中，通过nmcli命令行工具创建网桥（建议名称br0），将物理网卡eno1绑定至网桥，并为Win...
kylin安装KVM配置显卡直通
2025-08-24 00:29

SwuHanky的博客编辑网络配置文件（CentOS/Kylin 网络配置路径基本一致）麒麟安装nvidia-container-toolkit。表示虚拟机正在运行，你可以直接连接 VNC 安装系统。方法一：通过 NVIDIA 官方.run文件（推荐）已启用 IOMMU（如未完成请...
银河麒麟高级服务器操作系统V10SP2（ARM）min_free_kbytes值为固定值问题
2024-01-11 10:58

熊08的博客 银河麒麟高级服务器操作系统V10SP2（ARM）min_free_kbytes值为固定值问题
【中标麒麟】-- 网络接口激活连接失败问题处理
2025-12-08 10:45

布裘的博客通过PCI ID查询确认网卡型号为Intel X722，下载兼容内核3.10的i40e 2.8.43版本驱动后，经编译安装、重建模块依赖关系、更新initramfs等步骤成功解决问题。另外拓展了Linux驱动与内核的交互机制，包括动态模块加载、...
银河麒麟V10下grub2修复实战：从破坏到恢复的全过程
2025-10-20 07:45

spice的博客本文详细记录了在银河麒麟V10操作系统下，GRUB2引导程序损坏后的完整修复实战过程。通过模拟引导分区被清空的极端故障，逐步讲解如何进入救援模式、使用chroot切换环境，并关键运用grub2-install和grub2-mkconfig...
银河麒麟V10 SP1忘记密码？3分钟搞定单用户模式密码重置（附详细截图）
2025-10-11 06:50

w3x4y的博客本文详细介绍了银河麒麟V10 SP1操作系统忘记登录密码后的应急恢复方法。核心是通过GRUB引导菜单进入单用户模式，无需密码即可获得root权限，从而快速重置用户密码。文章提供了从捕捉GRUB界面、编辑启动参数到执行...
银河麒麟V10系统grub崩溃急救指南：从光盘救援到完整恢复（附详细命令）
2026-03-23 00:36

weixin_30296405的博客本文详细介绍了银河麒麟V10系统GRUB崩溃的急救方法，从光盘救援到完整恢复的全过程。通过grub2-install和grub2-mkconfig等关键命令的解析，帮助用户快速修复启动问题，确保系统稳定运行。适用于运维人员和系统管理员...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 11月26日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月25日