Linux工作队列queue_work 任务丢失

场景如下：
目标：跑一个网络模型，需要在内核保存每层结果
环境：每层跑完会产生一个中断，然后进入中断后半段进行后处理，后处理在spin_lock_irqsave的保护之下

尝试方案如下：
1、直接在后处理中使用filp_open、vfs_write的接口写入，但是貌似这个操作不能在原子操作里面调用，会crash 放弃
2、目前使用的方案：使用create_workqueue工作队列，在任务里面写入，但是对于运行快小模型可以，每层都能保存下来，一到大模型，这个时候保存任务比较耗时，就会出现trace，同时丢任务，但是还是能继续跑下去，所以我只能多跑几遍，然后集合起来才能得到完整的数据，着实麻烦。

[ 4929.012718] [<ffff0000080858e0>] __switch_to+0x90/0xb0
[ 4929.013710] [<ffff00000899139c>] __schedule+0x19c/0x5e0
[ 4929.014407] [<ffff000008991818>] schedule+0x38/0xa0
[ 4929.015049] [<ffff000008994a6c>] schedule_timeout+0x12c/0x280
[ 4929.015863] [<ffff000008124304>] rcu_gp_kthread+0x504/0x750
[ 4929.016597] [<ffff0000080e16ec>] kthread+0xfc/0x130
[ 4929.017230] [<ffff0000080836c0>] ret_from_fork+0x10/0x5

请问有没有专家知道是什么原因啊，或者针对我这个需求，有没有其他更好的方法能告知一番的，感谢。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
aabbabababaa 2021-11-04 16:24
关注
没玩过工作队列，学习下

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Linux内核套接字诊断框架：sock_diag.c深度解析
2025-06-29 16:03

109702008的博客 sock_diag框架的三大优势协议无关性：通过注册机制支持任意协议族扩展安全隔离：网络命名空间/Capability实现多租户隔离性能优化：异步工作队列避免销毁操作阻塞进程实用价值为ss -K等命令提供内核支持实现容器环境...
Linux内核中的软中断与NAPI机制：高效处理网络数据包
2025-02-09 20:58

109702008的博客软中断是一种由软件触发的中断，用于处理那些不适合在硬件中断（HardIRQ）中直接完成的任务。与硬件中断不同，软中断的执行不会立即中断当前的进程，而是在合适的时机由内核调度执行。这种机制的优点是可以减少硬件...
编程与数学 03-009 Linux 操作系统应用 11_Linux 系统日志管理
2025-09-20 06:52

明月看潮生的博客本文全面介绍了 Linux 系统日志管理的各个方面，包括日志系统的重要性、演变历程、核心日志服务与工具的使用、日志文件系统结构、管理实践、安全与合规、性能优化与故障处理、日志分析与可视化技术，以及云环境与...
深入解析 Linux 内核中的 InfiniBand 驱动接口：ib_verbs.h
2025-01-22 21:06

109702008的博客 ib_verbs.h是 Linux 内核中 InfiniBand 子系统的核心头文件，位于目录下。它定义了 InfiniBand 设备驱动与用户空间库之间的接口，包括数据结构、枚举类型、函数声明等。设备管理：注册、注销 IB 设备，查询设备属性...
rq 消息队列(python)
2019-12-26 22:16

tianv5的博客 RQ (Redis Queue)是一个简单的Python库，用于队列任务并在后台与工人（worker）一起处理它们。它由Redis提供支持，旨在降低入门门槛。它可以轻松集成到您的Web堆栈中。 RQ 要求 Redis >= 3.0.0. 开始首先，运行...
Linux(更新中~)
2024-08-29 21:18

胖提莫的博客在Linux系统中，文件名以点（.）开头通常具有特殊的含义，这种文件通常被称为“隐藏文件”。隐藏文件在Linux系统中不会在普通的文件浏览器中显示，除非用户显式地设置文件浏览器显示隐藏文件。这种设计有助于隐藏...
线程池在 IM 系统中的应用：从 RocketMQ 到 AI 处理
2025-12-24 23:24

Kiyra的博客高性能：RocketMQ 异步发送，响应时间从 50ms 降到高可用：AI 处理独立线程池，不阻塞其他消息资源控制：通过参数调优，合理利用系统资源优雅关闭：应用关闭时正确清理资源关键要点选择合适的线程池参数：根据实际...
Rocky Linux - RabbitMQ
2024-07-31 09:26

Cyeso的博客 MQ全称 Message Queue（消息队列），是在消息的传输过程中保存消息的容器。多用于分布式系统之间进行通信。发送方称为生产者，接收方称为消费者首先来了解一下AMQPAMQP，即 Advanced Message Queuing Protocol（高级...
linux文件系统——ubifs之ubi子系统初始化（2）
2023-04-01 11:50

楓潇潇的博客 linux文件系统——ubifs之ubi子系统初始化（2）文章目录 linux文件系统——ubifs之ubi子系统初始化（2）前言 kernel配置ubi UBI Attach attach 参数解析 attach mtd设备 ubi_init 函数 ubi_attach_mtd_dev 函数 io...
Linux 内核中 TCP 协议栈的输出实现：tcp_output.c 文件解析
2025-06-21 20:53

109702008的博客 Linux内核中的TCP协议栈实现解析摘要：本文深入分析了Linux内核中TCP协议栈的核心输出模块tcp_output.c的实现机制。该文件位于net/ipv4目录下，是TCP协议传输层实现的关键组成部分，主要负责数据包的发送、重传和...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月4日

Linux工作队列queue_work 任务丢失

1条回答 默认 最新

问题事件

1条回答默认最新