invaders 2024-02-26 16:05 采纳率: 0%
浏览 17
已结题

NVMe-oF的Target端,开启attr_offload后,测试失败。

我用BlueField3卡做NVMe-oF的Target端,组网如下:
[X86/Initiator]----- NVMe-oF(RDMA)-------[BlueField/Target]--- NVME-SSD

当我不开启attr_offload的时候,一切测试OK,没有任何问题。
当我不开启attr_offload的时候,日志中出现如下"XRQ NVMF backend ctrl timeout error"错误,并且offload的ctx被Removing了
谁能告诉我,XRQ NVMF backend ctrl 为什么会出现timeout错误,可能是哪里出了异常?

我是按照如下文档操作的:
https://enterprise-support.nvidia.com/s/article/howto-configure-nvme-over-fabrics--nvme-of--target-offload

###################################################################
Target侧的相关日志是:

07:15:15 kernel: [ 919.565209] nvmet_rdma: connect request (4): status 0 id 00000000bb6dc5e8
07:15:15 kernel: [ 919.593153] nvmet_rdma: added mlx5_0.
07:15:15 kernel: [ 919.608166] nvmet_rdma: nvmet_rdma_create_queue_ib: max_cqe= 8191 max_sge= 30 sq_size = 204 cm_id= 00000000bb6dc5e8
07:15:15 kernel: [ 919.630662] nvmet_rdma: established (9): status 0 id 00000000bb6dc5e8
07:15:15 kernel: [ 919.643624] nvmet: ctrl 1 start keep-alive timer for 5 secs
07:15:15 kernel: [ 919.654806] nvmet: creating nvm controller 1 for subsystem testsubsystem for NQN nqn.2014-08.org.nvmexpress:uuid:ef0cec00-a846-11ea-8000-ac1f6b3ea450.
07:15:15 kernel: [ 919.692117] nvmet_rdma: connect request (4): status 0 id 0000000020477746
07:15:15 kernel: [ 919.705730] nvmet_rdma: added mlx5_0.
07:15:15 kernel: [ 919.717137] nvmet_rdma: nvmet_rdma_create_queue_ib: max_cqe= 8191 max_sge= 30 sq_size = 102 cm_id= 0000000020477746
07:15:15 kernel: [ 919.738992] nvmet_rdma: established (9): status 0 id 0000000020477746
07:15:15 kernel: [ 919.746198] nvmet_rdma: connect request (4): status 0 id 00000000d0b3c7a0
07:15:15 kernel: [ 919.765477] nvmet_rdma: added mlx5_0.
… …
… …
07:15:18 kernel: [ 922.468332] nvmet_rdma: nvmet_rdma_create_queue_ib: max_cqe= 8191 max_sge= 30 sq_size = 102 cm_id= 0000000031c5eb81
07:15:18 kernel: [ 922.490193] nvmet_rdma: established (9): status 0 id 0000000031c5eb81
07:15:18 kernel: [ 922.503156] nvmet_rdma: connect request (4): status 0 id 00000000675c1077
07:15:18 kernel: [ 922.516756] nvmet_rdma: added mlx5_0.
07:15:18 kernel: [ 922.528174] nvmet_rdma: nvmet_rdma_create_queue_ib: max_cqe= 8191 max_sge= 30 sq_size = 102 cm_id= 00000000675c1077
07:15:18 kernel: [ 922.550005] nvmet_rdma: established (9): status 0 id 00000000675c1077
07:15:18 kernel: [ 922.562943] nvmet_rdma: using dynamic staging buffer 0000000053e1f05e
07:15:18 kernel: [ 922.622009] nvmet: Adding offload ctx 0 to configfs
07:15:18 kernel: [ 922.634362] nvmet: adding queue 1 to ctrl 1.
07:15:18 kernel: [ 922.674259] nvmet: adding queue 2 to ctrl 1.
… …
… …
07:15:20 kernel: [ 924.922805] nvmet: adding queue 47 to ctrl 1.
07:15:20 kernel: [ 924.972539] nvmet: adding queue 48 to ctrl 1.
07:15:23 kernel: [ 927.351996] nvmet: ctrl 1 update keep-alive timer for 5 secs
07:15:25 kernel: [ 929.909981] nvmet: ctrl 1 update keep-alive timer for 5 secs
07:15:28 kernel: [ 932.467996] nvmet: ctrl 1 update keep-alive timer for 5 secs
07:15:30 kernel: [ 935.026018] nvmet: ctrl 1 update keep-alive timer for 5 secs
07:15:33 kernel: [ 937.584047] nvmet: ctrl 1 update keep-alive timer for 5 secs
07:15:35 kernel: [ 940.142050] nvmet: ctrl 1 update keep-alive timer for 5 secs
07:15:37 kernel: [ 941.661828] nvme 0000:11:00.0: received IB Backend ctrl event: XRQ NVMF backend ctrl timeout error (22) be_ctrl 00000000f9eb18d8 id 0
07:15:37 kernel: [ 941.685916] nvmet: Removing offload ctx 0 from configfs

  • 写回答

28条回答 默认 最新

  • 专家-百锦再 全栈领域优质创作者 2024-02-26 16:06
    关注
    获得2.00元问题酬金

    XRQ NVMF backend ctrl timeout error (22) be_ctrl 00000000f9eb18d8 id 0

    根据您提供的日志信息,出现了"
    XRQ NVMF backend ctrl timeout error"
    错误,这通常是由于后端控制器超时引起的。可能原因包括连接问题、网络延迟、或者后端设备故障等。建议您检查网络连接是否稳定,确保所有设备都正常工作。同时,您也可以尝试调整参数,如增加超时时间或尝试其他网络配置方案来解决这个问题。


    有问题你别着急,评论留言都可以,看到马上就回复,尽量及时补充齐
    评论

报告相同问题?

问题事件

  • 系统已结题 3月5日
  • 创建了问题 2月26日

悬赏问题

  • ¥15 基于卷积神经网络的声纹识别
  • ¥15 Python中的request,如何使用ssr节点,通过代理requests网页。本人在泰国,需要用大陆ip才能玩网页游戏,合法合规。
  • ¥100 为什么这个恒流源电路不能恒流?
  • ¥15 有偿求跨组件数据流路径图
  • ¥15 写一个方法checkPerson,入参实体类Person,出参布尔值
  • ¥15 我想咨询一下路面纹理三维点云数据处理的一些问题,上传的坐标文件里是怎么对无序点进行编号的,以及xy坐标在处理的时候是进行整体模型分片处理的吗
  • ¥15 CSAPPattacklab
  • ¥15 一直显示正在等待HID—ISP
  • ¥15 Python turtle 画图
  • ¥15 stm32开发clion时遇到的编译问题