QNN 模型转化转换的疑问

https://blog.csdn.net/jx232515/article/details/147590568
这篇文章中介绍了在android 系统上qnn sdk转换,运行模型的方法
有一个疑问，就是对于第七步进一步编译得到bin 模型文件一事
目标device应该是基于aarch64-android ARM 的android设备，下面qnn-context-binary-generator
执行的时候为什么选择的都是x86_64-linux-clang？请帮忙解答多谢！

我们使用htp 后端进行推理，可以构建一个后端backend配置文件，然后将配置文件作为输入，转换得到和硬件相关联的bin 文件，类似于c++ 代码实现中的构建context的那一步

${QNN_SDK_ROOT}/bin/x86_64-linux-clang/qnn-context-binary-generator
--model ./output-so/x86_64-linux-clang/libbge_real_data_qnn.so
--backend ${QNN_SDK_ROOT}/lib/x86_64-linux-clang/libQnnHtp.so
--output_dir ./bin --binary_file bge_8295_qnn.serialized
--config_file ./htp_backend_extension.json

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
宝码香车优质创作者: JavaScript技术领域 2025-10-11 15:10
关注
让【宝码香车】来帮您解答，本回答参考DeepSeek编写，并整理提供。

如果答案让您满意，请采纳、点赞、关注，非常感谢！
.
每日一句正能量，让它带给您好心情：困难像一面墙，翻过去，就能看到不一样的风景。
.

您好！您提出的这个问题非常专业，也确实是很多初次使用QNN SDK的开发者会感到困惑的地方。您对目标设备（aarch64-android）和编译工具（x86_64-linux-clang）之间不匹配的质疑是完全合理的。

下面我来为您详细解释这背后的原因。

核心原因：模型转换与模型执行的分离

关键在于，qnn-context-binary-generator 这个工具执行的是一个 “编译” 步骤，这个步骤通常是在你的 开发主机（例如 x86_64 架构的 Linux/Windows PC） 上完成的，而不是在最终的 目标设备（aarch64 Android 手机） 上。

我们可以把这个过程类比成传统的 C/C++ 程序开发：

在 PC 上编译（Compile）： 你在 x86 电脑上使用交叉编译工具链（比如 aarch64-linux-android-g++），将 C++ 源代码编译成可执行文件。这个可执行文件本身是 ARM 架构的，无法在你的 x86 PC 上直接运行。
在设备上运行（Execute）： 你将编译好的 ARM 架构可执行文件推送到 Android 设备上，它就可以完美运行。

QNN 的模型转换过程与此高度相似：

详细步骤解析

让我们分解您提供的命令：

${QNN_SDK_ROOT}/bin/x86_64-linux-clang/qnn-context-binary-generator \ --model ./output-so/x86_64-linux-clang/libbge_real_data_qnn.so \ --backend ${QNN_SDK_ROOT}/lib/x86_64-linux-clang/libQnnHtp.so \ --output_dir ./bin \ --binary_file bge_8295_qnn.serialized \ --config_file ./htp_backend_extension.json

qnn-context-binary-generator (x86_64-linux-clang)：
这是什么： 这是 Qualcomm 提供的一个工具程序。
为什么是 x86_64： 因为它需要在你的 开发主机（PC） 上运行。你的 PC 很可能是 x86_64 架构的，所以 Qualcomm 提供了这个架构的预编译版本给你使用。

--model .../libbge_real_data_qnn.so (x86_64-linux-clang)：
这是什么： 这是由 qnn-model-lib-generator 生成的模型库文件。
为什么是 x86_64： 同样，qnn-model-lib-generator 也是一个在开发主机上运行的工具。它生成的 .so 文件包含了模型的图结构和权重数据，但这个 .so 本身也是一个需要在开发主机上被 qnn-context-binary-generator 读取和处理的中间文件。它并不是最终要部署到手机上的二进制文件。

--backend .../libQnnHtp.so (x86_64-linux-clang)：
这是什么： 这是 HTP 后端的接口库。
为什么是 x86_64： qnn-context-binary-generator 在编译生成最终的 .serialized.bin 文件时，需要调用 HTP 后端提供的特定功能（例如，根据你的 htp_backend_extension.json 配置来优化模型，使其与骁龙芯片的 HTP 硬件特性对齐）。这个调用过程发生在开发主机上，所以需要一个能在开发主机上运行的 HTP 后端接口库。

--config_file ./htp_backend_extension.json：
这个配置文件指明了最终的目标硬件特性（例如 socModel: "SM8550" 指向骁龙 8 Gen 2）。qnn-context-binary-generator 会结合这个配置信息和 HTP 后端库，生成一个针对指定骁龙芯片高度优化的二进制模型文件。

输出：bge_8295_qnn.serialized.bin
这是什么： 这是最终产物，一个与硬件平台强相关的、序列化后的二进制模型文件。
它的架构是？ 这个 .bin 文件是中立的，它不依赖于 x86_64 或 aarch64。它里面包含的是为指定骁龙 HTP 优化过的指令和数据。当你在 Android 设备上使用 QNN 的 HTP 后端加载这个 .bin 文件时，HTP 驱动和固件能够直接理解并执行它。

总结

简单来说，整个过程可以这样理解：

准备阶段（在 x86 PC 上）：

使用 x86_64 的工具链处理模型、后端库和配置文件，目的是为了生成一个优化的二进制文件。
这个过程就像用 aarch64-linux-android-g++ 在 x86 PC 上编译出 ARM 程序。

执行阶段（在 aarch64 Android 设备上）：

你将生成的 bge_8295_qnn.serialized.bin 文件和 aarch64-android 版本的 libQnnHtp.so 打包到你的 Android App 中。
你的 App（通过 QNN 的 aarch64 运行时库）在手机上加载 libQnnHtp.so，然后 HTP 后端再加载并执行那个 .bin 文件，完成推理。

所以，命令中出现的 x86_64-linux-clang 指的是工具和中间库的运行环境（你的开发机），而最终 .bin 文件的目标环境则由你的 htp_backend_extension.json 配置文件决定，也就是 aarch64-android 设备上的骁龙 HTP。

希望这个解释能解决您的疑问！这是一个非常典型的交叉编译工作流。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(4条)

报告相同问题？

关注问题

在android 系统上qnn sdk转换，运行模型，精度调优示例总结
2025-04-28 16:32

清风lsq的博客前面讲了如何配置qnn sdk的环境，这一篇总结下qnn 实际转换一个onnx 模型，并运行的实现步骤。设备：1. ubuntu22.04 的Linux 服务器。2. 一台android手机。
高通AI Engine SDK（QNN）使用教程（环境配置、模型转换、量化、推理、分析）
2024-08-19 18:15

火鸡大师傅的博客高通AI Engine使用教程
高通AI应用程序开发3：网络模型(三)模型转换
2024-09-26 10:39

小码hh的博客 Qualcomm®神经处理SDK通过将这些模型转换为框架中立的深度学习容器（DLC）格式来支持这些不同的模型。工具将tflite模型转换为等效的Qualcomm®神经处理SDK dlc文件。以下命令将Inception v3 TFLite模型转换为...
基于AI-Hub执行Yolo11模型转换和Profiling
2024-10-10 14:55

csdnsqst0050的博客 YOLO 11是Ultralytics最新发布的YOLO系列模型，专为计算机视觉任务设计。本文介绍使用AI-hub工具，只需要几行代码就可以完成从模型转换到部署云端的手机上去做性能评估。
解决qnn htp 后端不支持boolean 数据类型的方法。
2025-04-27 18:32

清风lsq的博客解决qnn htp 后端不支持boolean 数据类型的方法。
从零开始：Qualcomm AI Engine Direct 模型转换器的实战指南
2026-02-01 00:48

编程勇者的博客本文详细介绍了Qualcomm AI Engine Direct（QNN SDK）模型转换器的实战指南，涵盖从TensorFlow、PyTorch等框架到QNN模型的完整转换流程，包括环境配置、分框架转换实战、性能调优技巧及部署问题解决方案。...
当量子计算遇见大模型：AI的终局还是新起点？
2025-12-24 16:45

八核CPU的博客如果量子计算在2025-2035年间成熟，现在的H100集群将被视为...而未来的量子AI，不再需要吞噬海量的人类文本，将直接通过量子模拟洞察宇宙的规律，在希尔伯特空间的无限维度中，编织出我们无法想象的全新智能形态。
[RKNN] 2. 模型转换和推理--API介绍&以yolox为例
2023-07-09 16:42

学不进去了的博客 RKNN的模型转换和推理介绍，API介绍并且以yolox为例实现转换和推理
AI芯片的运行时机制深度剖析：模型加载、任务切换与资源分配实战
2025-06-15 09:08

观熵的博客随着大模型、小模型在端侧、边缘侧广泛部署，AI芯片运行时（Runtime）的能力逐渐成为系统性能和能耗表现的核心决定因素。本文聚焦主流 AI 芯片（如寒武纪、地平线、华为昇腾、高通 Hexagon、联发科 APU）在模型加载...
AI测试引擎中CV和ML模型的技术架构
2025-04-14 20:00

小赖同学啊的博客此层负责收集各种类型的数据，为后续的模型训练和测试提供基础。对于CV模型，主要采集图像、视频数据，可来源于摄像头、图像数据库等；对于ML模型，采集结构化数据（如表格数据）、非结构化数据（如文本数据）等，...
AI人工智能与机器学习：推动科技进步的双引擎
2025-04-10 18:01

AI智能架构工坊的博客本文旨在构建AI与机器...概念层：定义AI与ML的核心术语及层次关系方法层：解析三大机器学习范式的算法原理与数学模型实践层：通过图像分类实战演示完整技术链路展望层：探讨技术融合趋势与产业落地挑战人工智能（AI）
TensorFlow Lite 开发手册（3）——模型转换
2019-10-22 09:20

Friedrich Yuan的博客 TensorFLow Lite 开发手册（3）——模型转换（一）模型转换简介（1）工作流程（2）转换示例模型（二）模型调用（1） Python 接口（2） C++接口（一）模型转换简介（1）工作流程基本工作流程如下： TensorFlow ...
AI智能体长期记忆系统架构设计：从认知模型到生产实践
2025-06-25 18:06

一休哥助手的博客长期记忆能力是AI智能体实现**持续个性化服务**的核心瓶颈。本文基于Mem0、MemoryOS等前沿研究，系统解析长期记忆系统的**三级架构**、**六大原子操作**与**生产级优化方案**，结合3D空间理解、多智能体协作等创新...
终极指南：量子计算时代AI应用架构师的核心能力模型（2024最新版）
2025-09-26 22:55

AGI大模型与大数据研究院的博客随着量子计算技术从实验室逐步迈向商业化应用的前夜（2024年，我们看到IBM、Google、Microsoft等巨头在量子硬件和软件生态上的飞速进展，NISQ时代的实用化量子优势已在特定领域显现），其对人工智能领域的颠覆性影响...
主流深度学习框架及神经网络模型汇总
2023-08-27 22:25

ZhangJiqun&Hoper的博客用大白话说就是是一个中间件，比如你PyTorch的模型想转换别的，就得通过ONNX，现在有的框架可以直接转，但是在没有专门支持的时候，ONNX就非常重要了，万物先转ONNX，ONNX再转万物。NCNN的速度是超过TFLite的，但是...
高通跃龙QCS6490部署yolov11_obb教程（2）：QNN SDK安装教程
2025-08-11 09:29

weixin_38498942的博客 2）详细列举了模型编译运行、格式转换、量化分析等各类工具；3）分步骤说明Linux环境下的SDK下载、QPM安装及授权激活流程；4）针对libssl依赖缺失、systemd报错等常见问题提供解决方案。适用于需要在x86工控机和高通...
基于StableDiffusionV15模型的移动端AI绘画生成器_支持文字转图片的端侧AI应用_可在手机CPU和NPU上运行的轻量化StableDiffusion实现_包.zip
2025-08-20 10:49

在数字艺术和人工智能领域，StableDiffusion模型已经成为了最新技术的代表，尤其在将文字描述转换为图像方面取得了突破性进展。StableDiffusionV15模型是这一系列模型中的最新版本，它不仅改进了生成图像的质量，还...
【AI 测试】测试用例设计：人工智能语言大模型性能测试用例设计
2025-06-23 15:22

顾三殇的博客 AI 语言大模型：性能测试用例详细编写（表格型），用例表格标题为：用例编号、测试场景、测试方法、监控指标、预期结果、通过标准。
85%的AI架构师都在学！这10个新前沿领域将成为2025年技术风口
2025-08-28 15:23

AI大数据智能洞察的博客早期的多模态模型是“文本+图像”的简单拼接——比如用CNN处理图像，用LSTM处理文本，然后把两个结果拼接起来做分类。给它一张“猫在沙发上”的图片，再输入文本“猫的颜色”，它能回答“白色”；但如果输入“沙发的...
AI应用架构师解读智能产品推荐AI系统的量子计算应用前景
2025-12-03 21:22

AI大数据智能洞察的博客智能产品推荐系统是现代电商、流媒体、社交平台的核心引擎，其本质是解决“用户-物品”的匹配问题。高维数据处理效率低：用户行为、物品属性、上下文信息形成高维稀疏矩阵，经典矩阵分解或深度学习模型的计算复杂度...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 10月19日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月11日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月11日

QNN 模型转化转换的疑问

5条回答 默认 最新

核心原因：模型转换与模型执行的分离

详细步骤解析

总结

问题事件

5条回答默认最新