PaddleLite 在TX2上编译怎么使能cuda，对PaddleOCR是否有加速效果

我想评测一下PaddleLite+PaddleOCR在TX2上的效果，但是我在编译的时候发现cuda好像不能打开，具体的编译log如下：

./lite/tools/build.sh -DLITE_WITH_CUDA=ON -DLITE_WITH_CV=ON -DLITE_BUILD_EXTRA=ON
+ readonly 'CMAKE_COMMON_OPTIONS=-DWITH_GPU=OFF                                -DWITH_MKL=OFF                                -DWITH_LITE=ON                                -DLITE_WITH_CUDA=OFF                                -DLITE_WITH_X86=OFF                                -DLITE_WITH_ARM=ON                                -DLITE_WITH_LIGHT_WEIGHT_FRAMEWORK=ON'
+ CMAKE_COMMON_OPTIONS='-DWITH_GPU=OFF                                -DWITH_MKL=OFF                                -DWITH_LITE=ON                                -DLITE_WITH_CUDA=OFF                                -DLITE_WITH_X86=OFF                                -DLITE_WITH_ARM=ON                                -DLITE_WITH_LIGHT_WEIGHT_FRAMEWORK=ON'
+ readonly NUM_PROC=4
+ NUM_PROC=4
+ BUILD_EXTRA=OFF
+ BUILD_TRAIN=OFF
+ BUILD_JAVA=ON
+ BUILD_PYTHON=OFF
++ pwd
+ BUILD_DIR=/home/enfu/SDData/howe/paddleLite/paddle-lite
+ OPTMODEL_DIR=
+ BUILD_TAILOR=OFF
+ BUILD_CV=OFF
+ WITH_LOG=ON
+ WITH_EXCEPTION=OFF
+ WITH_PROFILE=OFF
+ BUILD_NPU=OFF
++ pwd
+ NPU_DDK_ROOT=/home/enfu/SDData/howe/paddleLite/paddle-lite/ai_ddk_lib/
+ BUILD_XPU=OFF
+ BUILD_XTCL=OFF
++ pwd
+ XPU_SDK_ROOT=/home/enfu/SDData/howe/paddleLite/paddle-lite/xpu_sdk_lib/
+ BUILD_APU=OFF
++ pwd
+ APU_DDK_ROOT=/home/enfu/SDData/howe/paddleLite/paddle-lite/apu_sdk_lib/
+ BUILD_RKNPU=OFF
++ pwd
+ RKNPU_DDK_ROOT=/home/enfu/SDData/howe/paddleLite/paddle-lite/rknpu/
+ WITH_HUAWEI_ASCEND_NPU=OFF
+ HUAWEI_ASCEND_NPU_DDK_ROOT=/usr/local/Ascend/ascend-toolkit/latest/x86_64-linux_gcc4.8.5
+ PYTHON_EXECUTABLE_OPTION=
+ IOS_DEPLOYMENT_TARGET=9.0
+ readonly THIRDPARTY_TAR=https://paddle-inference-dist.bj.bcebos.com/PaddleLite/third-party-05b862.tar.gz
+ THIRDPARTY_TAR=https://paddle-inference-dist.bj.bcebos.com/PaddleLite/third-party-05b862.tar.gz
+ readonly workspace=/home/enfu/SDData/howe/paddleLite/paddle-lite
+ workspace=/home/enfu/SDData/howe/paddleLite/paddle-lite
++ uname -s
+ os_name=Linux
+ '[' Linux == Darwin ']'
+ main -DLITE_WITH_CUDA=ON -DLITE_WITH_CV=ON -DLITE_BUILD_EXTRA=ON
+ '[' -z -DLITE_WITH_CUDA=ON ']'
+ for i in "$@"
+ case $i in
+ print_usage
+ set +x

USAGE:

----------------------------------------
compile tiny publish so lib:
for android:
   ./build.sh --arm_os=<os> --arm_abi=<abi> --arm_lang=<lang> --android_stl=<stl> tiny_publish
for ios:
   ./build.sh --arm_os=<os> --arm_abi=<abi> ios

compile full publish so lib (ios not support):
   ./build.sh --arm_os=<os> --arm_abi=<abi> --arm_lang=<lang> --android_stl=<stl> full_publish

compile all arm tests (ios not support):
   ./build.sh --arm_os=<os> --arm_abi=<abi> --arm_lang=<lang> test

optional argument:
--with_log: (OFF|ON); controls whether to print log information, default is ON
--with_exception: (OFF|ON); controls whether to throw the exception when error occurs, default is OFF
--build_extra: (OFF|ON); controls whether to publish extra operators and kernels for (sequence-related model such as OCR or NLP)
--build_train: (OFF|ON); controls whether to publish training operators and kernels, build_train is only for full_publish library now
--build_python: (OFF|ON); controls whether to publish python api lib (ANDROID and IOS is not supported)
--build_java: (OFF|ON); controls whether to publish java api lib (Only ANDROID is supported)
--build_dir: directory for building
--ios_deployment_target: (default: 9.0); Set the minimum compatible system version for ios deployment.

argument choices:
--arm_os:	 android|ios|ios64
--arm_abi:	 armv8|armv7
--arm_lang:	 only support gcc now, clang will be supported in future.(for android)
--android_stl:	 c++_static|c++_shared (for android)

tasks:

tiny_publish: a small library for deployment.
full_publish: a full library for debug and test.
test: produce all the unittests.
----------------------------------------

-DLITE_WITH_CUDA始终是OFF，参考git的帖子我还尝试了如下编译选项

./lite/tools/build.sh cuda

也是一样的效果，请问具体该如何操作？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

7条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
飞桨PaddlePaddle 企业官方账号 2020-12-15 13:11
关注
TX2的话最好还是用Paddle Inference吧 Lite的在CUDA的算子还不是很丰富，不一定能跑PaddleOCR

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Paddle-Lite的TX2的Python安装包
2021-01-12 15:46

Paddle-Lite的TX2的Python安装包，自行编译的，亲测有效
在TX2平台编译安装飞桨Paddlepaddle
2022-09-18 17:28

下班折腾啥的博客安装nccl: git clone ... 待办计划：在不确定中前行随笔日记：祭那些逝去的时光参考链接：Jetson Nano上部署PaddleDection 原生预测方法经验分享 - 知乎
tx2+cuda+cmake:第一个cuda程序
2021-01-09 10:52

在本项目中，我们将探讨如何在NVIDIA Jetson TX2开发板上利用CUDA进行C++与CUDA混合编程，并通过CMake构建系统进行管理。CUDA（Compute Unified Device Architecture）是NVIDIA提供的一种并行计算平台和编程模型，...
Jetson TX2下编译AArch64版本的libtorch
2024-02-21 17:04

在深入探讨Jetson TX2上编译AArch64版本的libtorch之前，我们先了解一下基本概念。libtorch是PyTorch的一个轻量级库，它提供了C++接口，允许开发者在C++环境中构建和运行深度学习模型。PyTorch是一个广泛使用的开源...
Nvidia Jetson TX2配置Cuda加速Opencv[项目源码]
2025-11-23 20:45

本文对于在Nvidia Jetson TX2上配置CUDA加速OpenCV的流程进行了全面的梳理，为开发者提供了一条清晰的实现路径，避免了走弯路、踩坑的可能。通过本文的详细指导，开发者可以将更多的时间和精力投入到具体的应用开发...
自行编译的Paddle的TX2的Python安装包
2021-01-13 09:09

自行编译的Paddle的TX2的Python安装包，要安装numpy1.18.5
自行编译的Paddle的TX2的C++预测库
2021-01-13 09:12

自行编译的Paddle的TX2的C++预测库
tensorRT-Caffe:在NVIDIA Jetson TX2上使用tensorRT的演示加速了AlexNet的Caffe模型
2021-05-02 19:13

在NVIDIA Jetson TX2上使用tensorRT的演示加速了AlexNet的Caffe模型。有关中文的详细说明，请参考NVIDIA JETSON TX2 tensorRT加速Caffe实战.pdf 。先决条件： NVIDIA Jetson TX2 CUDA 8.0 人工神经网络张量...
tx2安装支持cuda的opencv.zip
2019-10-12 17:05

在深入探讨如何在NVIDIA TX2开发板上安装支持CUDA的OpenCV之前，我们首先要理解几个关键概念。CUDA是NVIDIA推出的一种并行计算平台和编程模型，它允许开发者利用GPU的强大计算能力来加速计算密集型任务。OpenCV...
Jetson-TX2手动安装CUDA和Cudnn.pdf
2020-06-25 00:37

文档中提到，在Jetson-TX2上安装CUDA时，要确保下载的是ARM架构（aarch64）的版本，因为标准的x86架构CUDA不能在ARM核心上运行。 3. cuDNN安装要求：cuDNN是NVIDIA推出的用于深度神经网络的加速库，需要和CUDA一起...
Nsight Eclipse的opencv+cuda的交叉编译，在TX2已验证可行
2017-08-24 10:07

coldsun1982的博客 nsight eclipse edition的跨平台使用，opencv语言和cuda语言混合编程，在主机交叉编译后可在jetson TX2上直接运行，供大家参考
Nvidia Jetson TX2 配置Cuda 加速的Opencv
2023-03-05 20:24

YOLOKY的博客 Jetson TX2 OpenCV（开启cuda）解决import段错误(segment error)和.so链接问题
Paddle-lite在Jetson TX2（armv8）的部署
2021-03-19 21:28

YuAnn予安的博客 Paddle-lite在Jetson TX2（armv8）的部署飞桨介绍Linux(ARM) demo部署方法部署步骤：图像分类Demo的编译与运行目标检测Demo的编译与运行F&Q提示错误：error: ‘CV_CAP_PROP_FRAME_WIDTH’ was not declared in ...
jetson-tx2-pytorch:在Nvidia Jetson TX1TX2上安装PyTorch
2021-05-11 17:47

在NVIDIA Jetson TX1 / TX2上... 提示：在TX2上，运行~/jetson_clocks.sh加速CPU的运行并启用两个以上的内核。这样可以将PyTorch的编译时间从45分钟减少到37分钟。我没有在TX1上进行测试，但是可以预期的是速度不会
jetson tx2 安装cuda 10.2或者cuda 9全过程
2021-09-28 19:12

wangxinRS的博客首先检查你是否已经安装cuda。进入/usr/local中，如果发现cuda-x.x的文件夹，则说明已经安装cuda，就此打住。我的没有，接着往下。 2. 提前安装一些必要软件因为我的机器里面除了python3和pip3，其余的没有安装，...
算法部署-在Jetson-TX2上部署车道线检测算法-附项目源码-优质项目实战.zip
2024-09-01 15:08

源码中不仅包含了算法的核心部分，还展示了如何在Jetson TX2上进行环境配置、编译和运行。这对于希望深入了解和实践车道线检测算法的开发者来说是一个宝贵的资源。源码中可能包含了以下几个核心部分： 1. 数据...
Nvidia Jetson Tx2上编译的TensorFlow安装包(whl) 懂的下
2018-01-04 08:53

支持python3.5及Opencv3.4+。Nvidia Jetson Tx2 平台编译，测试安装通过。耗费2个小时左右。懂的下。
如何在 Jetson TX2 上运行 YOLO.zip
2024-11-26 22:34

对于Jetson TX2 和 TX1，如果您想实现更好的性能、更高的 fps 并在 Jetson TX2 上实时检测更多物体，我建议您使用此存储库如何在 Jetson TX2 上运行 YOLO启动后（Jetpack 3.1）并安装OPENCV...复制原始 Yolo 存储库$...
TX2交叉编译方法
2019-12-12 21:28

Liber-coder的博客 TX2交叉编译方法，个人觉得除了也适用于TX1，TK1以及一般的ARM处理器。
没有解决我的问题, 去提问

PaddleLite 在TX2上编译怎么使能cuda，对PaddleOCR是否有加速效果

7条回答 默认 最新

7条回答默认最新