码农-小林 2026-02-04 09:19 采纳率: 50.6%
浏览 1

YOLOV3编译生成marknet.exe报cuda问题

1,YOLOV3编译生成marknet.exe报cuda问题,报错如下

img

2,以下是makefile文件写法

GPU=1#以启用GPU支持图片处理器
CUDA=1#设置为1以启用GPU加速
CUDNN=1#cuDNN是用于深度神经网络的GPU加速库,启用它可以提高性能。
CUDNN_HALF=0
OPENCV=1
AVX=0
OPENMP=0
LIBSO=0
ZED_CAMERA=0
ZED_CAMERA_v2_8=0
# 设置 OpenCV 路径
#OPENCV_PATH=D:/OpenCV-MinGW-Build-OpenCV-4.5.2-x64
#OPENCV_PATH=/cygdrive/d/OpenCV-MinGW-Build-OpenCV-4.5.2-x64
OPENCV_PATH=/cygdrive/d/opencv3.4.00/opencv
#CUDA_PATH=C:/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v11.4
CUDA_PATH=/cygdrive/c/Program\ Files/NVIDIA\ GPU\ Computing\ Toolkit/CUDA/v10.2


# set GPU=1 and CUDNN=1 to speedup on GPU
# set CUDNN_HALF=1 to further speedup 3 x times (Mixed-precision on Tensor Cores) GPU: Volta, Xavier, Turing and higher
# set AVX=1 and OPENMP=1 to speedup on CPU (if error occurs then set AVX=0)
# set ZED_CAMERA=1 to enable ZED SDK 3.0 and above
# set ZED_CAMERA_v2_8=1 to enable ZED SDK 2.X

USE_CPP=0
DEBUG=0

#ARCH= -gencode arch=compute_30,code=sm_30 \
      -gencode arch=compute_35,code=sm_35 \
      -gencode arch=compute_50,code=[sm_50,compute_50] \
      -gencode arch=compute_52,code=[sm_52,compute_52] \
        -gencode arch=compute_61,code=[sm_61,compute_61]
ARCH= -gencode arch=compute_52,code=sm_52 \
      -gencode arch=compute_61,code=sm_61 \
      -gencode arch=compute_70,code=sm_70 \
      -gencode arch=compute_75,code=sm_75 \
      -gencode arch=compute_80,code=sm_80
OS := $(shell uname)

# Tesla A100 (GA100), DGX-A100, RTX 3080
# ARCH= -gencode arch=compute_80,code=[sm_80,compute_80]

# Tesla V100
# ARCH= -gencode arch=compute_70,code=[sm_70,compute_70]

# GeForce RTX 2080 Ti, RTX 2080, RTX 2070, Quadro RTX 8000, Quadro RTX 6000, Quadro RTX 5000, Tesla T4, XNOR Tensor Cores
# ARCH= -gencode arch=compute_75,code=[sm_75,compute_75]

# Jetson XAVIER
# ARCH= -gencode arch=compute_72,code=[sm_72,compute_72]

# GTX 1080, GTX 1070, GTX 1060, GTX 1050, GTX 1030, Titan Xp, Tesla P40, Tesla P4
# ARCH= -gencode arch=compute_61,code=sm_61 -gencode arch=compute_61,code=compute_61

# GP100/Tesla P100 - DGX-1
# ARCH= -gencode arch=compute_60,code=sm_60

# For Jetson TX1, Tegra X1, DRIVE CX, DRIVE PX - uncomment:
# ARCH= -gencode arch=compute_53,code=[sm_53,compute_53]

# For Jetson Tx2 or Drive-PX2 uncomment:
# ARCH= -gencode arch=compute_62,code=[sm_62,compute_62]


VPATH=./src/
EXEC=darknet
OBJDIR=./obj/

ifeq ($(LIBSO), 1)
LIBNAMESO=libdarknet.so
APPNAMESO=uselib
endif

ifeq ($(USE_CPP), 1)
#CC=g++
CC=x86_64-pc-cygwin-g++
else
#CC=gcc
CC=x86_64-pc-cygwin-gcc
endif

CPP=g++ -std=c++11
#NVCC=nvcc
#NVCC := C:/Program\ Files/NVIDIA\ GPU\ Computing\ Toolkit/CUDA/v11.4/bin/nvcc.exe
NVCC := $(CUDA_PATH)/bin/nvcc
OPTS=-Ofast
LDFLAGS= -lm -pthread
COMMON= -Iinclude/ -I3rdparty/stb/include
#CFLAGS=-Wall -Wfatal-errors -Wno-unused-result -Wno-unknown-pragmas -fPIC
# 检测Windows系统
ifneq (,$(findstring CYGWIN,$(shell uname)))
    # Cygwin环境下的特殊配置
    CFLAGS = -Wall -Wfatal-errors -Wno-unused-result -Wno-unknown-pragmas -fPIC
    # 或者对于某些Cygwin版本,可能需要:
    # CFLAGS = -Wall -Werror -Wno-unused-result -Wno-unknown-pragmas -fPIC
else
    # 原有配置
    CFLAGS = -Wall -Wfatal-errors -Wno-unused-result -Wno-unknown-pragmas -fPIC
endif

ifeq ($(DEBUG), 1)
#OPTS= -O0 -g
#OPTS= -Og -g
COMMON+= -DDEBUG
CFLAGS+= -DDEBUG
else
ifeq ($(AVX), 1)
CFLAGS+= -ffp-contract=fast -mavx -mavx2 -msse3 -msse4.1 -msse4.2 -msse4a
endif
endif

CFLAGS+=$(OPTS)

ifneq (,$(findstring MSYS_NT,$(OS)))
LDFLAGS+=-lws2_32
endif

ifeq ($(OPENCV), 1)
COMMON+= -DOPENCV
CFLAGS+= -DOPENCV 
COMMON+= -I$(OPENCV_PATH)/build/include
COMMON+= -I$(OPENCV_PATH)/build/include/opencv
COMMON+= -I$(OPENCV_PATH)/build/include/opencv2
LDFLAGS+= -L$(OPENCV_PATH)/build/x64/vc15/lib
LDFLAGS+= -L$(OPENCV_PATH)/build/x64/vc15/bin
LDFLAGS+= -lopencv_world4100 
#LDFLAGS+= -lopencv_core4100 -lopencv_highgui4100 -lopencv_imgproc4100 -lopencv_imgcodecs4100 -lopencv_videoio4100 -lopencv_objdetect4100
#LDFLAGS+= -lopencv_core -lopencv_highgui -lopencv_imgproc -lopencv_objdetect
#LDFLAGS+=`pkg-config --libs opencv3 2> /dev/null || pkg-config --libs opencv`
#COMMON+=`pkg-config --cflags opencv3 2> /dev/null || pkg-config --cflags opencv`
endif

ifeq ($(OPENMP), 1)
    ifeq ($(OS),Darwin) #MAC
        CFLAGS+= -Xpreprocessor -fopenmp
    else
        CFLAGS+= -fopenmp
    endif
LDFLAGS+= -lgomp
endif

ifeq ($(GPU), 1)
#COMMON+= -DGPU -I/usr/local/cuda/include/
COMMON+= -DGPU -I$(CUDA_PATH)/include
CFLAGS+= -DGPU
ifeq ($(OS),Darwin) #MAC
#LDFLAGS+= -L/usr/local/cuda/lib -lcuda -lcudart -lcublas -lcurand
LDFLAGS+= -L$(CUDA_PATH)/lib -lcuda -lcudart -lcublas -lcurand
else
#LDFLAGS+= -L/usr/local/cuda/lib64 -lcuda -lcudart -lcublas -lcurand
LDFLAGS+= -L$(CUDA_PATH)/lib/x64 -lcuda -lcudart -lcublas -lcurand

endif
endif

ifeq ($(CUDNN), 1)
COMMON+= -DCUDNN
ifeq ($(OS),Darwin) #MAC
#CFLAGS+= -DCUDNN -I/usr/local/cuda/include
CFLAGS+= -DCUDNN -I$(CUDA_PATH)/include
LDFLAGS+= -L/usr/local/cuda/lib -lcudnn
#LDFLAGS+= -L$(CUDA_PATH)/lib -lcudnn
else
#CFLAGS+= -DCUDNN -I/usr/local/cudnn/include
CFLAGS+= -DCUDNN -I$(CUDA_PATH)/include
#LDFLAGS+= -L/usr/local/cudnn/lib64 -lcudnn
LDFLAGS+= -L$(CUDA_PATH)/lib/x64 -lcudnn
endif
endif

ifeq ($(CUDNN_HALF), 1)
COMMON+= -DCUDNN_HALF
CFLAGS+= -DCUDNN_HALF
ARCH+= -gencode arch=compute_70,code=[sm_70,compute_70]
endif

ifeq ($(ZED_CAMERA), 1)
CFLAGS+= -DZED_STEREO -I/usr/local/zed/include
#CFLAGS+= -DZED_STEREO -I$(CUDA_PATH)/include
ifeq ($(ZED_CAMERA_v2_8), 1)
LDFLAGS+= -L/usr/local/zed/lib -lsl_core -lsl_input -lsl_zed
#-lstdc++ -D_GLIBCXX_USE_CXX11_ABI=0
else
LDFLAGS+= -L/usr/local/zed/lib -lsl_zed
#-lstdc++ -D_GLIBCXX_USE_CXX11_ABI=0
endif
endif

OBJ=image_opencv.o http_stream.o gemm.o utils.o dark_cuda.o convolutional_layer.o list.o image.o activations.o im2col.o col2im.o blas.o crop_layer.o dropout_layer.o maxpool_layer.o softmax_layer.o data.o matrix.o network.o connected_layer.o cost_layer.o parser.o option_list.o darknet.o detection_layer.o captcha.o route_layer.o writing.o box.o nightmare.o normalization_layer.o avgpool_layer.o coco.o dice.o yolo.o detector.o layer.o compare.o classifier.o local_layer.o swag.o shortcut_layer.o activation_layer.o rnn_layer.o gru_layer.o rnn.o rnn_vid.o crnn_layer.o demo.o tag.o cifar.o go.o batchnorm_layer.o art.o region_layer.o reorg_layer.o reorg_old_layer.o super.o voxel.o tree.o yolo_layer.o gaussian_yolo_layer.o upsample_layer.o lstm_layer.o conv_lstm_layer.o scale_channels_layer.o sam_layer.o
ifeq ($(GPU), 1)
LDFLAGS+= -lstdc++
OBJ+=convolutional_kernels.o activation_kernels.o im2col_kernels.o col2im_kernels.o blas_kernels.o crop_layer_kernels.o dropout_layer_kernels.o maxpool_layer_kernels.o network_kernels.o avgpool_layer_kernels.o
endif

OBJS = $(addprefix $(OBJDIR), $(OBJ))
DEPS = $(wildcard src/*.h) Makefile include/darknet.h

all: $(OBJDIR) backup results setchmod $(EXEC) $(LIBNAMESO) $(APPNAMESO)

ifeq ($(LIBSO), 1)
CFLAGS+= -fPIC

$(LIBNAMESO): $(OBJDIR) $(OBJS) include/yolo_v2_class.hpp src/yolo_v2_class.cpp
    $(CPP) -shared -std=c++11 -fvisibility=hidden -DLIB_EXPORTS $(COMMON) $(CFLAGS) $(OBJS) src/yolo_v2_class.cpp -o $@ $(LDFLAGS)

$(APPNAMESO): $(LIBNAMESO) include/yolo_v2_class.hpp src/yolo_console_dll.cpp
    $(CPP) -std=c++11 $(COMMON) $(CFLAGS) -o $@ src/yolo_console_dll.cpp $(LDFLAGS) -L ./ -l:$(LIBNAMESO)
endif

$(EXEC): $(OBJS)
    $(CPP) -std=c++11 $(COMMON) $(CFLAGS) $^ -o $@ $(LDFLAGS)

$(OBJDIR)%.o: %.c $(DEPS)
    $(CC) $(COMMON) $(CFLAGS) -c $< -o $@

$(OBJDIR)%.o: %.cpp $(DEPS)
    $(CPP) -std=c++11 $(COMMON) $(CFLAGS) -c $< -o $@

$(OBJDIR)%.o: %.cu $(DEPS)
    $(NVCC) $(ARCH) $(COMMON) --compiler-options "$(CFLAGS)" -c $< -o $@

$(OBJDIR):
    mkdir -p $(OBJDIR)
backup:
    mkdir -p backup
results:
    mkdir -p results
setchmod:
    chmod +x *.sh

.PHONY: clean

clean:
    rm -rf $(OBJS) $(EXEC) $(LIBNAMESO) $(APPNAMESO)



  • 写回答

1条回答 默认 最新

  • 檀越@新空间 2026-02-04 09:20
    关注

    上午好☀️☀️☀️️
    本答案参考通义千问

    在编译 YOLOv3 生成 marknet.exe 时遇到 CUDA 相关错误,通常是由于 CUDA 工具包未正确安装、路径配置不正确、或者编译器版本不兼容 导致的。以下是详细的解决方案和问题排查步骤。


    1. 确认 CUDA 安装和环境变量

    重点检查项:

    • CUDA 是否已正确安装?
    • CUDA 的路径是否与 Makefile 中的 CUDA_PATH 一致?
    • 系统环境变量中是否包含 CUDA 的 bin 路径?

    解决步骤:

    步骤一:验证 CUDA 安装

    在命令行中运行以下命令:

    nvcc --version
    

    如果输出类似下面的内容,说明 CUDA 已正确安装:

    nvcc: NVIDIA (R) Cuda compiler driver
    Copyright (c) 2005-2023 NVIDIA Corporation
    Built on Sun_Feb_12_19:46:28_CST_2023
    Cuda compilation tools, release 11.7, V11.7.99
    

    如果没有输出或报错,请重新安装 CUDA。

    步骤二:确认 CUDA_PATH 正确

    根据你的 Makefile 配置:

    CUDA_PATH=/cygdrive/c/Program\ Files/NVIDIA\ GPU\ Computing\ Toolkit/CUDA/v10.2
    

    请确保该路径下确实存在 bin/nvcc.exe 文件。否则,修改为正确的 CUDA 版本路径(例如 /cygdrive/c/Program\ Files/NVIDIA\ GPU\ Computing\ Toolkit/CUDA/v11.7)。

    步骤三:设置环境变量

    在 Windows 中,将 CUDA 的 bin 目录添加到系统环境变量 PATH 中:

    • C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\bin

    2. 检查 Makefile 中的 CUDA 和 CUDNN 设置

    重点检查项:

    • CUDA=1CUDNN=1 是否启用?
    • ARCH 中的计算能力是否与你的 GPU 兼容?

    修改后的 Makefile 示例:

    GPU=1
    CUDA=1
    CUDNN=1
    CUDNN_HALF=0
    OPENCV=1
    AVX=0
    OPENMP=0
    LIBSO=0
    ZED_CAMERA=0
    ZED_CAMERA_v2_8=0
    
    # 设置 OpenCV 路径
    OPENCV_PATH=/cygdrive/d/opencv3.4.00/opencv
    
    # CUDA 路径
    CUDA_PATH=/cygdrive/c/Program\ Files/NVIDIA\ GPU\ Computing\ Toolkit/CUDA/v11.7
    
    # 设置支持的 GPU 计算能力
    ARCH= -gencode arch=compute_52,code=sm_52 \
          -gencode arch=compute_61,code=sm_61 \
          -gencode arch=compute_70,code=sm_70 \
          -gencode arch=compute_75,code=sm_75 \
          -gencode arch=compute_80,code=sm_80
    

    注意: 如果你使用的是较新的 GPU(如 RTX 3090),应确保 ARCH 中包含了对应的计算能力(如 compute_80)。


    3. 检查 C++ 编译器是否兼容

    重点检查项:

    • 是否使用了 Cygwin 或 MSYS 的 GCC/G++ 编译器?
    • 编译器版本是否与 CUDA 兼容?

    解决步骤:

    步骤一:确保使用正确的编译器

    Makefile 中定义了:

    ifeq ($(USE_CPP), 1)
    CC=x86_64-pc-cygwin-g++
    else
    CC=x86_64-pc-cygwin-gcc
    endif
    

    确保你使用的编译器是 GCC 或 G++,并且与 CUDA 版本兼容。

    步骤二:升级编译器

    如果你使用的是旧版的 MinGW 或 Cygwin,建议升级到最新版本,以确保兼容性。


    4. 检查 OpenCV 库路径和依赖

    重点检查项:

    • OpenCV 的路径是否正确?
    • 是否链接了正确的 OpenCV 库?

    修改后的 OpenCV 配置示例:

    ifeq ($(OPENCV), 1)
    COMMON+= -DOPENCV
    CFLAGS+= -DOPENCV 
    COMMON+= -I$(OPENCV_PATH)/build/include
    COMMON+= -I$(OPENCV_PATH)/build/include/opencv
    COMMON+= -I$(OPENCV_PATH)/build/include/opencv2
    LDFLAGS+= -L$(OPENCV_PATH)/build/x64/vc15/lib
    LDFLAGS+= -L$(OPENCV_PATH)/build/x64/vc15/bin
    LDFLAGS+= -lopencv_world450  # 注意:OpenCV 4.5.0 的库名可能不同
    

    注意: OpenCV 的库文件名称会随着版本变化而改变,例如 opencv_world450opencv_core450 等。


    5. 清理并重新编译

    步骤一:清理之前的编译结果

    make clean
    

    步骤二:重新编译

    make
    

    如果仍然报错,请提供完整的错误信息,以便进一步分析。


    6. 常见错误及解决方案

    | 错误类型 | 解决方案 | |----------|----------| | nvcc not found | 确保 CUDA_PATH 正确,并将 bin 添加到 PATH | | undefined reference to cuDNN functions | 确保 CUDNN=1 并且 cuDNN 库路径正确 | | CUDA version mismatch | 确保 CUDA 版本与项目要求匹配 | | No such file or directory | 检查所有路径是否正确,尤其是 OPENCV_PATHCUDA_PATH |


    7. 总结

    1. 确认 CUDA 已正确安装并配置好环境变量。
    2. 确保 Makefile 中的 CUDA_PATHARCH 与你的 GPU 兼容。
    3. 检查 OpenCV 的路径和库文件是否正确。
    4. 使用正确的编译器并确保其版本兼容。
    5. 清理并重新编译项目。

    如果你能提供具体的错误信息,我可以帮助你更精确地定位问题。

    评论

报告相同问题?

问题事件

  • 创建了问题 2月4日