qwen-vl-caht多卡训练，报错 but found at least two devices, cuda:0 and cuda:1!

在win10上面部署了qwen-vl-chat,训练本地的数据时，提示错误

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 全栈领域优质创作者 2024-04-21 12:01
关注
引自免费微信小程序：皆我百晓生

根据你提供的错误信息，这个错误是因为你的PyTorch模型尝试在一个GPU（cuda:0）上执行操作，但同时又有一个张量在另一个GPU（cuda:1）上。为了确保所有运算都在同一个设备上进行，你需要将所有的输入数据移动到同一个GPU上。这里是一个解决这个问题的步骤：

确保你的模型被放在一个特定的GPU上。例如，如果你想要使用GPU 0，可以这样做：

import torch device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu") model.to(device)

在调用模型之前，确保你的输入数据（hidden_states 和 images）也被放在了同一设备上。这可以通过 .to(device) 函数完成：

hidden_states = hidden_states.to(device) images = images.to(device)

如果你是在使用DataLoader，那么你需要确保在加载数据时，数据就已经被放置在正确的设备上了。你可以在定义DataLoader时设置pin_memory=True和num_workers=0，这样可以帮助数据在读取后自动转移到正确设备：

dataloader = DataLoader(dataset, batch_size=batch_size, pin_memory=True, num_workers=0) for batch in dataloader: inputs = {key: val.to(device) for key, val in batch.items()} outputs = model(**inputs)

如果上述步骤仍然没有解决问题，检查你的代码中是否有其他部分可能将数据移动到了不同的GPU上。这可能涉及到其他库或自定义函数。

将这些更改应用到你的代码中，并重新运行训练。如果问题依然存在，你可能需要进一步检查你的模型结构、数据预处理过程以及任何自定义层或模块，以确定是否有其他地方可能触发了跨设备的操作。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

【LLM多模态】Qwen-VL模型架构和训练流程
2024-04-25 22:39

山顶夕景的博客 - 作用：作为Qwen-VL模型的基础组件，这个部分采用了一个大型语言模型，其初始权重来自于预训练的Qwen-7B模型。 - 来源：Qwen-VL的大型语言模型使用了来自Qwen-7B模型的预训练权重。视觉编码器（Visual Encoder）...
Qwen-VL 远程GPU服务器部署实战
2024-07-14 21:32

Qwen-VL 远程GPU服务器部署实战
【中文视觉语言模型+本地部署】23.08 阿里Qwen-VL：能对图片理解、定位物体、读取文字的视觉语言模型 (推理最低12G显存+)
2024-03-26 17:07

曾小蛙的博客 Qwen-VL-7B` 是阿里基于语言模型`Qwen-7B`(LLMs)，...> Qwen-VL-Chat = 大语言模型(Qwen-7B) + 视觉图片特征编码器（Openclip's `ViT-bigG`） + 位置感知视觉语言适配器（可训练Adapter）+`约15亿`训练数据+`多轮训练`
1张图片+3090显卡微调Qwen-VL视觉语言大模型（仅做演示、效果还需加大数据量）
2024-04-23 18:24

曾小蛙的博客一张图微调qwen-vl
Qwen-VL本地化部署及微调实践
2024-02-23 11:59

我在北国不背锅的博客，其中 (x1, y1) 和(x2, y2)分别对应左上角和右下角的坐标，并且被归一化到[0, 1000)的范围内. 检测框对应的文本描述也可以通过。，其中id表示对话中的第几张图片。"img_path"可以是本地的图片或网络地址。GCC版本较...
LLM - 使用 vLLM 部署 Qwen2-VL 多模态大模型 (配置 FlashAttention) 教程
2024-09-26 17:50

ElminsterAumar的博客 vLLM 用于大语言模型(LLM) 的推理和服务，具有多项优化技术，包括先进的服务吞吐量、高效的内存管理、连续批处理请求、优化 CUDA 内核以及支持量化技术，如GPTQ、AWQ等。FlashAttention 是先进的注意力机制优化工具...
【机器学习】阿里Qwen-VL：基于FastAPI私有化部署你的第一个AI多模态大模型
2024-06-17 23:47

LDG_AGI的博客本文首先在引言中强调了一下OpenAI兼容API的重要性，希望引起读者重视，其次介绍了Qwen-VL的原理与模型结构，最后简要讲了下FastAPI以及搭配组件，并基于FastAPI封装了OpenAI兼容API的Qwen-VL大模型服务端接口，并给...
langchain-chatchat在window上使用cpu运行Qwen-1-8B-Chat时遇到ERROR: object
2024-04-26 15:39

langchain-chatchat在window上使用cpu运行Qwen-1_8B-Chat时遇到ERROR: object of type ‘NoneType‘ has no len()，这个问题其实是因为"addmm_impl_cpu_" not implemented for 'Half’这个根本原因导致的，也就是cpu...
qwen-vl_pytorch大规模视觉语言模型
2024-07-11 06:00

技术瘾君子1573的博客 Qwen-VL 是阿里云研发的大规模视觉语言模型（Large Vision Language Model, LVLM）。Qwen-VL 可以以图像、文本、检测框作为输入，并以文本和检测框作为输出。
Qwen-VL：多功能视觉语言模型，能理解、能定位、能阅读等
2023-09-21 13:45

猴猴猪猪的博客摘要 1 引言 2 方法 2.1 模型结构 2.2 输入输出 3 训练 3.1 预训练 3.2 多任务预训练 3.3 监督finetune 4 评测 4.1 图像文本描述和视觉问答 4.2 面向文本的视觉问答 4.3 指代表达理解 4.4 视觉语言任务中的小样本...
Qwen-VL: 一种多功能的视觉-语言模型，用于理解、定位、文本阅读等
2024-08-12 17:53

&永恒的星河&的博客在这项工作中，介绍了 Qwen-VL 系列，一系列大规模的视觉-语言模型（LVLMs），旨在感知和理解文本与图像。
Qwen2-VL架构解读：Qwen2-VL: Enhancing Vision-Language Model’s Perceptionof the World at Any Resolution
2024-09-26 11:39

samoyan的博客此外，为了减少每个图像的视觉标记，在ViT之后使用了一个简单的MLP层，将相邻的2×2标记压缩成一个标记，并在压缩后的视觉标记的开头和结尾...在语言处理方面，我们选择了更强大的Qwen2（Yang等，2024）系列语言模型。
qwen-vl微调
2024-05-05 15:48

Kun Li的博客 lora在V100上显存不够，微调不起来，在a800上可以。用swift库可以在V100上微调Qwen-vl。直接pip install -r requirments.txt。注意gcc要升级到9.3。
AI多模态教程：Qwen-VL多模态大模型实践指南
2024-07-05 18:14

AIGCmagic社区的博客使用官方项目里提供的...提供finetune.py脚本和shell脚本的目的是为了简化用户在自有数据上微调预训练模型的过程，同时支持DeepSpeed和FSDP（Fully Sharded Data Parallel）两种优化技术，以提高训练效率和可扩展性。
LLM - Qwen-VL 视觉模型初体验
2024-05-22 13:45

BIT_666的博客 Qwen-VL 大模型视觉语言模型尝试。
通义千问Qwen-VL-Chat大模型本地训练（二）
2024-07-12 17:55

王八羔子有点甜.的博客人工智能大模型是一种能够利用大数据和神经网络来模拟人类思维和创造力的人工智能算法。它利用海量的数据和深度学习技术来理解、生成和预测新内容，通常情况下有数十亿...我使用的是通义千问Qwen-VL-Chat多模态模型。
实战千问2大模型第二天——Qwen2-VL-7B（多模态）的部署和测试
2024-09-10 17:57

学术菜鸟小晨的博客 2024年 8 月 30 日，通义千问团队今天对 Qwen-VL（视觉语言、Vision Language）模型进行更新，推出 Qwen2-VL。Qwen2-VL 的一项关键架构改进是实现了与上一代模型 Qwen-VL 不同，，从而确保模型输入与图像固有信息...
【xinference】（6）：在autodl上，使用xinference部署yi-vl-chat和qwen-vl-chat模型，可以使用openai-client调用成功，进行对比测试，各有特色
2024-02-06 21:34

fly-iot的博客使用xinference部署yi-vl-chat和qwen-vl-chat模型都可以运行成功，而且各有特色。qwen可以识别具体汽车品牌，但是有些新车是错误的。yi识别比较保守。
实战千问2大模型第三天——Qwen2-VL-7B（多模态）视频检测和批处理代码测试
2024-09-11 15:02

学术菜鸟小晨的博客 1、能读懂不同分辨率和不同长宽比的图片：Qwen2-VL在多个视觉理解基准测试中取得了全球领先的表现，其中包括但不限于考察数学推理能力的MathVista、考察文档图像理解能力的DocVQA、考察真实世界空间理解能力的...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月21日

悬赏问题

¥20 指导如何跑通以下两个Github代码
¥15 大家知道这个后备文件怎么删吗，为啥这些文件我只看到一份，没有后备呀
¥15 C++为什么这个代码没报错运行不出来啊
¥15 一道ban了很多东西的pyjail题
¥15 关于#r语言#的问题：如何将生成的四幅图排在一起，且对变量的赋值进行更改，让组合的图漂亮、美观@（相关搜索：森林图）
¥15 C++识别堆叠物体异常
¥15 微软硬件驱动认证账号申请
¥15 GPT写作提示指令词
¥20 根据动态演化博弈支付矩阵完成复制动态方程求解和演化相图分析等
¥15 华为超融合部署环境下RedHat虚拟机分区扩容问题

qwen-vl-caht多卡训练，报错 but found at least two devices, cuda:0 and cuda:1!

5条回答 默认 最新

问题事件

悬赏问题

5条回答默认最新