Hugging Face载入模型双卡训练报错

模型载入代码如下:

device = torch.device("cuda:0")
model6 = UperNetForSemanticSegmentation.from_pretrained("openmmlab/upernet-convnext-tiny",
                                                       ignore_mismatched_sizes=True)  # /upernet-swin-large,upernet-convnext-tiny
model6 = nn.DataParallel(model6, device_ids = [0, 1])
model6 = model6.to(device)
x2 = torch.randn(4, 3, 256,256).to(device)
print(model6(x2).shape)

报错:

RuntimeError: Expected tensor for argument #1 'input' to have the same device as
tensor for argument #2 'weight'; but device 1 does not equal 0 (while checking 
arguments for cudnn_convolution)

请问如何解决?

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
TechLead KrisChang 人工智能领域优质创作者 2023-07-28 14:28
关注
模型的输入数据和模型权重必须在同一设备上。

代码里模型移动到了GPU（device 0）上，执行 model6(x2) 时，输入数据 x2 却没有明确地分配到某一个GPU上。

试试使用 nn.DataParallel 的 forward() 方法来解决这个问题。将 model6(x2) 更改为 model6.module.forward(x2)，看看能否解决问题。这样会确保你的输入数据被分配到所有的GPU上。

device = torch.device("cuda:0") model6 = UperNetForSemanticSegmentation.from_pretrained("openmmlab/upernet-convnext-tiny", ignore_mismatched_sizes=True) # /upernet-swin-large,upernet-convnext-tiny model6 = nn.DataParallel(model6, device_ids=[0, 1]) model6 = model6.to(device) x2 = torch.randn(4, 3, 256, 256).to(device) print(model6.module.forward(x2).shape)
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Hugging Face下载NLP模型出错人工智能自然语言处理
2022-07-21 21:48

回答 1 已采纳用管理员模式运行 cmd 或者 powershell，然后再运行 jupyter 试试。或者开启开发者模式：https://consumer.huawei.com/en/support/conten
transfomer预训练模型每次加载后结果不同 bert pytorch 人工智能
2023-02-22 13:07

回答 2 已采纳 Huggingface 提供的预训练模型 bert-base-uncased 只包含 BertModel 的权重，不包括线性层 + 激活函数的权重。它的线性层 + 激活函数的权重是随机的，所以你的3次
怎么加载从huggingface拉下来的模型代码 pytorch 深度学习自然语言处理
2022-02-24 14:02

回答 2 已采纳首先huggingface上的预训练模型都是有示例代码的，博主贴的四行代码的中的前两行会检查你本地有没有XLNet这个模型，若没有的话就会从huggingface上下载相应的模型到一个指定的目录下去，
从Hugging Face上手动下载并加载预训练模型
2023-11-21 22:13

@ZyuanZhang的博客从 Hugging Face 上手动下载并加载预训练模型
OSError: [E941] Can't find model 'en'. It looks like you're trying to load a model from a shortcut nlp python 有问必答自然语言处理
2022-04-03 23:00

回答 2 已采纳可参考一下这里的解决方法：https://blog.csdn.net/sinat_36226553/article/details/110819567
transformers python word2vec 深度学习
2021-06-25 19:48

回答 1 已采纳肯定不是一回事啊，pytorch的transformer是处理图像的，huggingface的transformers主要是用来做NLP任务的，可以去csdn了解一下两者具体的区别，至于该用哪个取决你
从Imgur API检索图像 php
2015-01-15 23:14

回答 1 已采纳 It's a GalleryImage object, and all of the fields are private. So you have to use the getters to a
使用Docker Desktop在hugging face上pull模型报错问题
2023-04-06 09:54

Drmon.的博客打开container文档参考：https://docs.docker.com/desktop/containerd/某个部分加载到一半卡住 Extracting。勾选以启用container功能。
Hugging face预训练模型下载和使用
2022-07-26 10:44

☼Brilliant的博客 Hugging face预训练模型下载和使用
Hugging Face——MLM预训练掩码语言模型方法
2022-10-29 21:43

Charon_HN的博客 Hugging Face--MLM预训练掩码语言模型方法
Server - 使用网盘快速下载 Hugging Face 大模型
2023-06-20 15:32

SpikeKing的博客 Hugging Face 的核心产品是 Transformers 库，一个开源的 Python 库，包含了数千个预训练的 NLP 模型，涵盖了文本分类、问答、文本生成、情感分析等多个任务。Huggingface 还提供了 Datasets 库，是一个开源的数据集...
Hugging Face模型下载方法小结
2024-03-31 03:14

Maxcu的博客 Hugging Face模型快速下载方法总结
Transformers源码解析/Hugging Face实战/NLP实战//预训练模型/分词器
2023-07-12 09:58

你只需要知道，到了今天在NLP领域的所有任务，都可以用Transformer结合Hugging Face去玩就行了。 2012年的word2vec到现在除了科研机构，已经完全不需要使用了。绝大多数的算法工程师和科研人员都没有机会去参与词...
Hugging Face Transformers模型如何使用
2023-03-01 19:42

openwin_top的博客具体来说，输出张量的值是一个数字，表示模型预测的文本类别，你可以根据你的具体任务和模型设置不同的类别标签。如果你的任务是二分类任务，那么输出值为0表示负类，输出值为1表示正类。接着，我们将输入文本编码为...
如何在Hugging Face 下载模型
2022-07-06 16:21

夫子耶的博客如何在Hugging Face 下载模型
Hugging Face 3000+NLP预训练模型库整理分享
2022-11-12 17:50

lqfarmer的博客在自然语言处理（NLP）领域中，使用语言模型预训练方法在多项NLP任务上都获得了不错的提升，广泛受到了各界的关注。在bert之前，将预训练的embedding应用到下游任务的方式大致可以分为2种，一种是feature-based，...
Hugging Face——大规模预训练模型下载
2021-07-16 01:52

GeekZW的博客本文主要记录如何在huggingface官网上下载模型，并加载。重点是前者。 ...使用Hugging Face管道轻松应用NLP预训练模型 1、安装git-lfs Git LFS 是 Github 开发的一个 Git 的扩展，用于实现 Git
使用Hugging Face管道轻松应用NLP预训练模型
2021-07-14 18:39

javastart的博客作者|Robin van Merle 编译|VK 来源|Towards Data Science ...最近，BERT模型在语言处理领域得到了广泛的应用，因为它能够将最先进的性能与计算能力结合起来。在本文中，我将向你展示如何使用Hugging F..
下载Hugging Face预训练模型
2022-10-26 09:42

WGS.的博客下载huggingface预训练模型
Hugging Face发布diffuser模型AI绘画库初尝鲜！
2022-08-13 12:29

ShowMeAI的博客本文讲解 Hugging Face 发布的专注于 diffuser 模型的开源库，仅仅通过几行代码就开始生成自己的艺术作画，并对比相同文本提示下各种商业产品生成的结果。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 8月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月28日

悬赏问题

¥15 AT89C51控制8位八段数码管显示时钟。
¥15 真我手机蓝牙传输进度消息被关闭了，怎么打开？(关键词-消息通知)
¥15 下图接收小电路，谁知道原理
¥15 装 pytorch 的时候出了好多问题，遇到这种情况怎么处理？
¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
¥15 手机接入宽带网线，如何释放宽带全部速度
¥30 关于#r语言#的问题：如何对R语言中mfgarch包中构建的garch-midas模型进行样本内长期波动率预测和样本外长期波动率预测
¥15 ETLCloud 处理json多层级问题
¥15 matlab中使用gurobi时报错
¥15 这个主板怎么能扩出一两个sata口

Hugging Face载入模型双卡训练报错

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新