咨询Lora训练参数

我在训练Lora模型时，当设置的batch_size大于2时(3或4)，训练的过程会非常慢，系统预估训练完成要两个小时。此时GPU使用率100%，而且风扇不转，总感觉像是GPU不够用了。
当设置的batch_size为2时，训练就很快，系统预估训练完成要20到30分钟。此时此时GPU使用率浮动在80%到100%之间，而且GPU风扇狂转，这时候应该是GPU够用了。

但是网上大部分资料都说提高batch_size会加快训练速度么？为什么我设置大了反而导致速度异常缓慢呢？
我的电脑配置
GPU：技嘉3080, 10G显存
内存：32G

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 全栈领域优质创作者 2023-09-17 20:04
关注
引用皆我百晓生小程序回复内容作答：
你可以使用以下Python代码实现此功能：

def calculate_difference(num): odd_sum = 0 # 奇数和 even_sum = 0 # 偶数和 for digit in num: if int(digit) % 2 == 0: even_sum += int(digit) else: odd_sum += int(digit) return odd_sum - even_sum # 输入车牌数量 n = int(input()) # 逐行处理车牌 for _ in range(n): plate = input() difference = calculate_difference(plate) print(difference)

这个代码定义了一个名为calculate_difference的函数，该函数接受一个字符串类型的车牌号作为参数，并计算奇数和减去偶数和的差值。

然后，在主程序中，首先输入车牌数量n。接下来，使用一个循环来逐行读取车牌号并计算差值，并将结果打印出来。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

为什么tesla V100的训练速度比2080慢好多深度学习
2021-05-30 11:13

回答 1 已采纳打印下gpu占用吧，看看是不是真的用gpu加速了
Lora添加Flash编程算法的时候没有想添加的选项 iot stm32 单片机
2023-03-21 11:02

回答 1 已采纳不知道你这个问题是否已经解决, 如果还没有解决的话: 这个问题的回答你可以参考下: https://ask.csdn.net/questions/746446你也可以参考下这篇文章：最近Flash页面
kaggle云端部署的stable diffusion运行时Lora模块没法儿用 python
2023-03-27 12:09

回答 2 已采纳看起来是lora.py文件中的lora_apply_weights函数出了问题，函数中使用了“|”操作符，但是“|”操作符不支持type类型，所以报错了。可以尝试把“|”操作符改成“or”，看看是否可
LLM - Baichuan7B Lora 训练详解
2023-07-12 15:27

BIT_666的博客 Baichuan7B lora 微调训练流程详解。
lora的J link 下载器选择好usb后Setting 后就一直未响应 iot 后端嵌入式硬件
2023-03-20 16:41

回答 3 已采纳应该是未安装jlink的驱动，安装jlink的驱动，能识别到jlink的！
手持振弦式传感器VH501TC采集仪支持Lora网络吗？嵌入式硬件硬件工程
2022-05-24 09:23

回答 2 已采纳支持lora，稳定好用。
ZeroDivisionError: division by zero python
2022-03-02 20:29

回答 1 已采纳在除数组成的lst中，最后一个元素为0，当使用到最后一个元素0作为除数时，会提示ZeroDivisionError: division by zero你可以加上这个代码：
Stable Diffusion Lora模型训练详细教程
2023-04-22 16:11

AI算法-图哥的博客 stable diffusion lora模型训练
线程1发出信号，线程2进行判断（判断有没有收到包），然后解码（10进制转16进制含浮点数），然后解码（10进制转16进制含浮点数）如何解决？需要代码 python sql 数据库有问必答
2023-03-18 21:01

回答 1 已采纳 https://blog.csdn.net/weixin_55712138/article/details/122400683
无线传感器节点NLM300通讯距离有多远？网络
2022-05-24 14:28

回答 1 已采纳无线无源,通讯距离又长？这么好的产品
如何将2字节温度数据转为单精度格式发给串口屏显示 c语言嵌入式硬件开发语言有问必答
2021-09-13 15:20

回答 4 已采纳 c语言可以定义结构体，使用关键字unionstruct s{byte[] b;float f;}union当你给f赋值，b自动成为4字节float类型，反之亦然
[AIGC] Stable Diffusion LoRA 训练 – 专业级 GPU 分析测评
2024-01-05 14:02

Unity尧明的博客作为从头开始训练新模型或微调现有模型所有参数的替代方案，LoRA 被引入。LoRA 是“Low-Rank Adaptation”的缩写，是一种使用更小的参数集微调模型的方法，并且不会从根本上改变底层模型。与传统的微调相比，这只需...
树莓派连接接口为rs485的设备时能直接连吗，还是需要usb转rs485的线才行嵌入式硬件
2022-02-20 22:45

回答 1 已采纳用TTL转485的转换芯片就可以了，树莓派有TTL串口
手把手教你训练自己的Lora
2023-08-26 15:25

leo0308的博客本文教你手把手训练自己的Lora模型，炼制的是Stable Diffusion的Lora模型。
lora训练
2024-04-29 10:20

Everglowwwwww的博客被标注的tag不会被LoRA模型记住，训练中LoRA会把没被标注的tag当做默认元素，例如一个人戴眼镜，如果不把眼镜tag删掉，那么模型生成这个人的时候就会默认戴眼镜，即眼镜和这个人物已绑定。另外，将与训练目标相关的...
Stable Diffusion XL训练LoRA
2023-08-26 22:40

whaosoft143的博客但是由于训练数据集中全是三次元图片，所以二次元底模型+三次元LoRA生成的图片并没有完全的二次元化。【4】使用不同提示词改变图片风格最后，我们再尝试通过有添加提示词prompt，来改变生成的猫女图片的风格。 ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月17日

悬赏问题

¥15 使用ue5插件narrative时如何切换关卡也保存叙事任务记录
¥20 软件测试决策法疑问求解答
¥15 win11 23H2删除推荐的项目，支持注册表等
¥15 matlab 用yalmip搭建模型，cplex求解，线性化处理的方法
¥15 qt6.6.3 基于百度云的语音识别不会改
¥15 关于#目标检测#的问题：大概就是类似后台自动检测某下架商品的库存，在他监测到该商品上架并且可以购买的瞬间点击立即购买下单
¥15 神经网络怎么把隐含层变量融合到损失函数中？
¥15 lingo18勾选global solver求解使用的算法
¥15 全部备份安卓app数据包括密码，可以复制到另一手机上运行
¥20 测距传感器数据手册i2c

咨询Lora训练参数

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新