Qwen2.5-7B的NER测评代码，跑到train这里卡住不动了是什么原因？

在运行这里，AI修改的代码跑卡在这里不动了，是哪里错了吗，我看不出来。是Qwen2.5-7B有4个model，我导在同一个的问题，还是哪里出现问题了?求大家帮忙

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
小ᶻ☡꙳ᵃⁱᵍᶜ꙳ 优质创作者: 人工智能技术领域 2024-10-29 15:25
关注
回答引用自GPT-4o，由博主小ᶻZ࿆编写，若还有疑问可评论或留言：

在运行Qwen2.5-7B模型的NER测评代码时，训练阶段卡住不动可能由以下几个原因引起：

1. 模型加载问题

如果一次性加载4个模型，可能会导致内存不足或计算资源被占满。建议逐步加载模型并检查资源占用情况：

# 检查系统资源使用 import os import psutil # 查看CPU和内存使用情况 print("CPU 使用率:", psutil.cpu_percent()) print("内存使用情况:", psutil.virtual_memory())

2. 数据加载与处理问题

检查数据加载过程，确认数据正确加载且无数据瓶颈。大数据集可能需要更高效的批处理方案。

3. 调整batch size

如果是显存不足导致的卡顿，可以尝试减小batch size。

# 示例：设置较小的batch size batch_size = 4

4. 日志与调试

使用日志记录每个步骤，观察程序停滞的位置：

import logging logging.basicConfig(level=logging.INFO) logging.info("开始加载数据") # 数据加载代码 logging.info("数据加载完成") # 其他代码
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Qwen2大模型微调入门实战-命名实体识别（NER）任务
2024-07-08 06:30

AGI小明同学的博客大模型指令微调（Instruction Tuning）是一种针对大型预训练语言模型的微调技术，其核心...在实际应用中，我的理解是，指令微调更多把LLM看作一个更智能、更强大的传统NLP模型（比如Bert），来实现更高精度的NLP任务。
Qwen3-8B命名实体识别（NER）任务微调实战
2025-11-28 02:27

丛越的博客本文介绍如何使用轻量级大模型Qwen3-8B在中文场景下进行命名实体识别（NER）任务的微调。通过生成式建模与指令微调，结合LoRA等高效微调技术，实现在单卡消费级GPU上高效训练与部署，特别适合中文长文本、低资源场景...
Qwen3 - 0.6B与Bert文本分类实验：深度见解与性能剖析
2025-05-19 09:20

X.Cristiano的博客本文对比了Qwen3-0.6B和Bert在Ag_news数据集上的文本分类性能。Qwen3-0.6B采用线性层分类时F1值达0.949，优于Bert的0.945；而其SFT分类方法F1值为0.941。推理效率方面，Bert的RPS为60.3，Qwen3-0.6B线性层分类为38.1...
通义千问2.5-0.5B微调入门：云端GPU免运维，专注模型训练
2026-01-16 03:13

starlightowl56的博客本文介绍了基于星图GPU平台自动化部署通义千问2.5-0.5B-Instruct镜像的完整流程，实现免运维的云端模型微调。用户可快速启动GPU实例，在预置环境中进行LoRA微调，典型应用于医疗问答、法律咨询等垂直领域AI开发，...
Llama-Factory能否训练命名实体识别模型？NER任务适配良好
2025-12-12 13:57

元楼的博客 Llama-Factory支持基于大模型的命名实体识别（NER）任务，通过LoRA微调和分词对齐机制，在小样本专业领域如金融、医疗中显著提升F1分数，提供从数据处理到部署的全流程支持，适配指令学习与传统序列标注两种范式。
周报、日报、年终总结：哪款AI最会“职场话术”？
2026-04-11 17:10

云博士的AI课堂的博客周报、日报、年终总结：哪款AI最会“职场话术”？
GLM4大模型微调入门实战-命名实体识别（NER）任务
2024-06-21 17:18

TouristLin的博客基于GLM4-7B大模型，实现命名实体识别（NER）任务，是学习LLM微调非常好的入门任务之一，本文将提供完整的代码、模型、数据以及SwanLab实验过程，来帮助你学习如何进行微调。
文献汇总｜AI生成图像检测相关工作汇总（2018-2025）
2024-11-28 10:47

_Meilinger_的博客 – AIGI检测相关博客如下：文献汇总｜AI生成图像检测与溯源相关工作（2026）论文介绍｜《人工智能生成图像检测技术综述》论文研读｜AI生成图像检测发展历程及研究现状针对AIGC检测的鲁棒性测试——常见攻击手段...
Qwen游戏AI NPC智能对话沉浸式体验生成应用
2025-09-26 04:28

高杉峻的博客本文系统阐述了基于Qwen大模型的AI NPC设计原理与实现架构，涵盖语言模型机制、角色人格化建模、情感计算、对话系统集成及用户体验评估，提出融合心理学与工程优化的沉浸式交互方案。
人工智能业务开发流程详解
2026-01-10 06:44

wespten的博客核心问题：AI 能解决什么问题？是否值得做？明确目标将业务需求转化为技术指标。例子：不要说 “提高销量”，要说 “构建一个推荐系统，使点击率（CTR）提升 5%”。技术评估这是一个分类、回归、聚类还是生成任务？...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 9月16日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 9月8日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月29日

Qwen2.5-7B的NER测评代码，跑到train这里卡住不动了是什么原因？

1条回答 默认 最新

1. 模型加载问题

2. 数据加载与处理问题

3. 调整batch size

4. 日志与调试

问题事件

1条回答默认最新