微调Qwen数据准备

微调Qwen1.5-7B-Chat数据格式

博主，您好。我非常喜欢您的博客，目前我微调Qwen-7B遇到了一些困难，如果您能解决我的问题，感激不尽。

项目背景：
我的项目是先将通话内容转换为文字，再对文字做三个任务：摘要提取，关键词提取，代办事项提取。

问题：
如果我需要对Qwen1.5B做微调，我是需要将这三个任务放在一条数据中，还是将三个任务分开来做比较好？
数据集的格式是什么呢？
数据大概多少条比较合适呢？

提示词如下：
prompt = f"""
任务要求：

根据所提供的对话内容，生成对话摘要。
列出对话中提及的所有待办事宜。
从对话中提取出三个最关键的关键词。

输出格式：
请按照以下JSON格式提交您的答案：

{{
"对话摘要": "对话的简短概述...",
"待办事宜": ["任务1", "任务2", "任务3"],
"关键词": ["关键词1", "关键词2", "关键词3"]
}}

JSON格式说明：

"对话摘要"（str）：对对话内容的简短总结。
"待办事宜"（list[str]）：列出对话中需要完成的任务。
"关键词"（list[str]）：从对话中提炼出的三个核心词汇。

示例：

{{
"对话摘要": "本次对话涉及了项目进展的讨论以及安排下周的会议。",
"待办事宜": ["提交项目报告", "准备会议资料", "收集客户反馈"],
"关键词": ["项目进展", "会议安排", "客户反馈"]
}}

请根据以上要求处理下面的对话：
{text}
"""

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

码农阿豪@新空间代码工作室 Java领域优质创作者 2024-04-07 18:28

关注

让阿豪来帮你解答，本回答参考chatgpt3.5编写提供，如果还有疑问可以评论或留言

首先，针对问题，我建议将三个任务分开来做比较好，这样更加清晰明了。每条数据应该包括对话内容、对话摘要、待办事宜和关键词四个部分。数据集的格式应该是一个列表，每个元素都是一个字典，包括以上四个部分。至于数据量，建议不少于1000条，以保证模型的稳定性和准确性。下面是一份简单的代码示例（使用了spaCy和nlpaug库）：

import spacy
import nlpaug.augmenter.word as naw
nlp = spacy.load("en_core_web_sm") # 加载英文模型
def generate_summary(text):
    """
    生成对话摘要
    Args:
    text: str 对话内容
    Returns:
    str 对话摘要
    """
    # 简单的摘要生成
    doc = nlp(text)
    sents = [sent.text for sent in doc.sents] # 按句划分
    return sents[0] # 取第一句作为摘要
def extract_tasks(text):
    """
    提取待办事项
    Args:
    text: str 对话内容
    Returns:
    list[str] 待办事项列表
    """
    # 使用nlpaug进行数据增强
    aug = naw.ContextualWordEmbsAug(model_path='bert-base-uncased', action="insert")
    augmented_text = aug.augment(text)
    # 这里简单地返回增强后的内容中的单词
    return [token.text for token in nlp(augmented_text) if token.pos_ == "NOUN"]
def extract_keywords(text, top_k=3):
    """
    提取关键词
    Args:
    text: str 对话内容
    top_k: int 希望返回的关键词数量，默认为3
    Returns:
    list[str] 关键词列表
    """
    # 使用spaCy的TextRank算法提取关键词
    doc = nlp(text)
    ranked_phrases = doc._.phrases
    return [phrase.text for phrase in ranked_phrases[:top_k]]
# 模拟一部分数据
data = [
    {
        "text": "今天谈了好几个项目的进展，客户的反馈也都很好，下周需要提交项目报告",
        "summary": "今天谈了好几个项目的进展，客户的反馈也都很好，下周需要提交项目报告",
        "tasks": ["项目报告"],
        "keywords": ["项目进展", "客户反馈", "下周"]
    },
    {
        "text": "明天的会议时间需要调整一下，另外还需要准备会议资料，检查一下客户的反馈",
        "summary": "明天的会议时间需要调整一下，另外还需要准备会议资料，检查一下客户的反馈",
        "tasks": ["会议资料", "客户反馈"],
        "keywords": ["会议时间", "调整", "检查"]
    }
]

报告相同问题？

关注问题

针对qwen微调模型进行数据预处理.zip
2024-03-02 22:00

在人工智能领域，数据预处理是项目实践中至关重要的一个步骤，特别是在使用像Qwen这样的微调模型时。Qwen模型可能是一个基于Transformer架构的语言模型，如BERT或GPT，经过特定任务的训练，以提高其在问答、对话或者...
llama_factory微调QWen1.5
2024-04-15 17:16

Kun Li的博客模型效果为了全面洞悉 Qwen1.5 的效果表现，我们对 Base 和 Chat 模型在一系列基础及扩展能力上进行了详尽评估，包括如语言理解、代码、推理等在内的基础能力，多语言能力，人类偏好对齐能力，智能体能力，检索增强...
LLM微调系列——Qwen微调教程
2024-02-04 16:36

趋吉避凶的博客作者在微调Qwen时遇到的一些坑以及一点经验作者在微调Qwen时遇到的一些坑以及一点经验。
Qwen2 -微调 Qwen2
2024-07-22 10:36

AI生成曾小健的博客各种参数（例如 r、target_modules、lora_alpha、lora_dropout、bias、use_gradient_...Qwen2 系列由 5 种尺寸的基础和指令调整模型组成：Qwen2–0.5B、Qwen2–1.5B、Qwen2–7B、Qwen2–57B-A14B 和 Qwen2–72B。
Qwen1.5大语言模型微调实践
2024-04-17 15:18

liguiyuan112的博客在人工智能领域，大语言模型（Large Language Model，LLM）的兴起和广泛应用，为自然语言处理（NLP）带来了前所未有的变革。Qwen1.5大语言模型作为其中的佼佼者，不仅拥有强大的语言生成和理解能力，而且能够通过...
【机器学习】QLoRA：基于PEFT亲手量化微调Qwen2大模型
2024-06-13 19:59

LDG_AGI的博客本文首先对量化和微调的原理进行剖析，接着以Qwen2-7B为例，基于QLoRA、PEFT一步一步带着大家微调自己的大模型，本文参考全网peft+qlora微调教程，一步一排坑，让大家在网络环境不允许的情况下，也能丝滑的开启大...
(附数据集)基于lora参数微调Qwen1.8chat模型的实战教程
2024-03-16 17:33

txhy2018的博客与全参数微调不同，LoRA和Q-LoRA的训练只需存储adapter部分的参数。使用LoRA训练后的模型，可以选择先合并并存储模型（LoRA支持合并，Q-LoRA不支持），再用常规方式读取你的新模型。一般会缓存到你的C盘或用户空间，...
【大模型】微调Qwen1.8B
2024-02-21 11:26

DonngZH的博客使用地址数据微调Qwen1.8B。Qwen提供了预构建的Docker镜像，在使用时获取镜像只需安装驱动、下载模型文件即可启动Demo、部署OpenAI API以及进行微调。获取方式：docker pull qwenllm/qwen:cu117。
在autodl平台使用llama-factory微调Qwen1.5-7B
2024-05-01 22:11

yidao0618的博客微调后将adapter和原来模型合并 CUDA_VISIBLE_DEVICES=0 python src/export_model.py \ --model_name_or_path qwen/Qwen-7B \ --adapter_name_or_path /root/autodl-tmp/checkpoints/llama_factory_demo/qwen/lora/...
【大语言模型+Lora微调】10条对话微调Qwen-7B-Chat并进行推理 (聊天助手)
2024-04-19 10:40

曾小蛙的博客基于qwen1.0 和lora微调,训练自己的对话机器人
LLama-Factory大模型训练框架，基于自己数据集微调qwen7B模型实战
2024-07-04 11:17

dream_home8407的博客一，项目简介 LLama-Factory，大模型训练框架，支持多种模型，多种训练方式，项目github地址：link 项目特色多种模型：LLaMA、LLaVA、Mistral、Mixtral-MoE、Qwen、Yi、Gemma、Baichuan、ChatGLM、Phi 等等。...
阿里qwen微调
2024-04-22 12:33

ShengFangZaiXiaMo的博客阿里qwen大模型微调
Qwen-7B微调实例
2023-08-23 11:28

Macropodus的博客阿里通义千问(Qwen-7B-Chat/Qwen-7B), 微调/LORA/推理。
Qwen-VL本地化部署及微调实践
2024-02-23 11:59

我在北国不背锅的博客 Qwen-VL本地化部署及微调实践创建虚拟环境模型部署下载模型文件下载项目代码安装python依赖环境修改web_demo_mm.py及openai_api.py的部分代码启动测试模型微调环境部署数据准备微调问题及解决方案创建...
Qwen2大语言模型微调、导出、部署实践
2024-06-16 12:58

liguiyuan112的博客上篇文章：我们介绍了Qwen1.5 大语言模型使用LLaMA-Factory 来微调，这篇文章我们介绍一下微调后模型的导出、部署。
Qwen指令微调示例（self training code）
2024-04-16 18:06

Young_Lb的博客自从chatgpt问世以来，人工智能领域的发展便进入了大模型时代。这些模型，如 GPT、Gimini、claude、llama、Qwen、baichuan等，已经在多个自然语言处理任务上设立了新的性能标准，并且展现出巨大的潜力。这些模型...
使用DPO微调大模型Qwen2详解
2024-06-10 13:13

淡水，的博客对应的数据集分别如下（均在huggingface）：单轮：lvwerra/stack-exchange-paired 多轮：trl-internal-testing/hh-rlhf-helpful-base-trl-style 通过DPO微调模型大概可以简单的分为两个步骤： 1、将数据处理成所需...
Qwen1.5微调
2024-04-23 11:45

要养家的程序猿的博客修改为单机单卡，重启容器，docker run -it --rm --gpus='"device=1"' -v /mnt/code/LLM_Service/:/workspace qwen:v1.0 bash。修改脚本，/workspace/qwen1.5_train/Qwen1.5/examples/sft/finetune.sh。由于工作上...
qwen-vl微调
2024-05-05 15:48

Kun Li的博客 lora在V100上显存不够，微调不起来，在a800上可以。用swift库可以在V100上微调Qwen-vl。直接pip install -r requirments.txt。注意gcc要升级到9.3。
微调Qwen2大语言模型加入领域知识
2024-07-10 16:46

dxwd320的博客在webui 界面训练好模型之后点击“Export”选项卡，然后，在“模型路径”中输入原始模型路径，然后在“检查点路径”中选择自己微调得到的 checkpoint路径，然后在“最大分块大小（GB）”中设置为4，同时设置一下导出...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月7日

悬赏问题

¥15 Unity 2022.3.34版本安卓打包apk失败，gradle配置问题，用的是mono2x
¥15 R语言中安装bibliometrix 后运行biblioshiny出现问题
¥20 关于#android#的问题：用开发助手发现找不到控件(autojs)
¥15 dir815漏洞反弹shell失败
¥15 支付宝小程序云函数登录获取user_id失败
¥50 python for 循环速度慢
¥15 CubeMX生成的代码用keil编译有报错
¥15 Stata链式中介效应代码修改
¥15 pip安装PyAV报错
¥15 latex投稿显示click download

微调Qwen数据准备

3条回答 默认 最新

问题事件

悬赏问题

3条回答默认最新