为什么现在的文本处理只需要标注少量的数据

虽然大模型里面训练了很多的数据，但是对于bert一类的语言模型识别貌似只需要训练少部分就可以达到理想的效果这是为什么呢？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2023-11-19 02:07
关注
【相关推荐】

你可以看下这个问题的回答https://ask.csdn.net/questions/7396464
这篇博客也不错, 你可以看下文本分类还停留在BERT？对偶对比学习框架也太强了
除此之外, 这篇博客: 基于bert预训练模型和半指针半标注结构的三元组抽取中的 模型结构 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:

模型很简单，直接使用bert预训练模型，在bert上进行fine-tune.
主要有两步，即先预测subject,再同时预测object和predictate：
1）先采用bert预训练模型对输入数据，即数据示例中的"text", 进行embedding,然后使用“半指针-半标注”的方式预测对应的subject的首、尾位置；
2）再把预测的subject对应的embedding与bert输出的hidden-states 进行拼接，继续预测predicate和object；对于每一种predicate，都构建一个“半指针-半标注”结构来预测对应的object的首、尾位置，这样就同时把object、predicate都预测出来了。

如上是模型结构示意图。输入句子是：“如何演好自己的角色请读《喜剧之王》周星驰崛起…”，则抽取出来的三元组是“（喜剧之王，主演，周星驰）”。

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

人工智能大模型实战应用：数据处理的核心引擎.md
2025-06-23 17:02

在当今人工智能技术日新月异的发展中，大模型的构建与应用逐渐成为研究与实践的焦点。...随着人工智能技术的不断发展，数据处理作为核心引擎的作用将越来越突出，成为推动人工智能领域前进的关键力量。
一款用于创建语言模型预训练数据集、支持文本与图像数据集一键批量处理的工具
2025-08-20 15:33

在人工智能领域，语言模型的预训练数据集构建是一个关键步骤。预训练语言模型能够理解自然语言的深层次结构，为各种语言理解和生成任务提供基础。随着机器学习技术的发展，构建高质量的预训练数据集变得越来越重要。...
告别重复劳动：5款AI数据标注工具实测，效率提升背后的技术逻辑
2025-08-13 08:18

知远漫谈的博客实测5款AI标注工具后，最深的感受是：AI标注的终极价值不是“消灭人工标注”，而是让人从机械重复的劳动中解放，聚焦于更有价值的工作——定义标注规则、处理复杂场景、优化标注质量。数据显示，采用AI标注工具后，...
AI训练师秘籍：数据标注
2025-03-18 17:50

大模型入门教程的博客 1.人工智能训练师职业介绍2.人工智能发展历程1）符号主义：数理逻辑。2）行为主义：控制论。...目前，语音合成、语音识别、自然语言处理、图像处理、3D 点云、多模态数据处理等技术在人工智能中较为活跃。
人工智能之数据标注工程师
2025-03-03 21:01

智泊AI—大模型小王的博客 1.人工智能训练师职业介绍2.人工智能发展历程1）符号主义：数理逻辑。2）行为主义：控制论。...目前，语音合成、语音识别、自然语言处理、图像处理、3D 点云、多模态数据处理等技术在人工智能中较为活跃。
人工智能训练师之数据标注
2024-07-19 10:37

鸡腿爱学习的博客 1.人工智能训练师职业介绍2.人工智能发展历程1）符号主义：数理逻辑。2）行为主义：控制论。...目前，语音合成、语音识别、自然语言处理、图像处理、3D 点云、多模态数据处理等技术在人工智能中较为活跃。
从人类标签中衍生 AI 生成提示：解锁数据标注新效能
2025-03-30 08:15

大模型之路的博客数据标注作为机器学习和深度学习的基础环节，其质量和...随着生成式人工智能（Generative AI）技术的兴起，自动化数据标注成为可能，其中从人类标签中衍生 AI 生成提示的方法备受关注，为数据标注领域带来了新的突破。
AI产品经理之数据标注
2024-04-02 00:00

随着人工智能技术的发展，数据标注成为AI领域不可或缺的一环。本文将围绕“AI产品经理之数据标注”这一主题，深入探讨数据标注在AI产业中的地位、作用以及面临的挑战。 #### 二、数据标注的重要性 1. **数据的重要...
AI产品经理怎么做数据标注
2024-06-13 14:30

冻感糕人~的博客快速、高效的进行数据标注，是机器学习和深度学习的基础，现在一些标注工具通过深度学习模型和主动学习技术，通过NLP模型来提高标注效率，集数据标注、数据管理、模型训练和模型服务于一体，使数据标注更加轻松、更...
NER-少量标注数据文本增强
2022-07-14 16:00

Dongxue_NLP的博客文本增强总结
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月19日

为什么现在的文本处理只需要标注少量的数据

1条回答 默认 最新

问题事件

1条回答默认最新