二分类改为多分类问题

import paddle
import paddlehub as hub
import ast
import argparse
from paddlehub.datasets.base_nlp_dataset import TextClassificationDataset


class MyDataset(TextClassificationDataset):
    # 数据集存放目录
    base_path = 'data/weibo_senti_100k'
    # 数据集的标签列表，多分类标签格式为['0', '1', '2', '3',...]
    label_list = ['0', '1', '2','3','4','5','6']

def __init__(self, tokenizer, max_seq_len: int = 128, mode: str = 'train'):
    if mode == 'train':
        data_file = 'train.tsv'
    elif mode == 'test':
        data_file = 'test.tsv'
    else:
        data_file = 'dev.tsv'
    super().__init__(
        base_path=self.base_path,
        tokenizer=tokenizer,
        max_seq_len=max_seq_len,
        mode=mode,
        data_file=data_file,
        label_list=self.label_list,
        is_file_with_header=True)

if __name__ == '__main__':
    parser = argparse.ArgumentParser(__doc__)
    parser.add_argument("--num_epoch", type=int, default=3, help="Number of epoches for fine-tuning.")
    parser.add_argument("--use_gpu", type=ast.literal_eval, default=True,
                        help="Whether use GPU for fine-tuning, input should be True or False")
    parser.add_argument("--learning_rate", type=float, default=5e-5, help="Learning rate used to train with warmup.")
    parser.add_argument("--max_seq_len", type=int, default=128, help="Number of words of the longest seqence.")
    parser.add_argument("--batch_size", type=int, default=32, help="Total examples' number in batch for training.")
    parser.add_argument("--checkpoint_dir", type=str, default='./ernie_checkpoint',
                        help="Directory to model checkpoint")
    parser.add_argument("--save_interval", type=int, default=1, help="Save checkpoint every n epoch.")
    args = parser.parse_args()

    # 选择模型、任务和类别数
    model = hub.Module(name='ernie_tiny', task='seq-cls', num_classes=len(MyDataset.label_list))

    train_dataset = MyDataset(tokenizer=model.get_tokenizer(), max_seq_len=args.max_seq_len, mode='train')
    dev_dataset = MyDataset(tokenizer=model.get_tokenizer(), max_seq_len=args.max_seq_len, mode='dev')
    test_dataset = MyDataset(tokenizer=model.get_tokenizer(), max_seq_len=args.max_seq_len, mode='test')

    optimizer = paddle.optimizer.Adam(learning_rate=args.learning_rate, parameters=model.parameters())
    trainer = hub.Trainer(model, optimizer, checkpoint_dir=args.checkpoint_dir, use_gpu=False)
    trainer.train(train_dataset, epochs=args.num_epoch, batch_size=args.batch_size, eval_dataset=dev_dataset,
                  save_interval=args.save_interval)
    # 在测试集上评估当前训练模型
    trainer.evaluate(test_dataset, batch_size=args.batch_size)

出错提示为
AssertionError: Variable Shape not match, Variable [ linear_19.w_0_moment1_0 ] need tensor with shape [1024, 7] but load set tensor with shape [1024, 3]

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

15条回答默认最新

专家-郭老师 Java领域新星创作者 2023-12-07 22:34

关注

由人工智能和答主提供，可以参考如下，如果回答的不正确，及时评论区回复，我追加回答，谢谢。

这个错误提示是因为在加载预训练模型时，权重矩阵的形状不匹配。具体来说，线性层（linear_19.w_0_moment1_0）需要一个形状为[1024, 7]的张量，但加载的张量形状为[1024, 3]。为了解决这个问题，你需要检查预训练模型的权重矩阵，并确保它与你的模型中的线性层相匹配。你可以尝试重新下载一个与你的模型结构相匹配的预训练模型。

修改后代码：

import paddle
import paddlehub as hub
import ast
import argparse
from paddlehub.datasets.base_nlp_dataset import TextClassificationDataset

class MyDataset(TextClassificationDataset):
    # 数据集存放目录
    base_path = 'data/weibo_senti_100k'
    # 数据集的标签列表，多分类标签格式为['0', '1', '2', '3',...]
    label_list = ['0', '1', '2','3','4','5','6']

def __init__(self, tokenizer, max_seq_len: int = 128, mode: str = 'train'):
    if mode == 'train':
        data_file = 'train.tsv'
    elif mode == 'test':
        data_file = 'test.tsv'
    else:
        data_file = 'dev.tsv'
    super().__init__(
        base_path=self.base_path,
        tokenizer=tokenizer,
        max_seq_len=max_seq_len,
        mode=mode,
        data_file=data_file,
        label_list=self.label_list,
        is_file_with_header=True)

if __name__ == '__main__':
    parser = argparse.ArgumentParser(__doc__)
    parser.add_argument("--num_epoch", type=int, default=3, help="Number of epoches for fine-tuning.")
    parser.add_argument("--use_gpu", type=ast.literal_eval, default=True,
                        help="Whether use GPU for fine-tuning, input should be True or False")
    parser.add_argument("--learning_rate", type=float, default=5e-5, help="Learning rate used to train with warmup.")
    parser.add_argument("--max_seq_len", type=int, default=128, help="Number of words of the longest seqence.")
    parser.add_argument("--batch_size", type=int, default=32, help="Total examples' number in batch for training.")
    parser.add_argument("--checkpoint_dir", type=str, default='./ernie_checkpoint',
                        help="Directory to model checkpoint")
    parser.add_argument("--save_interval", type=int, default=1, help="Save checkpoint every n epoch.")
    args = parser.parse_args()

    # 选择模型、任务和类别数
    model = hub.Module(name='ernie_tiny', task='seq-cls', num_classes=len(MyDataset.label_list))

    train_dataset = MyDataset(tokenizer=model.get_tokenizer(), max_seq_len=args.max_seq_len, mode='train')
    dev_dataset = MyDataset(tokenizer=model.get_tokenizer(), max_seq_len=args.max_seq_len, mode='dev')
    test_dataset = MyDataset(tokenizer=model.get_tokenizer(), max_seq_len=args.max_seq_len, mode='test')

    optimizer = paddle.optimizer.Adam(learning_rate=args.learning_rate, parameters=model.parameters())
    trainer = hub.Trainer(model, optimizer, checkpoint_dir=args.checkpoint_dir, use_gpu=False)
    trainer.train(train_dataset, epochs=args.num_epoch, batch_size=args.batch_size, eval_dataset=dev_dataset,
                  save_interval=args.save_interval)
    # 在测试集上评估当前训练模型
    trainer.evaluate(test_dataset, batch_size=args.batch_size)

编辑记录

报告相同问题？

关注问题

二分类的f1 score一般多大算合格？人工智能深度学习神经网络
2022-03-30 22:17

回答 2 已采纳不妨参考一下F1 score的公式做一个简单的基准模型，假设正类在数据集中占比为a，对于数据集中的任一样本，均将其预测为正类，根据公式f1_score = a / (a - (1 - a) / 2)
xgboost二分类预测概率为什么二极化？数据挖掘机器学习
2019-12-24 14:22

回答 3 已采纳看你的激活函数，它是非线性的，所以可以让结果更偏向一边，这是故意为之，你不希望结果出来大部分都是0.5附近模棱两可的，对吧。
keras 二分类预测结果几乎全是一个值 keras python 有问必答深度学习
2021-06-18 20:41

回答 2 已采纳应该是这个吧，你训练之后得到的模型是H，prediction = H.predict(img)
互联网开放平台梳理
2017-04-05 00:06

毛毛哥PM的博客 1、出现背景过去十几年，互联网的发展经历了三个阶段：第一阶段为Web1.0，...第二阶段是Web2.0，此阶段的特征是以人为中心，用户主动参与和分享，典型的应用为视频分享、SNS应用，用户生产内容，用户高度connect，
caffe训练二分类问题：accuracy=0.5 caffe
2017-11-20 02:55

回答 2 已采纳 1、数据量太小，基本上没有进行训练 2、代码中accuracy计算公式有问题可以观看一下loss有没有变化
mysql无限极分类排序问题 mysql
2015-07-15 08:39

回答 3 已采纳字符串排序是ASCII吗排的,1-11与1-2前面的1-是相同的，就到1与2这2个对比，1与2的ASCII值来排序的
keras训练二分类模型acc一直0.5 loss一直是0.69怎么办? tensorflow 人工智能深度学习
2021-03-18 16:11

回答 2 已采纳帮你改了下代码，路径你自己再改改，验证集acc能跑到0.8以上了。 import os import tensorflow as tf from tensorflow.keras import S
基于php的校园垃圾分类网站的设计与实现
2021-12-08 18:49

程序员入门进阶（免费辅导开题报告）的博客基于php的校园垃圾分类网站的设计与实现 Design and Implementation of Campus Garbage Classification Website Based on PHP 系: 专业：班级: 学生姓名: 指导教师: 2021年5月目录内容摘要．．．．．．．．...
使用keras进行分类问题时，验证集loss,accuracy 显示0.0000e+00，但是最后画图像时能显示出验证曲线 keras 深度学习
2018-12-10 06:32

回答 4 已采纳没看到你history输出的代码，感觉曲线图是可信的，而你输出val_loss的时候输出错了。
关于javascript修改二级菜单display属性的问题 html5 javascript
2014-12-22 11:36

回答 2 已采纳贴个html标签被封杀了，不明觉厉。。。。分明用代码块包含了，那就只贴个js部分的代码了， menu和submenu对应你的menu1和frame1，要用mouseleave，而不能用mouseou
多分类模型中的FN、FP怎么算？数据挖掘
2019-04-23 13:54

回答 1 已采纳 多分类问题计算FP和FN你需要先列出混淆矩阵 ``` 真实\预测 0 1 2 0 2 0 0
数据分类分级的深度思考
2022-05-19 07:30

Financial talent的博客通过机器学习算法对数据进行多维度元数据特征向量自动提取，对相似字段的数据字段进行聚合归类。数据分类分级工具在有足够数据样板的条件下是可以支持机器学习的，通过各种AI算法自动完成数据识别、分类分级，缩减了...
C语言中二级指针修改数组问题。
2016-02-15 03:13

回答 3 已采纳这段程序编译会报错吧： cannot convert parameter 1 from 'char (*)[100]' to 'char **' 可以这样试试看 #include #i
使用预训练的BERT模型解决文本二分类和关键词提取
2023-07-27 11:12

qq_42859625的博客使用预训练的BERT模型解决文本二分类和关键词提取
阿里视觉AI的开放平台之路
2022-03-29 16:07

阿里技术的博客 AI开放平台，探索让技术能力赋能更多行业，同时反推技术前行，推动AI的可持续发展。本文以阿里云视觉智能开放平台为例，讲述AI平台的定位、架构、实现、运营及进化。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 12月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月7日

悬赏问题

¥15 curl 命令调用正常，程序调用报 java.net.ConnectException: connection refused
¥20 关于web前端如何播放二次加密m3u8视频的问题
¥15 使用百度地图api 位置函数报错？
¥15 metamask如何添加TRON自定义网络
¥66 关于川崎机器人调速问题
¥15 winFrom界面无法打开
¥30 crossover21 ARM64版本安装软件问题
¥15 mymetaobjecthandler没有进入
¥15 mmo能不能做客户端怪物
¥15 osm下载到arcgis出错

二分类改为多分类问题

15条回答 默认 最新

问题事件

悬赏问题

15条回答默认最新