问下使用albert 进行多标签的文本分类[12个类别],为啥 acc 才这么点,是哪里没写对么?

import tensorflow as tf
 
tf.__version__

'2.2.2'

import keras
print(keras.__version__)

2.3.1


Using TensorFlow backend.


from tensorflow import keras
print(keras.__version__)

2.3.0-tf

from tensorflow.keras.utils import to_categorical
from sklearn.model_selection import train_test_split

MAX_LENGTH = 1024
#载入训练集和测试集数据
# train = pd.read_csv(r'D:\code\python\csdn_nlp\data\文本分类数据\Texts_Classification\train2.csv')
# test = pd.read_csv(r'D:\code\python\csdn_nlp\data\文本分类数据\Texts_Classification\test2.csv')

train = pd.read_csv(r'/mnt/d/code/python/csdn_nlp/data/文本分类数据/Texts_Classification/train2.csv')
test = pd.read_csv(r'/mnt/d/code/python/csdn_nlp/data/文本分类数据/Texts_Classification/test2.csv')

train.head(10)

	Unnamed: 0	分类	文章	字数	分词	label
0	10000	体育	欧洲杯观察：足坛格局地震　东南欧已能占半边天搜狐体育讯　土耳其与克罗地亚在本届欧洲杯１／４...	1818	['欧洲杯', '观察', '足坛', '格局', '地震', '东南欧', '已能', '...	8
1	10001	体育	来源：搜狐体育　作者：雷欧主队　比分　客队　进球视频青岛　１－１　武汉浙江　１－１　北京搜...	2190	['来源', '搜狐', '体育', '作者', '雷欧', '主队', '比分', '客队...	8
2	10002	体育	欧洲杯－帕夫柳琴科范尼破门　荷兰１－１俄罗斯加时搜狐体育讯　北京时间６月２２日，２００８欧...	2078	['欧洲杯', '帕夫', '柳琴', '科范尼', '破门', '荷兰', '俄罗斯', ...	8
3	10003	体育	郅联璧合配合日臻完善　斯杯之前尤纳斯再谈裁员７年后重登上海滩，中国男篮来去匆匆。队长刘炜回...	1810	['郅', '联璧', '合', '配合', '日臻完善', '斯杯', '之前', '尤纳...	8
4	10004	体育	盘踞世界第一逼近五百周　伍兹创造高尔夫里程碑搜狐体育讯　下周一，老虎－伍兹将第４９９周稳坐...	1893	['盘踞', '世界', '第一', '逼近', '五百', '周伍', '兹', '创造'...	8
5	10005	体育	第五日看点：郑洁挑战ＮＯ．１　费天王冲击男单１６强搜狐体育讯　北京时间６月２７日晚，２００...	2082	['第五日', '看点', '郑洁', '挑战', '费', '天王', '冲击', '男单...	8
6	10007	体育	王德显改变双姝命运　邢慧娜孙英杰成败均因一人２００７年年底，邢慧娜来到了北京。田管中心已经...	1855	['王德显', '改变', '双姝', '命运', '邢慧娜', '孙', '英杰', '成...	8
7	10008	体育	半场实录：皮尔斯异军突起　湖人队领先凯尔特人搜狐直播员：搜狐网友：赛式是２３２制的，还是主...	8550	['半场', '实录', '皮尔斯', '异军突起', '湖人队', '领先', '凯尔特人...	8
8	10009	体育	温格：德国可成英格兰榜样　三狮军团差在意志力晨报特派记者　甘慧（奥地利维也纳６月２９日电）...	2162	['温格', '德国', '可成', '英格兰', '榜样', '三狮', '军团', '差...	8
9	10010	体育	欧洲杯－范尼斯内德建功　荷兰３－０狂屠意大利搜狐体育讯　北京时间６月１０日凌晨２：４５，２...	2643	['欧洲杯', '范', '尼斯', '德', '建功', '荷兰', '狂屠', '意大利...	8

temp_train_data_list = train[["文章","label"]].values.tolist()
train_data_list = [tuple(x) for x in temp_train_data_list]

temp_test_data_list = test[["文章","label"]].values.tolist()
test_data_list = [tuple(x) for x in temp_test_data_list]
train_data_list[0]
print(type(train_data_list))

<class 'list'>

# from sklearn.model_selection import train_test_split
# '''不采取分层抽样时的数据集分割'''
# valid_data_list = train_test_split(train_data_list,test_size=0.3)
# len(valid_data_list)
# valid_data_list[0]
import random
baifenbi = 80
length = len(train_data_list)
print(length)
len(train_data_list[int((length/100)*baifenbi):])

# 加载数据集 这么取 值 标签训练会有问题,所以要随机打乱,然后选取
import random
random.shuffle(train_data_list)
train_data = train_data_list[0:int((length/100)*baifenbi)]
valid_data = train_data_list[int((length/100)*baifenbi):]


# random.seed(10)
# valid_data = random.sample(train_data_list, 5) 

test_data = test_data_list

import numpy as np
from sklearn import metrics
from bert4keras.tokenizers import Tokenizer
from bert4keras.backend import keras, set_gelu
from bert4keras.models import build_transformer_model
from bert4keras.snippets import DataGenerator, sequence_padding
from bert4keras.optimizers import Adam, extend_with_piecewise_linear_lr
from keras.layers import Lambda, Dense
from contextlib import redirect_stdout

set_gelu('tanh')  # 切换gelu版本

# 文本共计 12 个类别
num_classes = 12
# 长文本,长一些,好像bert 类,最长 512? 所以编码的文字 应该去掉停用词
maxlen = 64

batch_size = 8

# config_path = r"D:/code/python/csdn_nlp/model/albert_xlarge_zh/albert_xlarge/albert_config.json"
# checkpoint_path =tf.train.latest_checkpoint(r"D:/code/python/csdn_nlp/model/albert_xlarge_zh/albert_xlarge/")
# #checkpoint_path = r"D:/code/python/csdn_nlp/model/albert_xlarge_zh/albert_xlarge/model"
# dict_path = r"D:/code/python/csdn_nlp/model/albert_xlarge_zh/albert_xlarge/vocab_chinese.txt"

# linux 路径
config_path = r"/mnt/d/code/python/csdn_nlp/model/albert_base/albert_config.json"
# albert-base-v2 的压缩包里面没有ckpt，windows 下面加载报错，所以应该在linux 下面使用
checkpoint_path =tf.train.latest_checkpoint(r"/mnt/d/code/python/csdn_nlp/model/albert_base/model.ckpt-best.data-00000-of-00001")
#checkpoint_path = r"/mnt/d/code/python/csdn_nlp/model/albert_base/"
dict_path = r"/mnt/d/code/python/csdn_nlp/model/albert_base/vocab_chinese.txt"

# 建立分词器
tokenizer = Tokenizer(dict_path, do_lower_case=True)


class data_generator(DataGenerator):
    """数据生成器
    """
    def __iter__(self, random=False):
        batch_token_ids, batch_segment_ids, batch_labels = [], [], []
        for is_end, (text, label) in self.sample(random):
            token_ids, segment_ids = tokenizer.encode(text, maxlen=maxlen)
            batch_token_ids.append(token_ids)
            batch_segment_ids.append(segment_ids)
            batch_labels.append([label])
            if len(batch_token_ids) == self.batch_size or is_end:
                batch_token_ids = sequence_padding(batch_token_ids)
                batch_segment_ids = sequence_padding(batch_segment_ids)
                batch_labels = sequence_padding(batch_labels)
                yield [batch_token_ids, batch_segment_ids], batch_labels
                batch_token_ids, batch_segment_ids, batch_labels = [], [], []


# 加载预训练模型
bert = build_transformer_model(
    config_path=config_path,
    checkpoint_path=checkpoint_path,
    model='albert',
    return_keras_model=False,
)

output = Lambda(lambda x: x[:, 0], name='CLS-token')(bert.model.output)
output = Dense(
    units=num_classes,
    activation='softmax',
    kernel_initializer=bert.initializer
)(output)

model = keras.models.Model(bert.model.input, output)
model.summary()

# 派生为带分段线性学习率的优化器。
# 其中name参数可选，但最好填入，以区分不同的派生优化器。
AdamLR = extend_with_piecewise_linear_lr(Adam, name='AdamLR')

model.compile(
    loss='sparse_categorical_crossentropy',
    # optimizer=Adam(1e-5),  # 用足够小的学习率
    optimizer=AdamLR(learning_rate=1e-4, lr_schedule={
        1000: 1,
        2000: 0.1
    }),
    metrics=['accuracy'],
)

# 转换数据集
train_generator = data_generator(train_data, batch_size)
valid_generator = data_generator(valid_data, batch_size)
test_generator = data_generator(test_data, batch_size)


def evaluate(data):
    total, right = 0., 0.
    for x_true, y_true in data:
        y_pred = model.predict(x_true).argmax(axis=1)
        y_true = y_true[:, 0]
        total += len(y_true)
        right += (y_true == y_pred).sum()
    return right / total


class Evaluator(keras.callbacks.Callback):
    """评估与保存
    """
    def __init__(self):
        self.best_val_acc = 0.

    def on_epoch_end(self, epoch, logs=None):
        val_acc = evaluate(valid_generator)
        if val_acc > self.best_val_acc:
            self.best_val_acc = val_acc
            model.save_weights('best_model.weights')
        test_acc = evaluate(test_generator)
        print(
            u'val_acc: %.5f, best_val_acc: %.5f, test_acc: %.5f\n' %
            (val_acc, self.best_val_acc, test_acc)
        )

Model: "model_6"
__________________________________________________________________________________________________
Layer (type)                    Output Shape         Param #     Connected to                     
==================================================================================================
Input-Token (InputLayer)        (None, None)         0                                            
__________________________________________________________________________________________________
Input-Segment (InputLayer)      (None, None)         0                                            
__________________________________________________________________________________________________
Embedding-Token (Embedding)     (None, None, 128)    2704384     Input-Token[0][0]                
__________________________________________________________________________________________________
Embedding-Segment (Embedding)   (None, None, 128)    256         Input-Segment[0][0]              
__________________________________________________________________________________________________
Embedding-Token-Segment (Add)   (None, None, 128)    0           Embedding-Token[0][0]            
                                                                 Embedding-Segment[0][0]          
__________________________________________________________________________________________________
Embedding-Position (PositionEmb (None, None, 128)    65536       Embedding-Token-Segment[0][0]    
__________________________________________________________________________________________________
Embedding-Norm (LayerNormalizat (None, None, 128)    256         Embedding-Position[0][0]         
__________________________________________________________________________________________________
Embedding-Mapping (Dense)       (None, None, 768)    99072       Embedding-Norm[0][0]             
__________________________________________________________________________________________________
Transformer-MultiHeadSelfAttent (None, None, 768)    2362368     Embedding-Mapping[0][0]          
                                                                 Embedding-Mapping[0][0]          
                                                                 Embedding-Mapping[0][0]          
                                                                 Transformer-FeedForward-Norm[0][0
                                                                 Transformer-FeedForward-Norm[0][0
                                                                 Transformer-FeedForward-Norm[0][0
                                                                 Transformer-FeedForward-Norm[1][0
                                                                 Transformer-FeedForward-Norm[1][0
                                                                 Transformer-FeedForward-Norm[1][0
                                                                 Transformer-FeedForward-Norm[2][0
                                                                 Transformer-FeedForward-Norm[2][0
                                                                 Transformer-FeedForward-Norm[2][0
                                                                 Transformer-FeedForward-Norm[3][0
                                                                 Transformer-FeedForward-Norm[3][0
                                                                 Transformer-FeedForward-Norm[3][0
                                                                 Transformer-FeedForward-Norm[4][0
                                                                 Transformer-FeedForward-Norm[4][0
                                                                 Transformer-FeedForward-Norm[4][0
                                                                 Transformer-FeedForward-Norm[5][0
                                                                 Transformer-FeedForward-Norm[5][0
                                                                 Transformer-FeedForward-Norm[5][0
                                                                 Transformer-FeedForward-Norm[6][0
                                                                 Transformer-FeedForward-Norm[6][0
                                                                 Transformer-FeedForward-Norm[6][0
                                                                 Transformer-FeedForward-Norm[7][0
                                                                 Transformer-FeedForward-Norm[7][0
                                                                 Transformer-FeedForward-Norm[7][0
                                                                 Transformer-FeedForward-Norm[8][0
                                                                 Transformer-FeedForward-Norm[8][0
                                                                 Transformer-FeedForward-Norm[8][0
                                                                 Transformer-FeedForward-Norm[9][0
                                                                 Transformer-FeedForward-Norm[9][0
                                                                 Transformer-FeedForward-Norm[9][0
                                                                 Transformer-FeedForward-Norm[10][
                                                                 Transformer-FeedForward-Norm[10][
                                                                 Transformer-FeedForward-Norm[10][
__________________________________________________________________________________________________
Transformer-MultiHeadSelfAttent (None, None, 768)    0           Embedding-Mapping[0][0]          
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward-Norm[0][0
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward-Norm[1][0
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward-Norm[2][0
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward-Norm[3][0
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward-Norm[4][0
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward-Norm[5][0
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward-Norm[6][0
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward-Norm[7][0
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward-Norm[8][0
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward-Norm[9][0
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward-Norm[10][
                                                                 Transformer-MultiHeadSelfAttentio
__________________________________________________________________________________________________
Transformer-MultiHeadSelfAttent (None, None, 768)    1536        Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
__________________________________________________________________________________________________
Transformer-FeedForward (FeedFo (None, None, 768)    4722432     Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
__________________________________________________________________________________________________
Transformer-FeedForward-Add (Ad (None, None, 768)    0           Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward[0][0]    
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward[1][0]    
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward[2][0]    
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward[3][0]    
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward[4][0]    
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward[5][0]    
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward[6][0]    
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward[7][0]    
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward[8][0]    
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward[9][0]    
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward[10][0]   
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward[11][0]   
__________________________________________________________________________________________________
Transformer-FeedForward-Norm (L (None, None, 768)    1536        Transformer-FeedForward-Add[0][0]
                                                                 Transformer-FeedForward-Add[1][0]
                                                                 Transformer-FeedForward-Add[2][0]
                                                                 Transformer-FeedForward-Add[3][0]
                                                                 Transformer-FeedForward-Add[4][0]
                                                                 Transformer-FeedForward-Add[5][0]
                                                                 Transformer-FeedForward-Add[6][0]
                                                                 Transformer-FeedForward-Add[7][0]
                                                                 Transformer-FeedForward-Add[8][0]
                                                                 Transformer-FeedForward-Add[9][0]
                                                                 Transformer-FeedForward-Add[10][0
                                                                 Transformer-FeedForward-Add[11][0
__________________________________________________________________________________________________
CLS-token (Lambda)              (None, 768)          0           Transformer-FeedForward-Norm[11][
__________________________________________________________________________________________________
dense_21 (Dense)                (None, 12)           9228        CLS-token[0][0]                  
==================================================================================================
Total params: 9,966,604
Trainable params: 9,966,604
Non-trainable params: 0
__________________________________________________________________________________________________

evaluator = Evaluator()
model.fit(
        train_generator.forfit(),
        steps_per_epoch=len(train_generator),
        epochs=1,
        callbacks=[evaluator]
    )

model.load_weights('best_model.weights')
print(u'final test acc: %05f\n' % (evaluate(test_generator)))

Epoch 1/1
2355/2355 [==============================] - 1663s 706ms/step - loss: 2.5211 - accuracy: 0.0876
val_acc: 0.08493, best_val_acc: 0.08493, test_acc: 0.08333

final test acc: 0.083333

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
ilmss 2022-02-03 13:31
关注
在多标签文本分类的训练过程中，在多元文本分类的训练过程中，Loss一般在0.1-0.2之间的时候，模型基本上已经收敛。但是，看题主的这个，在多标签文本分类(这个框架下)的情况下，Loss往往要达到0.0001-0.001之间，模型才收敛。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1

无用 1
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

NLP（二十八）多标签文本分类
2020-04-10 10:49

山阴少年的博客多标签文本分类之从电影简介预测影片类型
TextCNN处理多标签文本分类任务
2024-07-31 21:31

sparkling*的博客设置一个列表，对应标签位置的值置为1，其他位置的值置为0TextCNN最后一层需要加上一个sigmoid层，把值锁定在0-1之间损失函数采用二元交叉熵损失函数一般采用macro平均这一衡量指标然后就是数据处理的时候需要变化，...
书写自动智慧：探索Python文本分类器的开发与应用：支持二分类、多分类、多标签分类、多层级分类和Kmeans聚类
2023-08-11 16:54

汀、人工智能的博客书写自动智慧：探索Python文本分类器的开发与应用：支持二分类、多分类、多标签分类、多层级分类和Kmeans聚类
Albert处理文本分类任务
2020-12-12 18:59

趋吉避凶的博客文章目录准备工作一、处理数据集二、构建分类任务1.引入库2.配置参数3.读取处理数据4.加载Albert预训练模型5.开始训练6.验证模型总结参考文献准备工作预训练模型下载地址：Albert_Large_zh 数据集下载地址：事故...
豆瓣评分预测（如何用自己的数据集进行文本分类）——基于pytorch的 BERT中文文本分类，超详细教程必会！
2024-05-04 21:51

2401_84297455的博客 TextClassifier文件夹下包含三个主要的函数以及models和bert_pretrian文件夹，models文件夹下包含bert.py以及ernie.py，bert_pretrian文件夹中包含预训练模型。bert.py以及ernie.py里面可以设置模型以及训练参数。...
transformers文本分类
2024-02-27 12:35

灯下夜无眠的博客 文本分类是最常见的NLP任务之一，做其他NLP任务处理时的步骤流程基本一样，主要在于不同任务需要做不同的数据处理，下面介绍如何使用transformers做文本分类的一个大致流程。
NLP实战入门——文本分类任务（TextRNN，TextCNN，TextRNN_Att，TextRCNN，FastText，DPCNN，BERT，ERNIE）
2024-06-09 23:18

雾重烟秋的博客本文参考自，是为了进行NLP的一些典型模型的总结和尝试。
文本分类模型的训练、调优、蒸馏
2023-03-21 10:30

德彪稳坐倒骑驴的博客主题分类判断邮件是否是垃圾邮件情感分析对话系统中的意图识别：如判断聊天用户的意图是“问发货时间”还是问“退换货收货地址。
NLP-多标签文本分类
2021-10-24 17:10

lulu_Records的博客本文将会讲述如何实现多标签文本分类。什么是多标签分类？在分类问题中，我们已经接触过二分类和多分类问题了。所谓二（多）分类问题，指的是y值一共有两（多）个类别，每个样本的y值只能属于其中的一个类别...
中文文本分类：基于PyTorch的多模型中文文本分类
2020-03-01 12:55

study for happy的博客本文基于PyTorch实现多个模型对中文文本进行分类、比较任务，分别为在序列维度上取平均得到句子表示的简单AVG基线模型、使用[2,3,4]kernel size后concate的CNN模型、双向LSTM模型及BERT模型。项目代码： BERT中文预...
使用BERT进行中文文本分类
2023-08-15 03:33

光子AI的博客作者：禅与计算机程序设计艺术 1.简介 ...近年来随着深度神经网络(DNNs)在自然语言处理领域的火爆，基于神经网络的机器学习模型越来越多地被应用于处理中文文本数据。其中BERT(Bidirectional Encoder R
文本分类(三) | (6) 番外篇(预训练语言模型的另一种使用方式)
2020-01-31 15:05

CoreJT的博客本篇博客也是对Github优秀文本分类项目的解析，该文本分类项目，主要基于预训练语言模型，包括bert、xlnet、bert/xlnet + CNN/GRU/LSTM、Albert等，使用PyTorch实现。项目其实提供了一种预训练语言模型的通用方法...
7个Bert变种模型baseline在7个文本分类数据集上训练和测试
2023-03-20 22:29

德彪稳坐倒骑驴的博客本文使用了下面七个模型 1. BertLSTM 2. BertOrigin 3. BertCNN 4. BertATT 5. BertRCNN 6. BertCNNPlus 7. BertDPCNN 在下面七个数据集上做了训练和测试： IMDB， SST-2, Yelp ，Yahoo! Answers ， AG's News，...
BERT中文新闻分类实战：如何避免常见坑点并提升模型准确率
2025-08-12 00:17

h3i4j的博客文章从数据预处理、模型选择、训练优化及高级策略等多个维度，详细解析了如何针对中文新闻文本特点进行精细化处理，并整合了文本分类等关键热词信息，为构建高性能分类模型提供了系统性的解决方案。
天池零基础入门NLP竞赛实战：Task4-基于深度学习的文本分类3-基于Bert预训练和微调进行文本分类
2021-10-17 11:57

冬于的博客 Task4-基于深度学习的文本分类3-基于Bert预训练和微调进行文本分类 因为天池这个比赛的数据集是脱敏的，无法利用其它已经预训练好的模型，所以需要针对这个数据集自己从头预训练一个模型。我们利用Huggingface的...
PyTorch实战：手把手教你用BERT实现文本分类（附完整代码）
2026-03-07 00:51

郑自春的博客本文提供了一份详细的PyTorch实战教程，手把手教你使用BERT预训练模型实现文本分类任务。教程涵盖从环境搭建、数据预处理、模型构建、训练评估到高级调优的完整流程，并以IMDb情感分析为例附上了可运行的完整代码，...
多模态性能评估怎么做？90%的团队都忽略了这4个关键维度
2025-12-14 13:55

CodePulse的博客掌握多模态性能评估的关键方法，解决模型在复杂场景下的真实表现问题。本文深入解析多模态的评估四大常被忽视的核心维度，涵盖跨模态对齐、语义一致性、任务适配性与鲁棒性测试，适用于图文生成、视频理解等应用场景...
中文文本分类案例展示：bert-base-chinese实际应用效果
2026-01-20 03:20

Waiyuet Fung的博客本文介绍了基于星图GPU平台自动化部署bert-base-chinese预训练模型镜像的完整实践，展示其在中文文本分类场景中的高效应用。通过该镜像，用户可快速实现客服工单、用户反馈等内容的自动分类，显著提升NLP任务开发...
多模态技术实战：如何用Python快速搭建一个简单的多模态模型（附代码）
2025-10-17 12:25

u0v1w2x3的博客本文是一篇多模态技术实战指南，详细介绍了如何使用Python和PyTorch快速搭建一个简易的图文匹配多模态模型。文章从环境准备、数据处理、模型架构设计（采用ResNet和BERT双塔结构）、训练评估到进阶调优，提供了完整...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 2月3日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 2月3日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月3日

问下使用albert 进行多标签的文本分类[12个类别],为啥 acc 才这么点,是哪里没写对么?

2条回答 默认 最新

问题事件

2条回答默认最新