问下使用albert 进行多标签的文本分类[12个类别],为啥 acc 才这么点,是哪里没写对么?

import tensorflow as tf
 
tf.__version__

'2.2.2'

import keras
print(keras.__version__)

2.3.1


Using TensorFlow backend.


from tensorflow import keras
print(keras.__version__)

2.3.0-tf

from tensorflow.keras.utils import to_categorical
from sklearn.model_selection import train_test_split

MAX_LENGTH = 1024
#载入训练集和测试集数据
# train = pd.read_csv(r'D:\code\python\csdn_nlp\data\文本分类数据\Texts_Classification\train2.csv')
# test = pd.read_csv(r'D:\code\python\csdn_nlp\data\文本分类数据\Texts_Classification\test2.csv')

train = pd.read_csv(r'/mnt/d/code/python/csdn_nlp/data/文本分类数据/Texts_Classification/train2.csv')
test = pd.read_csv(r'/mnt/d/code/python/csdn_nlp/data/文本分类数据/Texts_Classification/test2.csv')

train.head(10)

	Unnamed: 0	分类	文章	字数	分词	label
0	10000	体育	欧洲杯观察：足坛格局地震　东南欧已能占半边天搜狐体育讯　土耳其与克罗地亚在本届欧洲杯１／４...	1818	['欧洲杯', '观察', '足坛', '格局', '地震', '东南欧', '已能', '...	8
1	10001	体育	来源：搜狐体育　作者：雷欧主队　比分　客队　进球视频青岛　１－１　武汉浙江　１－１　北京搜...	2190	['来源', '搜狐', '体育', '作者', '雷欧', '主队', '比分', '客队...	8
2	10002	体育	欧洲杯－帕夫柳琴科范尼破门　荷兰１－１俄罗斯加时搜狐体育讯　北京时间６月２２日，２００８欧...	2078	['欧洲杯', '帕夫', '柳琴', '科范尼', '破门', '荷兰', '俄罗斯', ...	8
3	10003	体育	郅联璧合配合日臻完善　斯杯之前尤纳斯再谈裁员７年后重登上海滩，中国男篮来去匆匆。队长刘炜回...	1810	['郅', '联璧', '合', '配合', '日臻完善', '斯杯', '之前', '尤纳...	8
4	10004	体育	盘踞世界第一逼近五百周　伍兹创造高尔夫里程碑搜狐体育讯　下周一，老虎－伍兹将第４９９周稳坐...	1893	['盘踞', '世界', '第一', '逼近', '五百', '周伍', '兹', '创造'...	8
5	10005	体育	第五日看点：郑洁挑战ＮＯ．１　费天王冲击男单１６强搜狐体育讯　北京时间６月２７日晚，２００...	2082	['第五日', '看点', '郑洁', '挑战', '费', '天王', '冲击', '男单...	8
6	10007	体育	王德显改变双姝命运　邢慧娜孙英杰成败均因一人２００７年年底，邢慧娜来到了北京。田管中心已经...	1855	['王德显', '改变', '双姝', '命运', '邢慧娜', '孙', '英杰', '成...	8
7	10008	体育	半场实录：皮尔斯异军突起　湖人队领先凯尔特人搜狐直播员：搜狐网友：赛式是２３２制的，还是主...	8550	['半场', '实录', '皮尔斯', '异军突起', '湖人队', '领先', '凯尔特人...	8
8	10009	体育	温格：德国可成英格兰榜样　三狮军团差在意志力晨报特派记者　甘慧（奥地利维也纳６月２９日电）...	2162	['温格', '德国', '可成', '英格兰', '榜样', '三狮', '军团', '差...	8
9	10010	体育	欧洲杯－范尼斯内德建功　荷兰３－０狂屠意大利搜狐体育讯　北京时间６月１０日凌晨２：４５，２...	2643	['欧洲杯', '范', '尼斯', '德', '建功', '荷兰', '狂屠', '意大利...	8

temp_train_data_list = train[["文章","label"]].values.tolist()
train_data_list = [tuple(x) for x in temp_train_data_list]

temp_test_data_list = test[["文章","label"]].values.tolist()
test_data_list = [tuple(x) for x in temp_test_data_list]
train_data_list[0]
print(type(train_data_list))

<class 'list'>

# from sklearn.model_selection import train_test_split
# '''不采取分层抽样时的数据集分割'''
# valid_data_list = train_test_split(train_data_list,test_size=0.3)
# len(valid_data_list)
# valid_data_list[0]
import random
baifenbi = 80
length = len(train_data_list)
print(length)
len(train_data_list[int((length/100)*baifenbi):])

# 加载数据集 这么取 值 标签训练会有问题,所以要随机打乱,然后选取
import random
random.shuffle(train_data_list)
train_data = train_data_list[0:int((length/100)*baifenbi)]
valid_data = train_data_list[int((length/100)*baifenbi):]


# random.seed(10)
# valid_data = random.sample(train_data_list, 5) 

test_data = test_data_list

import numpy as np
from sklearn import metrics
from bert4keras.tokenizers import Tokenizer
from bert4keras.backend import keras, set_gelu
from bert4keras.models import build_transformer_model
from bert4keras.snippets import DataGenerator, sequence_padding
from bert4keras.optimizers import Adam, extend_with_piecewise_linear_lr
from keras.layers import Lambda, Dense
from contextlib import redirect_stdout

set_gelu('tanh')  # 切换gelu版本

# 文本共计 12 个类别
num_classes = 12
# 长文本,长一些,好像bert 类,最长 512? 所以编码的文字 应该去掉停用词
maxlen = 64

batch_size = 8

# config_path = r"D:/code/python/csdn_nlp/model/albert_xlarge_zh/albert_xlarge/albert_config.json"
# checkpoint_path =tf.train.latest_checkpoint(r"D:/code/python/csdn_nlp/model/albert_xlarge_zh/albert_xlarge/")
# #checkpoint_path = r"D:/code/python/csdn_nlp/model/albert_xlarge_zh/albert_xlarge/model"
# dict_path = r"D:/code/python/csdn_nlp/model/albert_xlarge_zh/albert_xlarge/vocab_chinese.txt"

# linux 路径
config_path = r"/mnt/d/code/python/csdn_nlp/model/albert_base/albert_config.json"
# albert-base-v2 的压缩包里面没有ckpt，windows 下面加载报错，所以应该在linux 下面使用
checkpoint_path =tf.train.latest_checkpoint(r"/mnt/d/code/python/csdn_nlp/model/albert_base/model.ckpt-best.data-00000-of-00001")
#checkpoint_path = r"/mnt/d/code/python/csdn_nlp/model/albert_base/"
dict_path = r"/mnt/d/code/python/csdn_nlp/model/albert_base/vocab_chinese.txt"

# 建立分词器
tokenizer = Tokenizer(dict_path, do_lower_case=True)


class data_generator(DataGenerator):
    """数据生成器
    """
    def __iter__(self, random=False):
        batch_token_ids, batch_segment_ids, batch_labels = [], [], []
        for is_end, (text, label) in self.sample(random):
            token_ids, segment_ids = tokenizer.encode(text, maxlen=maxlen)
            batch_token_ids.append(token_ids)
            batch_segment_ids.append(segment_ids)
            batch_labels.append([label])
            if len(batch_token_ids) == self.batch_size or is_end:
                batch_token_ids = sequence_padding(batch_token_ids)
                batch_segment_ids = sequence_padding(batch_segment_ids)
                batch_labels = sequence_padding(batch_labels)
                yield [batch_token_ids, batch_segment_ids], batch_labels
                batch_token_ids, batch_segment_ids, batch_labels = [], [], []


# 加载预训练模型
bert = build_transformer_model(
    config_path=config_path,
    checkpoint_path=checkpoint_path,
    model='albert',
    return_keras_model=False,
)

output = Lambda(lambda x: x[:, 0], name='CLS-token')(bert.model.output)
output = Dense(
    units=num_classes,
    activation='softmax',
    kernel_initializer=bert.initializer
)(output)

model = keras.models.Model(bert.model.input, output)
model.summary()

# 派生为带分段线性学习率的优化器。
# 其中name参数可选，但最好填入，以区分不同的派生优化器。
AdamLR = extend_with_piecewise_linear_lr(Adam, name='AdamLR')

model.compile(
    loss='sparse_categorical_crossentropy',
    # optimizer=Adam(1e-5),  # 用足够小的学习率
    optimizer=AdamLR(learning_rate=1e-4, lr_schedule={
        1000: 1,
        2000: 0.1
    }),
    metrics=['accuracy'],
)

# 转换数据集
train_generator = data_generator(train_data, batch_size)
valid_generator = data_generator(valid_data, batch_size)
test_generator = data_generator(test_data, batch_size)


def evaluate(data):
    total, right = 0., 0.
    for x_true, y_true in data:
        y_pred = model.predict(x_true).argmax(axis=1)
        y_true = y_true[:, 0]
        total += len(y_true)
        right += (y_true == y_pred).sum()
    return right / total


class Evaluator(keras.callbacks.Callback):
    """评估与保存
    """
    def __init__(self):
        self.best_val_acc = 0.

    def on_epoch_end(self, epoch, logs=None):
        val_acc = evaluate(valid_generator)
        if val_acc > self.best_val_acc:
            self.best_val_acc = val_acc
            model.save_weights('best_model.weights')
        test_acc = evaluate(test_generator)
        print(
            u'val_acc: %.5f, best_val_acc: %.5f, test_acc: %.5f\n' %
            (val_acc, self.best_val_acc, test_acc)
        )

Model: "model_6"
__________________________________________________________________________________________________
Layer (type)                    Output Shape         Param #     Connected to                     
==================================================================================================
Input-Token (InputLayer)        (None, None)         0                                            
__________________________________________________________________________________________________
Input-Segment (InputLayer)      (None, None)         0                                            
__________________________________________________________________________________________________
Embedding-Token (Embedding)     (None, None, 128)    2704384     Input-Token[0][0]                
__________________________________________________________________________________________________
Embedding-Segment (Embedding)   (None, None, 128)    256         Input-Segment[0][0]              
__________________________________________________________________________________________________
Embedding-Token-Segment (Add)   (None, None, 128)    0           Embedding-Token[0][0]            
                                                                 Embedding-Segment[0][0]          
__________________________________________________________________________________________________
Embedding-Position (PositionEmb (None, None, 128)    65536       Embedding-Token-Segment[0][0]    
__________________________________________________________________________________________________
Embedding-Norm (LayerNormalizat (None, None, 128)    256         Embedding-Position[0][0]         
__________________________________________________________________________________________________
Embedding-Mapping (Dense)       (None, None, 768)    99072       Embedding-Norm[0][0]             
__________________________________________________________________________________________________
Transformer-MultiHeadSelfAttent (None, None, 768)    2362368     Embedding-Mapping[0][0]          
                                                                 Embedding-Mapping[0][0]          
                                                                 Embedding-Mapping[0][0]          
                                                                 Transformer-FeedForward-Norm[0][0
                                                                 Transformer-FeedForward-Norm[0][0
                                                                 Transformer-FeedForward-Norm[0][0
                                                                 Transformer-FeedForward-Norm[1][0
                                                                 Transformer-FeedForward-Norm[1][0
                                                                 Transformer-FeedForward-Norm[1][0
                                                                 Transformer-FeedForward-Norm[2][0
                                                                 Transformer-FeedForward-Norm[2][0
                                                                 Transformer-FeedForward-Norm[2][0
                                                                 Transformer-FeedForward-Norm[3][0
                                                                 Transformer-FeedForward-Norm[3][0
                                                                 Transformer-FeedForward-Norm[3][0
                                                                 Transformer-FeedForward-Norm[4][0
                                                                 Transformer-FeedForward-Norm[4][0
                                                                 Transformer-FeedForward-Norm[4][0
                                                                 Transformer-FeedForward-Norm[5][0
                                                                 Transformer-FeedForward-Norm[5][0
                                                                 Transformer-FeedForward-Norm[5][0
                                                                 Transformer-FeedForward-Norm[6][0
                                                                 Transformer-FeedForward-Norm[6][0
                                                                 Transformer-FeedForward-Norm[6][0
                                                                 Transformer-FeedForward-Norm[7][0
                                                                 Transformer-FeedForward-Norm[7][0
                                                                 Transformer-FeedForward-Norm[7][0
                                                                 Transformer-FeedForward-Norm[8][0
                                                                 Transformer-FeedForward-Norm[8][0
                                                                 Transformer-FeedForward-Norm[8][0
                                                                 Transformer-FeedForward-Norm[9][0
                                                                 Transformer-FeedForward-Norm[9][0
                                                                 Transformer-FeedForward-Norm[9][0
                                                                 Transformer-FeedForward-Norm[10][
                                                                 Transformer-FeedForward-Norm[10][
                                                                 Transformer-FeedForward-Norm[10][
__________________________________________________________________________________________________
Transformer-MultiHeadSelfAttent (None, None, 768)    0           Embedding-Mapping[0][0]          
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward-Norm[0][0
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward-Norm[1][0
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward-Norm[2][0
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward-Norm[3][0
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward-Norm[4][0
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward-Norm[5][0
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward-Norm[6][0
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward-Norm[7][0
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward-Norm[8][0
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward-Norm[9][0
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward-Norm[10][
                                                                 Transformer-MultiHeadSelfAttentio
__________________________________________________________________________________________________
Transformer-MultiHeadSelfAttent (None, None, 768)    1536        Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
__________________________________________________________________________________________________
Transformer-FeedForward (FeedFo (None, None, 768)    4722432     Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-MultiHeadSelfAttentio
__________________________________________________________________________________________________
Transformer-FeedForward-Add (Ad (None, None, 768)    0           Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward[0][0]    
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward[1][0]    
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward[2][0]    
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward[3][0]    
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward[4][0]    
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward[5][0]    
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward[6][0]    
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward[7][0]    
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward[8][0]    
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward[9][0]    
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward[10][0]   
                                                                 Transformer-MultiHeadSelfAttentio
                                                                 Transformer-FeedForward[11][0]   
__________________________________________________________________________________________________
Transformer-FeedForward-Norm (L (None, None, 768)    1536        Transformer-FeedForward-Add[0][0]
                                                                 Transformer-FeedForward-Add[1][0]
                                                                 Transformer-FeedForward-Add[2][0]
                                                                 Transformer-FeedForward-Add[3][0]
                                                                 Transformer-FeedForward-Add[4][0]
                                                                 Transformer-FeedForward-Add[5][0]
                                                                 Transformer-FeedForward-Add[6][0]
                                                                 Transformer-FeedForward-Add[7][0]
                                                                 Transformer-FeedForward-Add[8][0]
                                                                 Transformer-FeedForward-Add[9][0]
                                                                 Transformer-FeedForward-Add[10][0
                                                                 Transformer-FeedForward-Add[11][0
__________________________________________________________________________________________________
CLS-token (Lambda)              (None, 768)          0           Transformer-FeedForward-Norm[11][
__________________________________________________________________________________________________
dense_21 (Dense)                (None, 12)           9228        CLS-token[0][0]                  
==================================================================================================
Total params: 9,966,604
Trainable params: 9,966,604
Non-trainable params: 0
__________________________________________________________________________________________________

evaluator = Evaluator()
model.fit(
        train_generator.forfit(),
        steps_per_epoch=len(train_generator),
        epochs=1,
        callbacks=[evaluator]
    )

model.load_weights('best_model.weights')
print(u'final test acc: %05f\n' % (evaluate(test_generator)))

Epoch 1/1
2355/2355 [==============================] - 1663s 706ms/step - loss: 2.5211 - accuracy: 0.0876
val_acc: 0.08493, best_val_acc: 0.08493, test_acc: 0.08333

final test acc: 0.083333

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
ilmss 2022-02-03 13:31
关注
在多标签文本分类的训练过程中，在多元文本分类的训练过程中，Loss一般在0.1-0.2之间的时候，模型基本上已经收敛。但是，看题主的这个，在多标签文本分类(这个框架下)的情况下，Loss往往要达到0.0001-0.001之间，模型才收敛。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1

无用 1
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

问下使用albert 进行多标签的文本分类[12个类别],为啥 acc 才这么点,是哪里没写对么? bert nlp
2022-02-03 10:23

回答 2 已采纳在多标签文本分类的训练过程中，在多元文本分类的训练过程中，Loss一般在0.1-0.2之间的时候，模型基本上已经收敛。但是，看题主的这个，在多标签文本分类(这个框架下)的情况下，Loss往往要达到0.
为啥加上第三句和不加上第三句打印出来的结果不一样？不都是创建一个字典吗？ python
2021-05-19 19:22

回答 1 已采纳肯定不一样啊第三行不注释的时候 **user_info不会接受其他传参函数体内赋值是定值注释掉后user_info参数是从传进的参数依次赋值的
xPath删除<br>并将多行文本推送到一个数组中 php
2018-05-19 16:56

回答 1 已采纳 When your xpath query is running, the last part is asking for each of the text nodes to be extract
NLP（二十八）多标签文本分类
2020-04-10 10:49

山阴少年的博客多标签文本分类之从电影简介预测影片类型
为什么输出时sb和message没有被替换？ python 开发语言
2021-10-11 23:56

回答 1 已采纳你想替换什么玩意？首先你根本没有对message和sb进行任何操作，为什么会被替换？strip函数是有返回值的，它像切片操作一样返回的是一个副本，并不会改变字符串本身
深度学习模型ALbert程序跑动时出现的问题人工智能有问必答深度学习自然语言处理
2022-01-08 15:36

回答 1 已采纳网页连接超时，被重置，检查一下网址，看看用浏览器可否打开，不行就用代理。
求解这个代码哪里有问题 python
2021-09-17 17:10

回答 1 已采纳两个user，一个写的locating,一个写的location
书写自动智慧：探索Python文本分类器的开发与应用：支持二分类、多分类、多标签分类、多层级分类和Kmeans聚类
2023-08-11 16:54

汀、人工智能的博客书写自动智慧：探索Python文本分类器的开发与应用：支持二分类、多分类、多标签分类、多层级分类和Kmeans聚类
关于arcpy的问题，如何解决？有问必答
2023-04-04 18:09

回答 2 已采纳 result.save(output_path) 改为： arcpy.CopyRaster(result, output_path) 该错误提示说Result Object没有save属性，将保存结
PHP和订购带有数字和文本的数组项 php
2017-02-19 17:58

回答 3 已采纳 It's sorting for Question 1: <?php $arr[] = "(1.) Ben"; $arr[] = "Albert"; $arr[] = "Bill"; $
输入5个字符串只输出以a开头的字符串，注意:按如下所示输出符合条件的字符串 c语言有问必答
2021-11-29 17:24

回答 2 已采纳 #include <stdio.h> int main() { char a[5][100]; int i; for (i=0;i<5;i++) {
Albert处理文本分类任务
2020-12-12 18:59

趋吉避凶的博客文章目录准备工作一、处理数据集二、构建分类任务1.引入库2.配置参数3.读取处理数据4.加载Albert预训练模型5.开始训练6.验证模型总结参考文献准备工作预训练模型下载地址：Albert_Large_zh 数据集下载地址：事故...
我的win10+vs2013+opencv249+cuda8.0项目升级到vs2019上不能用了，怎么办？ c++ 机器学习深度学习
2020-09-01 09:55

回答 2 已采纳 cdua的版本要和你显卡的型号配套，opencv的版本最好别换，4和2版本相差的太多了，还有opencv路径的配置，cuda的配套C的驱动包这些都看看是否正确
transformers文本分类
2024-02-27 12:35

灯下夜无眠的博客 文本分类是最常见的NLP任务之一，做其他NLP任务处理时的步骤流程基本一样，主要在于不同任务需要做不同的数据处理，下面介绍如何使用transformers做文本分类的一个大致流程。
中文文本分类：基于PyTorch的多模型中文文本分类
2020-03-01 12:55

study for happy的博客本文基于PyTorch实现多个模型对中文文本进行分类、比较任务，分别为在序列维度上取平均得到句子表示的简单AVG基线模型、使用[2,3,4]kernel size后concate的CNN模型、双向LSTM模型及BERT模型。项目代码： BERT中文预...
NLP-多标签文本分类
2021-10-24 17:10

lulu_Records的博客本文将会讲述如何实现多标签文本分类。什么是多标签分类？在分类问题中，我们已经接触过二分类和多分类问题了。所谓二（多）分类问题，指的是y值一共有两（多）个类别，每个样本的y值只能属于其中的一个类别...
7个Bert变种模型baseline在7个文本分类数据集上训练和测试
2023-03-20 22:29

德彪稳坐倒骑驴的博客本文使用了下面七个模型 1. BertLSTM 2. BertOrigin 3. BertCNN 4. BertATT 5. BertRCNN 6. BertCNNPlus 7. BertDPCNN 在下面七个数据集上做了训练和测试： IMDB， SST-2, Yelp ，Yahoo! Answers ， AG's News，...
文本分类模型的训练、调优、蒸馏
2023-03-21 10:30

德彪稳坐倒骑驴的博客主题分类判断邮件是否是垃圾邮件情感分析对话系统中的意图识别：如判断聊天用户的意图是“问发货时间”还是问“退换货收货地址。
使用BERT进行中文文本分类
2023-08-15 03:33

禅与计算机程序设计艺术的博客作者：禅与计算机程序设计艺术 1.简介 ...近年来随着深度神经网络(DNNs)在自然语言处理领域的火爆，基于神经网络的机器学习模型越来越多地被应用于处理中文文本数据。其中BERT(Bidirectional Encoder R
文本分类(三) | (6) 番外篇(预训练语言模型的另一种使用方式)
2020-01-31 15:05

CoreJT的博客本篇博客也是对Github优秀文本分类项目的解析，该文本分类项目，主要基于预训练语言模型，包括bert、xlnet、bert/xlnet + CNN/GRU/LSTM、Albert等，使用PyTorch实现。项目其实提供了一种预训练语言模型的通用方法...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 2月3日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 2月3日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月3日

悬赏问题

¥15 Attention is all you need 的代码运行
¥15 一个服务器已经有一个系统了如果用usb再装一个系统，原来的系统会被覆盖掉吗
¥15 使用esm_msa1_t12_100M_UR50S蛋白质语言模型进行零样本预测时，终端显示出了sequence handled的进度条，但是并不出结果就自动终止回到命令提示行了是怎么回事：
¥15 前置放大电路与功率放大电路相连放大倍数出现问题
¥30 关于<main>标签页面跳转的问题
¥80 部署运行web自动化项目
¥15 腾讯云如何建立同一个项目中物模型之间的联系
¥30 VMware 云桌面水印如何添加
¥15 用ns3仿真出5G核心网网元
¥15 matlab答疑关于海上风电的爬坡事件检测

问下使用albert 进行多标签的文本分类[12个类别],为啥 acc 才这么点,是哪里没写对么?

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新