BERT_CCPoem相关问题

第一次使用BERT_CCPoem，能不能帮忙看看有什么问题。

import pandas as pd
from transformers import BertTokenizer, BertForSequenceClassification
import torch

#读取Excel表格数据
excel_file = 'C:\\Users\\86166\\Desktop\\tangshi_Cdata.xlsx'
df = pd.read_excel(excel_file)
#初始化BERT模型和tokenizer
tokenizer = BertTokenizer.from_pretrained("C:\\Users\\86166\\Desktop\\BERT_CCPoem_v1")
model = BertForSequenceClassification.from_pretrained("C:\\Users\\86166\\Desktop\\BERT_CCPoem_v1", num_labels=2)  # 二分类情感分析模型
def analyze_sentiments(poetry_texts):
    #使用tokenizer将文本转换为模型所需的input_ids张量
    inputs = tokenizer(poetry_texts, return_tensors='pt', padding=True, truncation=True)
    # 输入input_ids到模型中，获取模型输出
    outputs = model(**inputs)
    #获取模型预测的情感分数
    logits = outputs.logits
    probabilities = torch.softmax(logits, dim=1)
    positive_scores = probabilities[:, 1].tolist()
    return positive_scores

#对每首诗进行情感分析
batch_size = 8
sentiment_scores = []
poetry_texts_batch = []

for index, row in df.iterrows():
    poetry_text = row['古诗内容']
    poetry_texts_batch.append(poetry_text)

    if len(poetry_texts_batch) == batch_size:
        #批处理情感分析
        batch_scores = analyze_sentiments(poetry_texts_batch)
        sentiment_scores.extend(batch_scores)
        poetry_texts_batch = []

#处理剩余的文本
if poetry_texts_batch:
    batch_scores = analyze_sentiments(poetry_texts_batch)
    sentiment_scores.extend(batch_scores)

# 将情感分数保存到DataFrame中
df['情感分数'] = sentiment_scores
# 将带有情感分数的DataFrame保存回Excel文件
output_file = 'C:\\Users\\86166\\Desktop\\tangshi_sentiment.xlsx'
df.to_excel(output_file, index=False)

print(f"情感分数已保存到 {output_file}")

以上是部分运行结果

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

CSDN-Ada助手 CSDN-AI 官方账号 2024-01-02 22:27

关注

【以下回答由 GPT 生成】

首先，需要检查以下几个问题：

BERT_CCPoem模型和tokenizer的路径是否正确。请确保路径指向正确的模型文件夹。
是否正确导入了必要的库和模块。确保已正确安装所需的库和模块（如pandas、transformers和torch）。
数据文件的路径是否正确。请确保excel_file变量中的路径指向正确的Excel文件。
数据格式是否正确。检查Excel文件中是否存在名为"古诗内容"的列，并且该列包含需要进行情感分析的文本数据。
必要的模型配置是否正确。检查BertForSequenceClassification实例化时传递的参数是否正确，确保模型的输出与你的问题相关。
是否正确使用tokenizer。在tokenizer函数中，检查是否使用了正确的输入文本数据，并确认返回的inputs张量是否包含正常的内容。

根据这些问题，下面是一份你所提供代码的改进版：

import pandas as pd
from transformers import BertTokenizer, BertForSequenceClassification
import torch

# 读取Excel表格数据
excel_file = 'C:\\Users\\86166\\Desktop\\tangshi_Cdata.xlsx'
df = pd.read_excel(excel_file)

# 初始化BERT模型和tokenizer
model_path = "C:\\Users\\86166\\Desktop\\BERT_CCPoem_v1"
tokenizer = BertTokenizer.from_pretrained(model_path)
model = BertForSequenceClassification.from_pretrained(model_path, num_labels=2)  # 二分类情感分析模型

def analyze_sentiments(poetry_texts):
    # 使用tokenizer将文本转换为模型所需的input张量
    inputs = tokenizer(poetry_texts, return_tensors='pt', padding=True, truncation=True)

    # 输入input张量到模型中，获取模型输出
    outputs = model(**inputs)

    # 获取模型预测的情感分数
    logits = outputs.logits
    probabilities = torch.softmax(logits, dim=1)
    positive_scores = probabilities[:, 1].tolist()

    return positive_scores

# 对每首诗进行情感分析
batch_size = 8
sentiment_scores = []
poetry_texts_batch = []

for index, row in df.iterrows():
    poetry_text = row['古诗内容']
    poetry_texts_batch.append(poetry_text)

    if len(poetry_texts_batch) == batch_size:
        # 批处理情感分析
        batch_scores = analyze_sentiments(poetry_texts_batch)
        sentiment_scores.extend(batch_scores)
        poetry_texts_batch = []

# 处理剩余的文本
if poetry_texts_batch:
    batch_scores = analyze_sentiments(poetry_texts_batch)
    sentiment_scores.extend(batch_scores)

# 将情感分数保存到DataFrame中
df['情感分数'] = sentiment_scores

# 将带有情感分数的DataFrame保存回Excel文件
output_file = 'C:\\Users\\86166\\Desktop\\tangshi_sentiment.xlsx'
df.to_excel(output_file, index=False)

print(f"情感分数已保存到 {output_file}")

请按照上面给出的改进版代码进行尝试，并检查是否解决了问题。如果没有解决问题，请提供相关错误信息以进行进一步的调查。

【相关推荐】

给你找了一篇非常好的博客，你可以看看是否有帮助，链接：ALBert论文阅读笔记-缩减版的bert，模型参数更少，性能更好
除此之外, 这篇博客: 论文笔记 CCL 2020|基于BERT的端到端中文篇章事件抽取中的 2 方法 部分也许能够解决你的问题。

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^

报告相同问题？

关注问题

使用TF2.4 构建bert-Bilstm-crf，出现这样的warning：“CRF Decoding does not work with KerasTensors in TF2.4”，怎么解决？ python tensorflow 自然语言处理
2022-05-19 21:17

回答 3 已采纳解决方法这是个警告，一般可能不影响但如果你想从问题上解决这个警告的话，或许可以尝试下安装这个tf2crf pip install tf2crf 然后 from tf2CRF import CRF
bert模型训练时sklearn.__check_build._check_build问题 bert python sklearn
2023-04-06 17:58

回答 3 已采纳试试以下命令 pip uninstall sklearn pip install numpy scipy pip install scikit-learn
BERT问题，无法解决，求帮助？ bert python tensorflow
2021-07-21 10:53

回答 1 已采纳你要打印这个line的值看看，是不是有两个元素能取到[1] 这个索引
bert_for_corrector:基于bert进行中文文本纠错
2021-03-21 05:21

使用说明保存预训练模型在数据文件夹下├──数据│├──bert_config.json │├──config.json │├──pytorch_model.bin │└──vocab.txt ├──bert_corrector.py ├──config.py ├──logger.py ├──...
跑一个bert模型出了点问题？ pycharm tensorflow 自然语言处理
2022-09-28 13:12

回答 1 已采纳建议你看下这篇博客👉 ：bert模型训练时的一些问题及解决方法
Bert二分类结果分析 bert 分类自然语言处理
2023-03-27 22:47

回答 3 已采纳该回答引用自ChatGPT 有几个可能的原因可以导致risk类别的预测f1-score始终为0：数据不平衡问题：尽管您使用了Focal Loss来改善数据不平衡问题，但如果risk类别的训练数据量非
bert二分类返回值是否可以输出 bert 深度学习自然语言处理
2023-04-13 10:40

回答 1 已采纳是的，对BERT模型进行微调后，可以输出二分类的结果，通常为0和1。在进行相似度分析时，BERT模型可以将两个输入文本编码为向量，然后计算这两个向量之间的相似度得分，将相似度得分输入到一个二元分类器中
bert_bert词向量_BERT_
2021-09-28 19:05

标题中的“BERT”是Bidirectional Encoder Representations from Transformers的缩写，它是由Google在2018年提出的一种预训练语言模型。BERT的核心创新在于它引入了Transformer架构，并且使用了双向Transformer编码...
Bert训练完成的结果该怎么分析？ bert python 自然语言处理
2023-04-07 14:10

回答 2 已采纳 BERT 训练完成后，可以根据准确率、精确率、召回率和 F1 分数等指标进行分析。和前人的这些指标比较。要提高 BERT 模型的准确性，可以尝试以下策略：增加训练次数；更换学习率、优化器、丢弃率；使
bert输出的概率值 bert 人工智能深度学习
2023-04-16 09:38

回答 2 已采纳这个 test_results.tsv 文件中的数据表示了每个输入样本在每个类别上的概率。在你提供的数据中，有两列，因此我猜测你的模型是一个二分类问题。第一列表示属于类别 0 的概率，第二列表示属于类
关于#深度学习#的问题： bert 深度学习自然语言处理
2023-02-11 15:35

回答 4 已采纳有些模型，不是公开的，或者需要一些协议，必须登录才行。你参考下 https://blog.csdn.net/YI_SHU_JIA/article/details/127490591
Python库 | bert_multitask_learning-0.5.7a0.tar.gz
2022-05-12 15:45

资源分类：Python库所属语言：Python 资源全名：bert_multitask_learning-0.5.7a0.tar.gz 资源来源：官方安装方法：https://lanzao.blog.csdn.net/article/details/101784059
bert pytorch bert python pytorch
2023-03-12 09:34

回答 8 已采纳该回答引用GPTᴼᴾᴱᴺᴬᴵ根据您提供的错误信息，可能是因为该目录的完整路径中包含中文字符，而torch.save()函数在保存文件时可能会遇到中文字符的编码问题，从而导致无法保存模型。为了解决这个
bert_chinese_pytorch:伯特中文文本分类
2021-05-10 17:01

伯特中文文本分类是自然语言处理领域中的一个重要应用，它基于BERT（Bidirectional Encoder Representations from Transformers）模型，用于对中文文本进行分类。BERT是由Google在2018年提出的一种预训练语言模型，...
bert.zip_BERT_Bert开源工具_NLP_essential83k
2022-09-22 14:40

bert是目前为止在NLP领域表现最好的一款开源工具，拥有不同规模的预训练模型，当你想要完成某项下游任务时，仅仅需要对bert 提供的预训练模型进行微调即可，大大简化了自己完成部分的架构负责度，而且表现良好。...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月2日

悬赏问题

¥15 35114 SVAC视频验签的问题
¥15 impedancepy
¥15 在虚拟机环境下完成以下，要求截图！
¥15 求往届大挑得奖作品（ppt…）
¥15 如何在vue.config.js中读取到public文件夹下window.APP_CONFIG.API_BASE_URL的值
¥50 浦育平台scratch图形化编程
¥20 求这个的原理图只要原理图
¥15 vue2项目中，如何配置环境，可以在打完包之后修改请求的服务器地址
¥20 微信的店铺小程序如何修改背景图
¥15 UE5.1局部变量对蓝图不可见

BERT_CCPoem相关问题

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新