如何输出抽取的实体个数？

采用UIE抽取实体时，len（result）只能输出实体类型的个数为6个，我如何修改代码才能输出具体抽取的实体个数呢？

#抽取实体
from pprint import pprint
import json
from paddlenlp import Taskflow

def openreadtxt(file_name):
    data = []
    file = open(file_name,'r',encoding='UTF-8')  #打开文件
    file_data = file.readlines() #读取所有行
    for row in file_data:
        data.append(row) #将每行数据插入data中     
    return data

data_input=openreadtxt('./input/中长期规划.txt')   

schema = ["战略定位", "财税支持", "政策目标", "产业体系", "建设应用", "制度保障", "组织实施"]
few_ie = Taskflow('information_extraction', schema=schema, batch_size=1,task_path='./checkpoint/model_best')

results=few_ie(data_input)

info_count = sum(len(result) for result in results)

with open("./output/out中长期规划.txt", "w+",encoding='UTF-8') as f:    #写入文件，若文件不存在则会先创建再写入，但不会覆盖原文件，而是追加在文件末尾
    for result in results:
        line = json.dumps(result, ensure_ascii=False)  #对中文默认使用的ascii编码.想输出真正的中文需要指定ensure_ascii=False
        f.write(line + "\n")

print("抽取实体个数：", info_count)
for idx, text in enumerate(data_input):
    print(results[idx])

下面是输出的内容

抽取实体个数： 6
{'财税支持': [{'text': '强化财政金融支持', 'start': 6885, 'end': 6893, 'probability': 0.9977543776663893}], '政策目标': [{'text': '10-20 万吨', 'start': 2282, 'end': 2290, 'probability': 0.8295114755887738}, {'text': '5 万辆', 'start': 2256, 'end': 2260, 'probability': 0.8832630322984194}], '产业体系': [{'text': '着力打造产业创新支撑平台', 'start': 2951, 'end': 2963, 'probability': 0.888475244401107}, {'text': '积极开展氢能技术创新国际合作', 'start': 3462, 'end': 3476, 'probability': 0.9399201726605249}], '建设应用': [{'text': '统筹推进氢能基础设施建设', 'start': 3631, 'end': 3643, 'probability': 0.683781604701359}, {'text': '合理布局制氢设施', 'start': 3721, 'end': 3729, 'probability': 0.9262853188766407}, {'text': '有序推进交通领域示范应用', 'start': 4319, 'end': 4331, 'probability': 0.8531930510891073}, {'text': '稳步推进氢能多元化示范应用', 'start': 4214, 'end': 4227, 'probability': 0.9259579090671508}, {'text': '积极开展储能领域示范应用', 'start': 4496, 'end': 4508, 'probability': 0.9929209466887414}, {'text': '逐步探索工业领域替代应用', 'start': 4863, 'end': 4875, 'probability': 0.9958242233518462}, {'text': '合理布局发电领域多元应用', 'start': 4658, 'end': 4670, 'probability': 0.9987073774893602}, {'text': '储能', 'start': 5195, 'end': 5197, 'probability': 0.55036255874505}], '制度保障': [{'text': '建立完善氢能产业标准体系', 'start': 5861, 'end': 5873, 'probability': 0.9817167318170696}, {'text': '建立健全氢能政策体系', 'start': 5640, 'end': 5650, 'probability': 0.9342529675982405}, {'text': '加强全链条安全监管', 'start': 6079, 'end': 6088, 'probability': 0.8695369867737313}], '组织实施': [{'text': '充分发挥统筹协调机制作用', 'start': 6469, 'end': 6481, 'probability': 0.4291306701117037}, {'text': '加强全链条安全监管', 'start': 6079, 'end': 6088, 'probability': 0.9854434161541015}, {'text': '做好规划督导评估', 'start': 7152, 'end': 7160, 'probability': 0.992682947623166}]}

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
老牛毕设 2023-10-11 09:45
关注
在你的代码中，few_ie这个Taskflow对象是用来进行信息抽取的，它返回的结果是一个列表，每个元素是一个字典，字典的键是实体类型的名称，值是相应的实体列表。

如果你想输出每个实体类型的具体抽取的实体个数，你可以修改代码如下：

# 其他部分不变 info_count_by_type = {} for result in results: for entity_type, entities in result.items(): count = len(entities) info_count_by_type[entity_type] = info_count_by_type.get(entity_type, 0) + count with open("./output/out中长期规划.txt", "w+",encoding='UTF-8') as f: for result in results: line = json.dumps(result, ensure_ascii=False) f.write(line + "\n") print("每个实体类型的抽取个数：", info_count_by_type)

这段代码会输出每个实体类型抽取的个数，并保存在info_count_by_type字典中。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

人工智能-项目实践-实体抽取-中文命名实体识别，实体抽取，tensorflow，pytorch，BiLSTM+CRF
2022-03-30 21:46

中文命名实体识别，实体抽取，tensorflow，pytorch，BiLSTM+CRF data文件夹中有三个开源数据集可供使用，玻森数据 (https://bosonnlp.com) 、1998年人民日报标注数据、MSRA微软亚洲研究院开源数据。其中boson数据集...
实现AI Agent的实体识别与关系抽取
2025-03-29 14:22

光子AI的博客实体识别与关系抽取是自然语言处理（NLP）中的关键任务，对于AI Agent而言，准确地识别文本中的实体以及它们之间的关系至关重要。本文的目的在于详细阐述如何实现AI Agent的实体识别与关系抽取功能，涵盖从基础概念...
农业知识图谱：农业领域的信息检索+智能问答，命名实体识别，关系抽取，实体关系查询
2023-07-02 10:27

- labels.txt： 5000多个手工标注的实体类别 - predict_labels.txt: KNN算法预测的15W多个实体的类别 - /wikidataSpider/wikidataProcessing/wikidata_relation.csv: predict_labels.txt中实体在wikidata中对应的...
基于python实现中文医学文本实体关系抽取源码.zip
2023-10-05 14:03

基于python实现中文医学文本实体关系抽取源码.zip 代码完整下载可用，确保可以运行。基于python实现中文医学文本实体关系抽取源码.zip 代码完整下载可用，确保可以运行。基于python实现中文医学文本实体关系抽取...
中文实体提及抽取方法
2025-10-23 01:19

实体提及抽取是自然语言处理中的一个基础任务，它旨在从文本中识别和提取实体信息，这包括人名、地名、机构名等命名实体，以及指代同一实体的名词和代词。本文介绍了一种创新的中文实体提及抽取方法Un-MenEx，该方法...
实体与关系抽取研究
2025-09-03 00:02

随着技术的进步，实体与关系抽取在许多领域都发挥着越来越重要的作用，如智能搜索、舆情分析、法律文书分析等。最新的研究进展和未来方向也在书中得到总结。例如，对预训练语言模型的进一步优化，使得模型对实体和...
基于Python的中文信息实体抽取、关系抽取、事件抽取源码+数据集+训练好的模型+项目说明.zip
2024-01-09 19:59

该资源主要针对计算机、通信、人工智能、自动化等相关专业的学生、老师或从业者下载使用，亦可作为期末课程设计、课程大作业、毕业设计等。项目整体具有较高的学习借鉴价值！基础能力强的可以在此基础上修改调整，...
基于深度学习的医学实体抽取.zip
2025-10-15 09:05

在深度学习的不断发展中，...基于深度学习的医学实体抽取是当前人工智能技术在医疗领域应用的一个热点话题。通过构建复杂而高效的模型，可以极大地提升医学信息处理的效率和质量，为医疗研究和临床实践带来积极影响。
基于BiLSTM_CRF的实体抽取
2025-01-09 11:04

电子海鸥的博客简述基于BiLSTM_CRF的实体抽取方法~
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月11日

如何输出抽取的实体个数？

2条回答 默认 最新

问题事件

2条回答默认最新