python textrank 将摘要分别存入csv

请问如何将每一个摘要分别存为csv的一行？

以下是已经有的代码。整个过程是在用textrank提取多个文献的摘要

import sys
from imp import reload
import os
 
try:
    reload(sys)
    sys.setdefaultencoding('utf-8')
except:
    pass
 
import codecs
from textrank4zh import TextRank4Keyword, TextRank4Sentence
 
def work(file):
    # 打开并读取文本文件
 
    text = codecs.open(file, 'r', 'utf-8').read()
 
    # 创建分词类的实例
 
    tr4w = TextRank4Keyword()
 
    # 对文本进行分析，设定窗口大小为2，并将英文单词小写
 
    tr4w.analyze(text=text, lower=True, window=2)
 
    """输出"""
 
    print('关键词为：')
 
    # 从关键词列表中获取前20个关键词
 
    for item in tr4w.get_keywords(num=20, word_min_len=1):
        print(item.word, item.weight)
        print('\n')
        print('关键短语为：')
    # 从关键短语列表中获取关键短语
 
    for phrase in tr4w.get_keyphrases(keywords_num=20, min_occur_num=2):
        print(phrase)
        print('\n')
    # 创建分句类的实例
 
    tr4s = TextRank4Sentence()
 
    # 英文单词小写，进行词性过滤并剔除停用词
 
    tr4s.analyze(text=text, lower=True, source='no_filter')
 
    print('摘要为：')
 
    # 抽取3条句子作为摘要
 
    for item in tr4s.get_key_sentences(num=3):
        # 打印句子的索引、权重和内容
        print(item.index, item.weight, item.sentence)
 
def check_all_files(check_path):
    list_files = []
    # 列出文件夹下所有文件
    cur_list = os.listdir(check_path)
    for i in range(0 ,len(cur_list)):
        file_path = os.path.join(check_path, cur_list[i])
        if os.path.isfile(file_path):
            if cur_list[i].upper()[-4:]=='.TXT':
                list_files.append([cur_list[i], file_path])
    return list_files
 
 
f_lst = check_all_files(r"/Users/xiongying/Desktop")
 
for f in f_lst:
    print("处理",f[0])
    work(f[1])

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

陈年椰子 2022-03-27 20:50

关注

这样试试，我代码里写了注释

import sys
from imp import reload
import os

try:
    reload(sys)
    sys.setdefaultencoding('utf-8')
except:
    pass

import codecs
from textrank4zh import TextRank4Keyword, TextRank4Sentence

def work(file):
    # file = r'/Users/xiongying/Desktop/有关农业经济的几个问题_许涤新.txt'

    # 打开并读取文本文件

    text = codecs.open(file, 'r', 'utf-8').read()

    # 创建分词类的实例

    tr4w = TextRank4Keyword()

    # 对文本进行分析，设定窗口大小为2，并将英文单词小写

    tr4w.analyze(text=text, lower=True, window=2)

    """输出"""

    print('关键词为：')

    # 从关键词列表中获取前20个关键词

    for item in tr4w.get_keywords(num=20, word_min_len=1):
        print(item.word, item.weight)
        print('\n')
        print('关键短语为：')
    # 从关键短语列表中获取关键短语

    for phrase in tr4w.get_keyphrases(keywords_num=20, min_occur_num=2):
        print(phrase)
        print('\n')
    # 创建分句类的实例

    tr4s = TextRank4Sentence()

    # 英文单词小写，进行词性过滤并剔除停用词

    tr4s.analyze(text=text, lower=True, source='no_filter')

    print('摘要为：')

    # 抽取3条句子作为摘要
    zy = []

    for item in tr4s.get_key_sentences(num=3):
        # 打印句子的索引、权重和内容
        print(item.index, item.weight, item.sentence)
        zy.append(" , ".join([item.index, item.weight, item.sentence]))
    # 这里返回摘要信息
    return "\n".join(zy)

def check_all_files(check_path):
    list_files = []
    # 列出文件夹下所有文件
    cur_list = os.listdir(check_path)
    for i in range(0 ,len(cur_list)):
        file_path = os.path.join(check_path, cur_list[i])
        if os.path.isfile(file_path):
            if cur_list[i].upper()[-4:]=='.TXT':
                list_files.append([cur_list[i], file_path])
    return list_files


f_lst = check_all_files(r"/Users/xiongying/Desktop")
with open("you_zy.csv", 'a') as csv_file:
    for f in f_lst:
        print("处理",f[0])
        # 写入摘要文件
        csv_file.write("{}\n".format(work(f[1])))

本回答被题主选为最佳回答 , 对您是否有帮助呢?

1人已打赏

报告相同问题？

关注问题

Python实现列表数据存入txt、csv、excel文件
2025-07-01 08:50

本篇内容将详细介绍如何使用Python将列表数据存储到文本文件（txt）、逗号分隔值文件（csv）以及Excel电子表格文件中。掌握这些技术对于进行数据分析和处理尤为重要，能够帮助开发者有效地管理和分析大量数据。在...
python数据爬取美食网站xpath解析并将美食数据存入csv文件按照人气数据分析可视化
2023-07-04 22:31

存储到CSV文件：代码在每次循环中，通过csv库将美食数据存储到CSV文件中。以追加写入的方式打开CSV文件，使用csv.writer写入每一行的数据，确保数据的完整性和格式正确。数据可视化：代码使用pandas库读取CSV文件...
python中csv、json文件的写入和读取
2021-01-20 03:33

txt文本文件读取： #txt文本文件读取 def txt_writter(): 写文件#函数说明文档 with open('data.txt','w',encoding='utf-8') as f: f.write('hi\n')#写一行 lines = [ 'hello\n' 'welcome\n' ...
python将list按列存入csv
2022-03-16 09:09

是织梦者啊的博客 python画图调格式不方便，但是写代码的过程中忘记将数据存入csv了，这里list按列存入csv 代码如下（示例） import csv filePath = 'csv文件夹所处的位置，包含.csv' list1 = [1,2,3,4] list2 = [4,2,3,4] list3 = ...
Python 将CSV文件数据存入Mysql数据库
2023-02-02 14:43

酒酿小圆子～的博客 1、get_data函数打开文件csv文件，通过open方法打开文件（python文件实现了迭代器协议），然后使用with语句来迭代读取csv文件，然后存入命名元组，可以使用列名作为下标访问元组中的内容。我们有一个名为student....
Python 将数据写入CSV文件
2019-04-27 14:30

十八水的博客 python 将数据写入csv文件 1 介绍CSV 逗号分隔值（Comma-Separated Values，CSV，也称为字符分隔值，分隔字符也可以不是逗号）。保存形式其文件以纯文本形式存储表格数据（数字和文本）。纯文本意味着该...
Python将一个CSV文件里的数据追加到另一个CSV文件的方法
2020-09-20 07:13

本篇文章将详细介绍如何使用Python将一个CSV文件中的数据追加到另一个CSV文件。首先，我们需要导入`csv`模块。`csv`模块提供了一系列方法，如`reader`和`writer`，用于读取和写入CSV文件。要实现数据追加，我们...
python 循环读取txt文档并转换成csv的方法
2020-09-20 00:25

在提供的内容中，描述了如何使用Python语言来循环读取文本文件（txt）并将其转换成逗号分隔值文件（csv）。该方法对于处理包含数据的文本文件非常有用，尤其是在数据需要导入到电子表格程序或数据库中进行进一步分析...
详解使用python读写csv，以及将csv数据写入数据库
2024-11-07 19:46

仙草哥哥的博客 csv是一种非常方便的数据格式，那么，怎么样在python中进行csv的读写呢？又为什么说不要通过循环和split自行分隔呢？
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 4月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月27日

python textrank 将摘要分别存入csv

1条回答 默认 最新

问题事件

1条回答默认最新