python读取csv文件遇到编码问题（自己批量生成多条摘要形成的csv）

问题遇到的现象和发生背景已经从多个text中、使用textrank选取了摘要、形成了一个csv文件。但再读取这个csv的时候一直报错：

从text批量生成摘要csv的代码：

import sys
from imp import reload
import os
 
try:
    reload(sys)
    sys.setdefaultencoding('utf-8')
except:
    pass
 
import codecs
from textrank4zh import TextRank4Keyword, TextRank4Sentence
 
def work(file):
    # 打开并读取文本文件
 
    text = codecs.open(file, 'r', 'utf-8').read()
 
    # 创建分词类的实例
 
    tr4w = TextRank4Keyword()
 
    # 对文本进行分析，设定窗口大小为2，并将英文单词小写
 
    tr4w.analyze(text=text, lower=True, window=2)
 
    """输出"""
 
    print('关键词为：')
 
    # 从关键词列表中获取前20个关键词
 
    for item in tr4w.get_keywords(num=20, word_min_len=1):
        print(item.word, item.weight)
        print('\n')
        print('关键短语为：')
    # 从关键短语列表中获取关键短语
 
    for phrase in tr4w.get_keyphrases(keywords_num=20, min_occur_num=2):
        print(phrase)
        print('\n')
    # 创建分句类的实例
 
    tr4s = TextRank4Sentence()
 
    # 英文单词小写，进行词性过滤并剔除停用词
 
    tr4s.analyze(text=text, lower=True, source='no_filter')
 
    print('摘要为：')
 
    # 抽取1条句子作为摘要
    zy = []
 
    for item in tr4s.get_key_sentences(num=3):
        # 打印句子的索引、权重和内容
        print(item.index, item.weight, item.sentence)
        zy.append("{} , {} , {}".format(item.index, item.weight, item.sentence))
    # 这里返回摘要信息
    return "\n".join(zy)
 
def check_all_files(check_path):
    list_files = []
    # 列出文件夹下所有文件
    cur_list = os.listdir(check_path)
    for i in range(0 ,len(cur_list)):
        file_path = os.path.join(check_path, cur_list[i])
        if os.path.isfile(file_path):
            if cur_list[i].upper()[-4:]=='.TXT':
                list_files.append([cur_list[i], file_path])
    return list_files
 
 
f_lst = check_all_files(r"/Users/xiongying/Desktop/测试3")
with open("1983ceshi.csv", 'a') as csv_file:
    for f in f_lst:
        print("处理",f[0])
        # 写入摘要文件
        csv_file.write("{}\n".format(work(f[1])))

读取csv的代码：

data = pd.read_csv('/Users/xiongying/Desktop/测试3/1983ceshi.csv',encoding ='utf-8')  # 读取训练数据
data=data.astype(str)#转化为字符型用于后续分词和建模

data

这一步就报错了：

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-95-7d137b2fe881> in <module>
      1 # 测试-读取数据
      2 data = pd.read_csv('/Users/xiongying/Desktop/测试3/1983ceshi.csv',encoding ='utf-8')  # 读取训练数据
----> 3 data=data.astype(str)#转化为字符型用于后续分词和建模
      4 
      5 data

/opt/anaconda3/lib/python3.8/site-packages/pandas/core/generic.py in astype(self, dtype, copy, errors)
   5875         else:
   5876             # else, only a single dtype is given
-> 5877             new_data = self._mgr.astype(dtype=dtype, copy=copy, errors=errors)
   5878             return self._constructor(new_data).__finalize__(self, method="astype")
   5879 

/opt/anaconda3/lib/python3.8/site-packages/pandas/core/internals/managers.py in astype(self, dtype, copy, errors)
    629         self, dtype, copy: bool = False, errors: str = "raise"
    630     ) -> "BlockManager":
--> 631         return self.apply("astype", dtype=dtype, copy=copy, errors=errors)
    632 
    633     def convert(

/opt/anaconda3/lib/python3.8/site-packages/pandas/core/internals/managers.py in apply(self, f, align_keys, ignore_failures, **kwargs)
    425                     applied = b.apply(f, **kwargs)
    426                 else:
--> 427                     applied = getattr(b, f)(**kwargs)
    428             except (TypeError, NotImplementedError):
    429                 if not ignore_failures:

/opt/anaconda3/lib/python3.8/site-packages/pandas/core/internals/blocks.py in astype(self, dtype, copy, errors)
    624 
    625         if dtype is not None:
--> 626             dtype = pandas_dtype(dtype)
    627 
    628         # may need to convert to categorical

/opt/anaconda3/lib/python3.8/site-packages/pandas/core/dtypes/common.py in pandas_dtype(dtype)
   1797     # raise a consistent TypeError if failed
   1798     try:
-> 1799         npdtype = np.dtype(dtype)
   1800     except SyntaxError as err:
   1801         # np.dtype uses `eval` which can raise SyntaxError

TypeError: data type '正确认识社会产品、国民收入的生产、分配和使用_钱伯海.txt' not understood

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
陈年椰子 2022-03-29 12:21
关注
data=data.astype(str) 改成 data.astype(str)
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

python读取csv文件遇到编码问题（自己批量生成多条摘要形成的csv）
2022-03-29 11:58

地推的博客问题遇到的现象和发生背景已经从多个text中、使用textrank选取了摘要、形成了一个csv文件。但再读取这个csv的时候一直报错：从text批量生成摘要csv的代码： import sys from imp import reload ...
python读取csv文件
2022-09-26 18:25

东城青年的博客 python读取csv文件
苹果电脑python读取csv_mac中python读取csv文件编码报错问题解决
2021-02-05 21:52

一不小心就来了的博客使用如下命令行读取csv文件,with open('city.csv') as f:lines = f.readlines()出现了报错：‘utf-8’ codec can’t decode byte 0xb1 in position 0: invalid start byte含义为程序由于文件编码问题无法读取文件。...
python readcsv读取gbk编码文件_怎么利用python解决csv文件读写乱码问题?
2020-12-19 11:12

weixin_39719727的博客怎么利用python解决csv文件读写乱码问题?今天番茄加速就来说一下。首先，导入3个模块：# coding: utf-8# @author: zhenguo# @date: 2020-12-16# @describe: functions about automatic file processingimport pandas...
python读取csv失败_python读取csv文件遇到的问题
2020-12-07 19:33

weixin_39846553的博客 CSV文件如下：报错①：取csv文件语句：df = pd.read_csv(file_path ,skip_blank_lines=True,header=None)报错：b'Skipping line 7: expected 2 fields, saw 3刚开始没有注意这个错误，只是想要读取某一行的时候一直...
Python读取CSV文件的几种方法！
2024-08-31 11:07

Python_trys的博客下面是一个示例代码： import pandas as pd # 读取CSV文件 data = pd.read_csv('data.csv') # 打印读取的数据``print(data) 这就是使用Python读取CSV文件的方法。你可以根据实际的情况对读取到的数据进行处理和分析...
python读取CSV文件并生成折线图
2023-09-16 08:45

Lucas在澳洲的博客本文详细介绍了如何使用Python读取CSV文件并生成折线图。通过使用pandas处理CSV文件，结合matplotlib进行数据可视化，您可以轻松地分析和展示数据。我们展示了如何读取数据、绘制折线图、定制图表样式、添加网格和...
python readcsv读取gbk编码文件_python读写csv文件
2021-03-17 02:11

月临扉的博客 Separated Values，CSV，有时也称为字符分隔值，因为分隔字符也可以不是逗号)，其文件以纯文本形式存储表格数据(数字和文本)读csv文件1、首先导入CSV模板2、创建一个CSV文件对象3、打开文件进行读取 #coding:utf-8...
python读取csv文件表头_Python读取CSV文件
2020-11-29 18:12

weixin_39538536的博客读取CSV文件Iterable:是一个行迭代器Dialect:默认的读取方式是以excel的形式去读下面是准备的csv格式的文档，我们来用python读取读取操作：读取结果如下：['class', 'name', 'sex', 'height', 'year']['1', '...
python 批量读取csv_python批量读取csv文件
2021-03-17 03:24

TBLa的博客 python如何读取CSV文件一部分数据Python如何批量读取CSV文件并写入TXT？如何用python把多个csv文件数据处理后汇总到新csv文件python对多个csv文件里提取指定列汇总到一个新生成python对多个csv 文件(位于不同目录)...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 4月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月29日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月29日

python读取csv文件遇到编码问题（自己批量生成多条摘要形成的csv）

问题遇到的现象和发生背景 已经从多个text中、使用textrank选取了摘要、形成了一个csv文件。但再读取这个csv的时候一直报错：

从text批量生成摘要csv的代码：

读取csv的代码：

这一步就报错了：

2条回答 默认 最新

问题事件

问题遇到的现象和发生背景已经从多个text中、使用textrank选取了摘要、形成了一个csv文件。但再读取这个csv的时候一直报错：

2条回答默认最新