dakelqlq 2019-11-03 19:41 采纳率: 100%

浏览 591

已采纳

python怎样把文件夹中的多个中文txt文件，处理成一个.json文件？

图片说明变成乱码了。

图片说明

节选了文件夹中的几个中文文本文档，如同上面的形式，怎么能处理成一个json文件呢？看到网上说为了不报错，得转成utf-8格式，/r/n 替换成/n而且得加上 ensure__ascii=False，但是我不知道怎么加，谢谢各位前辈了！

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
bj_0163_bj 2019-11-05 17:33
关注
文本内容：
安徽
江苏
浙江

上海

with open("F:/test/test.txt","rb") as f:
print(f.read())
输出：
b'\xe5\xae\x89\xe5\xbe\xbd\n\xe6\xb1\x9f\xe8\x8b\x8f\n\xe6\xb5\x99\xe6\xb1\x9f\n\n\xe4\xb8\x8a\xe6\xb5\xb7'

with open("F:/ftp/downloads/downloadfile/test.txt","rb") as f:
print(f.read().decode('utf-8'))
输出：
安徽
江苏
浙江

上海

with open("F:/ftp/downloads/downloadfile/test.txt","rb") as f:
lines=f.readlines()
a=[]
for line in lines:
line=line.strip()
a.append(line.decode('utf-8'))
print(''.join(a))
输出：
安徽江苏浙江上海

够清楚了吧？
写个循环把所有txt读一遍，存成字典就可以了。

import os import json filelist=os.listdir('F:/test1') ##获取txt所在文件夹的所有文件，我放了三个txt,格式跟上面差不多 txts=[] ##循环追加到list中 for i in filelist: with open("F:/test1/"+i,"rb") as f: lines=f.readlines() a=[] for line in lines: line=line.strip() a.append(line.decode('utf-8')) txt=''.join(a) txts.append(txt) f.close() ##输出：['安徽江苏浙江上海', '南京无锡苏州南通', '杭州宁波温州'] #存入json文件 with open('txts.json', 'w') as f: json.dump(txts, f)
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题