编写程序,统计文txt件中出现的所有中文字符及标点符号的数量,每个字符及数量之间用冒号:分隔,例如“文:1024”,将所有字符及数量的对应采用逗号分隔,以CSV文件格式保存到“字符统计.txt”文件中。
哪位大佬知道怎么做,求告知,
万分感谢!!
如有帮助 请点击采纳哦 谢谢~
import string
import codecs
punc = string.punctuation
with open("test.txt", "r" ,encoding='utf-8') as f: # 打开文件
in_str = f.read() # 读取文件
listTmp = []
listSet = []
res = {}
for c in in_str:
listTmp.append(c)
listSet = list(set(listTmp))
for t in listSet:
if '\u4e00' <= t <= '\u9fff' or str(t) in punc:
res[t] = listTmp.count(t)
print(str(res))
output = codecs.open('res.txt', 'w',encoding='utf-8')
output.write(str(res))
output.close()