wl2020mxxb 2021-10-26 21:51 采纳率: 55.6%
浏览 38
已结题

大神们,请问如何统计文件夹下的所有txt的字符数和汉字数,并统计到表格中

最终表格是
文件名 字符数 汉字数
txt1 100 20
txt2 523 214
txt3 214 30
……
……
步骤是
1、建一个tj表
2. 循环打开文件夹下txt
统计 txt1的文件名,字符数,汉字数
获取以上内容
打开tj表,
追加写入txt1的内容(在循环内不断追加)
请问如何实现呢?感谢各位大神

  • 写回答

3条回答 默认 最新

  • 辉煌仪奇 2021-10-27 11:30
    关注
    import os
    import re
    
    with open('tj.csv', 'w+') as tj:
        tj.write('文件名,字符数,汉字数\n')
    
        for i in os.listdir(r'.'):
            hanz = 0
            zifu = 0
            if 'txt' in i:
                with open(i, 'a+') as f:
                    txt = f.read()
                    hanz += len(re.findall('[\u4e00-\u9fa5]', txt))
                    zifu += len(re.findall('[A-Za-z0-9]', txt))
                tj.write(f'{i}, {zifu}, {hanz}\n')
    

    img

    img

    img

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 11月4日
  • 已采纳回答 10月27日
  • 创建了问题 10月26日