wl2020mxxb
2021-10-26 21:51
采纳率: 33.3%
浏览 28
已结题

大神们,请问如何统计文件夹下的所有txt的字符数和汉字数,并统计到表格中

最终表格是
文件名 字符数 汉字数
txt1 100 20
txt2 523 214
txt3 214 30
……
……
步骤是
1、建一个tj表
2. 循环打开文件夹下txt
统计 txt1的文件名,字符数,汉字数
获取以上内容
打开tj表,
追加写入txt1的内容(在循环内不断追加)
请问如何实现呢?感谢各位大神

  • 写回答
  • 好问题 提建议
  • 追加酬金
  • 关注问题
  • 收藏
  • 邀请回答

3条回答 默认 最新

  • 辉煌仪奇 2021-10-27 11:30
    已采纳
    import os
    import re
    
    with open('tj.csv', 'w+') as tj:
        tj.write('文件名,字符数,汉字数\n')
    
        for i in os.listdir(r'.'):
            hanz = 0
            zifu = 0
            if 'txt' in i:
                with open(i, 'a+') as f:
                    txt = f.read()
                    hanz += len(re.findall('[\u4e00-\u9fa5]', txt))
                    zifu += len(re.findall('[A-Za-z0-9]', txt))
                tj.write(f'{i}, {zifu}, {hanz}\n')
    

    img

    img

    img

    img

    评论
    解决 1 无用
    打赏 举报
查看更多回答(2条)

相关推荐 更多相似问题