请问该怎么批量统计文件夹里每个txt文档的中文字数以及英文单词总数，然后再导出呀？

我正在批量提取txt文档的一些关键词词频，之前也统计了文档总字数（代码如下所示），但是后来发现有的文档有中文也有英文，现在想分开统计两种字数，文档中文总字数、文档英文单词总数（是单词，不是字母），请问这应该怎么改代码呀

统计txt的文字数

def file_fenxi(file):
    contents = file.read()
    num_words = len(contents.rstrip())
    return num_words

返回完整的文件名计算文档字数

path_sum = []
for i in file_Name:
    path = path + '/' + i
    path_sum.append(path)
    path = "E:\总txt\"

# 计算文档字数
for i in range(len(path_sum)):
with open(path_sum[i], encoding='utf-8') as file_obj:
nianbao_count = file_fenxi(file_obj)
context_Front_4[i].append(str(nianbao_count))

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
失迹丶 2020-03-01 18:02
关注
中文的话直接读取字符串长度，英文的话分割空格读取数组长度，中英混合的话比较麻烦，空格分割然后for循环判断

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

【Python】WPS
2025-06-11 20:16

宅男很神经的博客在现代数字化办公的浪潮中，WPS Office 作为一...然而，在这些日常操作的背后，隐藏着一个巨大的、尚未被充分挖掘的潜力空间：自动化。想象一下，那些每周、甚至每天都在重复的手动操作：从系统中导出数据，复制粘贴到
工具知识 | Linux 常用命令参考手册
2024-09-10 23:00

TrustZone_的博客每个月的最后一天就比较麻烦了, 需要配合 date 命令和 if 流程语句来实现,这里 if 语句检查明天的日期是不是01，如果是今天就是最后一天,每天中午12点检查今天是不是最后一天then;要执行的指令# 文件名为 linux-...
RealPython 中文系列教程（九十八）
2024-11-12 00:09

绝不原创的飞龙的博客原文：RealPython 协议：CC BY-NC-SA 4.0 如何在 Python 中使用 Redis 原文:# t0]https://realython . com/python-redis/ 在本教程中，您将学习如何将 Python 与 Redis(读作 RED-iss ，或者可能是 REE-diss 或 ...
Bash Shell：从入门到精通
2025-07-28 15:57

莲华君的博客 14.2 小即是美：每个程序只做一件事并做好 14.3 组合的力量：连接程序，协同工作 14.4 沉默是金与文本流的哲学 14.5 从Shell看计算机科学的抽象与分层附录 A. 常用命令速查手册 B. 正则表达式快速参考 C. Bash内建...
Python 人工智能：11~15
2023-04-15 22:26

绝不原创的飞龙的博客原文：Artificial Intelligence with Python 协议：CC BY-NC-SA 4.0 译者：飞龙本文来自【ApacheCN 深度学习译文集】，采用译后编辑（MTPE）流程来尽可能提升效率。不要担心自己的形象，只关心如何实现目标。——...
Python 数据扩充（一）
2025-09-30 00:42

绝不原创的飞龙的博客图像是一个大类别，因为几乎任何事物都可以通过图像来表示，比如人、风景、动物、植物和我们周围的各种物体。图片还可以表现动作，比如运动、手语、瑜伽姿势等等。图像的一个特别富有创意的用法是通过捕捉计算机鼠标...
「干货」Linux 应急响应日志分析命令「详细总结」
2022-02-25 15:29

橙留香Park的博客也许每个人出生的时候都以为这世界都是为他一个人而存在的，当他发现自己错的时候，他便开始长大少走了弯路，也就错过了风景，无论如何，感谢经历转移发布平台通知：将不再在CSDN博客发布新文章，敬请移步知识星球...
JS复习汇总笔记
2023-06-15 19:06

茴香馅饺子~的博客比如我们的程序中有一个值123，这个值我们是需要反复使用的，这个时候我们最好将123这个值赋值给一个变量，然后通过变量去使用123这个值。变量的声明：(用var声明一个变量，ES6不推荐，推荐使用let const声明变量,...
运维攻城狮面试题汇总
2020-05-22 00:12

哦吼吼吼tian的博客报表功能 Elasticsearch特点: 实时分析分布式实时文件存储,将每个字段都编入索引文档导向,所有的对象全部是文档高可用性,易扩展,支持集群(Cluster)、分片和复制(shards和Replicas) 接口友好,支持JSON Logstash...
MySQL数据库教程天花板，mysql安装到mysql高级，强|硬
2022-05-10 19:14

我橘子超酸的博客关系型数据库设计规则一个数据库中可以有多个表，每个表都有一个名字，用来标识自己。表名具有唯一性。表具有一些特性，这些特性定义了数据在表中如何存储，类似Java和Python中 “类”的设计。 4.1 表、记录、...
没有解决我的问题, 去提问

请问该怎么批量统计文件夹里每个txt文档的中文字数以及英文单词总数，然后再导出呀？

统计txt的文字数

返回完整的文件名 计算文档字数

2条回答 默认 最新

返回完整的文件名计算文档字数

2条回答默认最新