python如何获取文本中字符的个数？不是字节啊

一篇中文文章，里面含有汉字和各种标点符号还有字母数字什么的
现在我要统计汉字的个数和他所占的比例，查到的len（）方法是获取字节数的
比如我用gbk编码，3000字的文章，字节数6800多，这不是我想要的，
我要的是实实在在的汉字的个数，还有整个文本的字符的个数，各位有什么办法没？
python貌似是会自动把我获取到的gbk编码的字符串解码成unicode 很蛋疼啊

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
SnowOnSahara 2017-11-17 13:51
关注
按照encode('utf-8')输出之后，连续3个\x字符就换算为1个汉字，其它字母和数字都没有\x编码。
如果要很完善的话，还要识别空格和\r\n之类的回车换行符

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

1、当出现多行文本字符时，在Python中如何表示？ 2、如何保障中英文混合文本的对齐输出？ python
2022-10-18 09:02

回答 1 已采纳 1.多行文本定义方法1：a='''这是多行文本第二行'''方法2：a='第一行''第二行'方法3：a='第一行\n'+'第二行'2.每个英文字母宽度都不一样，而且英文不能截断单词，要截断必须根据音标截
Python中输入字符串，统计其中数字字符的个数 python
2021-10-07 19:07

回答 1 已采纳 string1=input("请输入一个字符串：") num=0 for ch in string1 : if ch.isdigit() :
python怎么从一段字符串中获取想要的字符串？ pycharm python
2022-03-02 03:05

回答 2 已采纳我的想法：获取href，再由正则获取&np=xxx
Python统计一个字符串中每个字符出现了多少次的方法【字符串转换为列表再统计】
2020-12-25 14:53

本文实例讲述了Python统计一个字符串中每个字符出现了多少次的方法。分享给大家供大家参考，具体如下： #coding=utf-8 #统计一个字符串中的每一个字符出现了多少次 #定义一个字符串 str = 'abbcccdddd' #在字符串的...
Python 字符串操作请问如何找到相同元素最长的个数? python
2022-06-09 20:54

回答 2 已采纳先用字符切割，找出最长的即可 a ="0010101001000100000001" maxlen=a[0] for i in set(list(a)): temp=a.split(i)
VScode中Python代码不高亮显示？？ python vscode 有问必答
2022-04-10 22:05

回答 2 已采纳安装这两个插件然后设置颜色主题或者你也可以安装其它你喜欢的然后颜色主题插件
Python：文本字符分布 python 有问必答
2021-05-25 15:27

回答 2 已采纳 s = input('输入字符串：') d = {} for i in s: if i.isalpha(): d[i.lower()] = d.get(i.lower(),
python中int占几个字节_Python中的整型占多少个字节？
2020-11-21 03:32

weixin_39997173的博客说到计算机中的整型，相信很多人都会联想到32位整型...C/C++中是4个字节，Java中也是4个字节，但是Python中呢？我们知道Python中也有int类，而且非常好用，原生支持高精度计算。但是Python中的一个整型到底占用多...
python 统计字符串中的小写字母个数 python 有问必答
2021-05-24 13:46

回答 4 已采纳 lb = ["a", "b", "d"] s = "asdaeqwezxcsdxvsr"; num = 0 for item in lb: num += s.count(item) prin
python一串字符中每个数字出现次数？ python
2020-12-17 21:17

回答 1 已采纳 a = input() for i in set(a): b = list(a).count(i) print(i, b)
如何使用python爬取canvas中的内容呢？ css javascript python
2022-04-29 10:30

回答 1 已采纳需要在浏览器上临时显示后端实时处理的图像，需要将图像数据转成json字符串传输给js绘图。后端python处理： import cv2 as cvfrom encodings import base
python字符集_PYTHON 中的字符集
2020-12-21 12:18

weixin_39685130的博客 Python中的字符编码是个老生常谈的话题，今天来梳理一下相关知识，希望给其他人些许帮助。Python2的默认编码是ASCII，不能识别中文字符，需要显式指定字符编码；Python3的默认编码为Unicode，可以识别中文字符。相信...
python如何获取新窗口的URL？ python
2020-01-29 19:55

回答 2 已采纳聚焦到第二个标签页 driver.switch_to_windows(1) 序号是从0开始。
Python - 文本字符串、二进制数据
2022-05-25 16:12

你那张胖胖的圆脸的博客 Python3的字符串是Unicode字符串不是字节数组。这是与python2相比最大的差别。用\u及4个十六进制的数字可以从Unicode256个基本多语言平面中指定一个特定某一特定字符。我们需要使用更多的比特位来存储那些位于更...
计算文本文件中特定字符的数量（Python）
2019-04-18 21:14

TCatTime的博客目录题目描述输入/输出描述解题思路代码 ...每一行随机1 -- 100个字符。...输入一个字符，计算该字符在随机生成的txt文件中出现的次数。如果输入的是字母，不区分大小写，来计算其出现的次数。...
没有解决我的问题, 去提问

悬赏问题

¥100 求三轴之间相互配合画圆以及直线的算法
¥100 c语言，请帮蒟蒻写一个题的范例作参考
¥15 名为“Product”的列已属于此 DataTable
¥15 安卓adb backup备份应用数据失败
¥15 eclipse运行项目时遇到的问题
¥15 关于#c##的问题：最近需要用CAT工具Trados进行一些开发
¥15 南大pa1 小游戏没有界面，并且报了如下错误，尝试过换显卡驱动，但是好像不行
¥15 自己瞎改改，结果现在又运行不了了
¥15 链式存储应该如何解决
¥15 没有证书，nginx怎么反向代理到只能接受https的公网网站