bingbingyihao 2021-10-01 12:02 采纳率: 100%
浏览 26
已结题

python如何每次读两个汉字,读取字符,为了实验,无法读取两个字符(自然语言处理)



def getText():
    txt=open('Ci.txt','r',encoding ="utf-8").read()
    for ch in '\n \ / ,。、:!?”“#¥%':
        txt=txt.replace(ch,"")
    return txt

test=getText()

counts={}

for word in test:
    if len(word)==1:
        if word in counts:
            counts[word]=counts[word]+1
        else:
            counts[word]=1

items=list(counts.items())
items.sort(key=lambda x:x[1],reverse=True)

with open('2.txt','w') as a:
    a.write(str(items))

文件就不上传了,就是无法读取两个字符(汉字),只能读出单个汉字,但是又不想用jieba包,如何处理,求解决方案

  • 写回答

1条回答

      报告相同问题?

      相关推荐 更多相似问题

      问题事件

      • 系统已结题 10月9日
      • 已采纳回答 10月1日
      • 创建了问题 10月1日

      悬赏问题

      • ¥15 macOS使用IDEA 2022.2.4打包JDK6项目报错
      • ¥20 OpenCV-Python简单轮廓寻找
      • ¥20 使用matlab进行含参数的最优化求解及数值模拟
      • ¥20 MATLAB找出一维变量中的局部极大值和局部极小值,并进行运算
      • ¥15 有Chang求三维杆单元几何非线性分析matlab代码
      • ¥50 使用unity easyar录屏功能。录屏视频整体色调很暗
      • ¥50 pyinstaller 打包问题
      • ¥15 无法使用cnssc调取网页数据
      • ¥15 Pycharm安装en_core_web_sm失败出现Could not find a version that satisfies the requirement spacy报错
      • ¥15 Python社区划分