qq_56912992 2022-06-14 16:34 采纳率: 0%
浏览 21
已结题

红楼梦字频分析(关于前八十回的高频100字如何获取)

红楼梦前八十回使用最多的100个字应该怎么做呢,只能做成全文的带标点符号的代码了
from pyecharts import options as opts

from pyecharts.charts import WordCloud
from collections import Counter
import jieba

with open('C:/Users/川野森奈/Desktop/text.txt.txt',encoding='utf-8') as f:
txt=f.read()
words=jieba.lcut(txt)#精准模式
a={}

for word in words:

    a[word]=a.get(word,0)+1
    

items=list(a.items())#将字典转换为记录列表
items.sort(key=lambda x:x[1],reverse=True)#记录第二列排序
for i in range(100):
word,count=items[i]
print("{0:<10}{1:>5}".format(word,count))

, 59318

。 30810
了 20174
的 14630
“ 11851
” 11659
: 11204
我 7318
他 6442
道 6377
说 6149
你 5915
  5862
也 5848
是 5789
又 5121
着 3913
去 3815
宝玉 3773
来 3675
不 3283
便 3182
? 3118

      3055

在 2919
人 2675
都 2640
有 2572
笑 2489
就 2475
这 2459
叫 1962
! 1905
呢 1816
听 1775
那 1679
等 1668
好 1655
什么 1615
还 1552
要 1492
一个 1452
见 1413
只 1307
贾母 1230
我们 1226
和 1225
上 1214

我的解答思路和尝试过的方法
想要前八十回且不带标点符号的使用最多的一百字,谢谢大家
  • 写回答

0条回答 默认 最新

    报告相同问题?

    问题事件

    • 系统已结题 6月22日
    • 创建了问题 6月14日

    悬赏问题

    • ¥20 Keil uVision5创建project没反应
    • ¥15 mmseqs内存报错
    • ¥15 vika文档如何与obsidian同步
    • ¥15 华为手机相册里面的照片能够替换成自己想要的照片吗?
    • ¥15 陆空双模式无人机飞控设置
    • ¥15 sentaurus lithography
    • ¥100 求抖音ck号 或者提ck教程
    • ¥15 关于#linux#的问题:子进程1等待子进程A、B退出后退出(语言-c语言)
    • ¥20 web页面如何打开Outlook 365的全球离线通讯簿功能
    • ¥15 io.jsonwebtoken.security.Keys