3条回答 默认 最新
- CSDN专家-HGJ 2021-06-22 16:44关注
解题思路:1.用requests.get(网页+搜索关键词)获取搜索页面链接,再get信息页面,bs4解析获取文本保存到excel.
2.从excel读取文本,re.sub(r"[^\w]+", " ", s)过滤字符串,用jieba分词words=[x for x in jieba.cut(s) if x !=' '],获取分词列表。
3.将高频词列入stop_words列表,过滤掉,获取频数最高的10个单词及出现次数存入文本
4.用wordcloud作词云图。
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报
悬赏问题
- ¥15 做个有关计算的小程序
- ¥15 MPI读取tif文件无法正常给各进程分配路径
- ¥15 如何用MATLAB实现以下三个公式(有相互嵌套)
- ¥30 关于#算法#的问题:运用EViews第九版本进行一系列计量经济学的时间数列数据回归分析预测问题 求各位帮我解答一下
- ¥15 setInterval 页面闪烁,怎么解决
- ¥15 如何让企业微信机器人实现消息汇总整合
- ¥50 关于#ui#的问题:做yolov8的ui界面出现的问题
- ¥15 如何用Python爬取各高校教师公开的教育和工作经历
- ¥15 TLE9879QXA40 电机驱动
- ¥20 对于工程问题的非线性数学模型进行线性化