数据挖掘，词云分析Python

我想获取网络上对联名产品发展的看法，选取微博，知乎针对“联名产品发展前景”搜索词下的用户评价，对比一下，选择两到三家网站进行抓取，得到一个词频统计，和关键词统计，如图所示一下的代码！

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

15条回答默认最新

波塞冬~ 2024-03-12 09:17

关注


import requests
from bs4 import BeautifulSoup
from collections import Counter
import jieba.analyse

# 定义抓取微博内容的函数
def fetch_weibo_content():
    url = "https://s.weibo.com/weibo?q=%E8%81%94%E5%90%8D%E4%BA%A7%E5%93%81%E5%8F%91%E5%B1%95%E5%89%8D%E6%99%AF"
    response = requests.get(url)
    soup = BeautifulSoup(response.text, "html.parser")
    contents = soup.find_all("p", class_="txt")
    weibo_texts = [content.get_text() for content in contents]
    return weibo_texts

# 定义抓取知乎内容的函数
def fetch_zhihu_content():
    url = "https://www.zhihu.com/search?q=%E8%81%94%E5%90%8D%E4%BA%A7%E5%93%81%E5%8F%91%E5%B1%95%E5%89%8D%E6%99%AF&type=content"
    response = requests.get(url)
    soup = BeautifulSoup(response.text, "html.parser")
    contents = soup.find_all("div", class_="RichContent-inner")
    zhihu_texts = [content.get_text() for content in contents]
    return zhihu_texts

# 统计词频
def word_frequency(texts):
    words = []
    for text in texts:
        words += list(jieba.cut(text))
    word_counts = Counter(words)
    return word_counts

# 提取关键词
def extract_keywords(texts):
    all_text = ' '.join(texts)
    keywords = jieba.analyse.extract_tags(all_text, topK=10)
    return keywords

if __name__ == "__main__":
    weibo_texts = fetch_weibo_content()
    zhihu_texts = fetch_zhihu_content()

    # 词频统计
    weibo_word_counts = word_frequency(weibo_texts)
    zhihu_word_counts = word_frequency(zhihu_texts)

    # 提取关键词
    weibo_keywords = extract_keywords(weibo_texts)
    zhihu_keywords = extract_keywords(zhihu_texts)

    print("微博词频统计：", weibo_word_counts)
    print("知乎词频统计：", zhihu_word_counts)
    print("微博关键词：", weibo_keywords)
    print("知乎关键词：", zhihu_keywords)

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(14条)

报告相同问题？

关注问题

列表数据生成词云图 python源代码
2024-10-30 16:56

而Python，作为一种功能强大的编程语言，已经广泛用于各种数据分析、数据处理和可视化任务中。利用Python生成词云图是一种将文本数据以图形化的方式展示出来的有效手段。尤其是对于社交媒体、市场调研、文本挖掘等...
用Python分析文本数据的词频并词云图可视化
2023-09-20 09:48

艾派森的博客上次批量提取了上市公司主要业务信息，要分析这些文本数据，就需要做文本词频分析。由于中文不同于英文，词是由一个一个汉字组成的，而英文的词与词之间本身就有空格，所以中文的分词需要单独的库才能够实现，常用的...
DouBan_爬虫_词云_python_情感分析_
2021-10-01 03:13

总的来说，这个项目涉及了Python编程、网络爬虫技术、文本处理、词云生成以及情感分析等多个IT领域的重要知识点。通过这个项目，我们可以提升数据分析和处理能力，理解文本挖掘的实际应用，并锻炼解决问题和项目实施...
Python爬取CBA球员数据分析可视化源码
2024-05-23 23:34

在本项目中，我们主要探讨的是如何利用Python编程语言来爬取新浪微博体育频道中的CBA（中国篮球联赛）球员数据，然后对这些数据进行深度分析和可视化。这是一次实战性的数据挖掘过程，旨在揭示球员表现的内在规律，...
Python源码-数据分析图表-电商关键词分析并生成词云图.zip
2025-05-25 20:11

Python作为一门强大的编程语言，在数据分析和人工智能领域有着广泛的应用。它不仅简单易学，而且拥有丰富的库和框架，能够帮助数据分析师处理各种复杂的数据任务。在本项目中，我们将会使用Python进行电商关键词的...
python编程实现bili鬼灭之刃评论词云图
2025-07-21 09:07

本次讨论的核心是通过Python编程技术，对bilibili（简称b站）上的热门动画《鬼灭之刃》的评论数据进行处理，生成一个词云图。这个词云图能够直观地展示观众评论中出现频率较高的词汇，从而反映出大众对于该动画的...
QQ群聊天数据分析python练习实例源码
2023-08-27 02:33

QQ群聊天数据分析是一个有趣的实践项目，它涉及到Python编程语言、数据分析和可能的软件或插件应用。在这个项目中，我们将探讨如何使用Python来提取、处理和分析QQ群的聊天记录，从而获取有价值的洞察。首先，我们...
Python ：文本数据挖掘并绘制词云图
2020-09-16 19:21

muyi沐一的博客 Python ：文本数据挖掘并绘制词云图前言材料准备导包对文章预处理分词去停用词词频统计制作词云图结果展示及主函数前言绘制词云图的目的是方便快捷有效的掌握一篇文中的中心概要或了解大致方向与内容。本文我将以...
Python招聘数据分析系统[项目源码]
2025-11-16 08:42

项目的开发基于Python编程语言，利用了网络爬虫技术从招聘网站收集数据。这些数据包括岗位名称、薪资范围、公司规模、职位描述等多个维度，总计约70万条招聘数据。这庞大的数据量要求项目具备高效的抓取、存储和处理...
Python示例源码-数据分析图表-电商关键词分析并生成词云图-大作业.zip
2025-05-25 21:27

本压缩包文件“Python示例源码-数据分析图表-电商关键词分析并生成词云图-大作业.zip”提供了这一过程中的一个具体案例，通过Python编程语言实现电商关键词的分析，并最终生成直观的词云图。这一过程展示了如何利用...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月20日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月12日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月6日

数据挖掘，词云分析Python

15条回答 默认 最新

问题事件

15条回答默认最新