qq_48310778 2021-07-24 08:48 采纳率: 33.3%
浏览 363

python爬虫爬取微博相关话题内容

想爬取和几个关键词有关的微博内容和用户身份进行统计。
具体是爬取和一些关键词有关的微博内容(爬取和关键词有关的微博内容)和用户的身份(比如说是个人账户还是官方账户进行统计),还需要清洗掉转发的,保存有价值的微博内容。应该是保存到一个Excel表里面。但不知道该怎么做!

  • 写回答

1条回答 默认 最新

  • 咕泡-三木 2021-07-24 14:55
    关注

    利用微博的搜索功能搜索关键字,然后爬取所有结果
    结果里有用户id,等所有结果爬完之后,才查询这个id的身份,
    这样所有的内容及其作者身份都对应起来了
    至于你说保存有价值的内容,就看你怎么判断”有价值”,在入库前在清洗一次即可
    如果数据量非常大,不建议使用excel存储

    评论

报告相同问题?

问题事件

  • 创建了问题 7月24日

悬赏问题

  • ¥15 求差集那个函数有问题,有无佬可以解决
  • ¥15 MATLAB动图问题
  • ¥15 【提问】基于Invest的水源涵养
  • ¥20 微信网友居然可以通过vx号找到我绑的手机号
  • ¥15 寻一个支付宝扫码远程授权登录的软件助手app
  • ¥15 解riccati方程组
  • ¥15 display:none;样式在嵌套结构中的已设置了display样式的元素上不起作用?
  • ¥15 使用rabbitMQ 消息队列作为url源进行多线程爬取时,总有几个url没有处理的问题。
  • ¥15 Ubuntu在安装序列比对软件STAR时出现报错如何解决
  • ¥50 树莓派安卓APK系统签名