qq_48310778
2021-07-24 08:48
采纳率: 0%
浏览 49

python爬虫爬取微博相关话题内容

想爬取和几个关键词有关的微博内容和用户身份进行统计。
具体是爬取和一些关键词有关的微博内容(爬取和关键词有关的微博内容)和用户的身份(比如说是个人账户还是官方账户进行统计),还需要清洗掉转发的,保存有价值的微博内容。应该是保存到一个Excel表里面。但不知道该怎么做!

  • 点赞
  • 写回答
  • 关注问题
  • 收藏
  • 邀请回答

1条回答 默认 最新

  • 咕泡-三木 2021-07-24 14:55

    利用微博的搜索功能搜索关键字,然后爬取所有结果
    结果里有用户id,等所有结果爬完之后,才查询这个id的身份,
    这样所有的内容及其作者身份都对应起来了
    至于你说保存有价值的内容,就看你怎么判断”有价值”,在入库前在清洗一次即可
    如果数据量非常大,不建议使用excel存储

    点赞 打赏 评论

相关推荐 更多相似问题