Sidney_VonWunderland 2015-03-19 11:30 采纳率: 0%
浏览 7871

如何用python关键词搜索新浪微博并海量抓取评论?

各位大牛好,我想用python做一件事:在新浪微博上用关键词搜索微博,并尽可能多地抓取相关微博,然后抓取其评论,并进行文本分析。
现在得知可:
1、用API接口。但是我不知道个人可不可以申请使用,是不是要创建应用,审核通过才行?那么创建哪种应用好?万一审核不过怎么办?用SDK的话,怎么使用?
是不是只有自己的微博的评论才能抓取啊?、
2、用爬虫,模拟浏览器行为。据说抓得多了会被封号。
要怎么办?
另外,新浪微博有原创、评论、转发、评论后转发……我要怎么才能通过这个做网民对搜索的关键词的情感分析呢?
第一次做这个,所以连微博的机制都没有太搞懂,用的是javascript生成搜索结果吗?
谢谢!

  • 写回答

2条回答

  • devmiao 2015-03-19 16:18
    关注

    用ip代理,同一个主机不要频繁请求,尽量使用sdk

    评论

报告相同问题?

悬赏问题

  • ¥50 导入文件到网吧的电脑并且在重启之后不会被恢复
  • ¥15 (希望可以解决问题)ma和mb文件无法正常打开,打开后是空白,但是有正常内存占用,但可以在打开Maya应用程序后打开场景ma和mb格式。
  • ¥20 ML307A在使用AT命令连接EMQX平台的MQTT时被拒绝
  • ¥20 腾讯企业邮箱邮件可以恢复么
  • ¥15 有人知道怎么将自己的迁移策略布到edgecloudsim上使用吗?
  • ¥15 错误 LNK2001 无法解析的外部符号
  • ¥50 安装pyaudiokits失败
  • ¥15 计组这些题应该咋做呀
  • ¥60 更换迈创SOL6M4AE卡的时候,驱动要重新装才能使用,怎么解决?
  • ¥15 让node服务器有自动加载文件的功能