闯出一片天 2021-07-14 10:26 采纳率: 100%
浏览 62
已采纳

python爬虫需要学习哪些语言

最近想学习python爬虫,拓展一下知识储备,爬虫需要学习哪些语言

  • 写回答

3条回答 默认 最新

  • CSDN专家-sinJack 2021-07-14 10:32
    关注

    参考:https://www.cnblogs.com/cherish-cxh/p/10025979.html
    熟悉多线程编程、网络编程、HTTP协议相关
    开发过完整爬虫项目(最好有全站爬虫经验,这个下面会说到)
    反爬相关,cookie、ip池、验证码等等
    熟练使用分布式
    了解企业级爬虫和个人爬虫的差异(企业级爬虫,首先在数据量上跟我们平时学习的时候爬虫,不是同一数量级,数据量大很多。其次,企业级爬虫代码一般部署到专门的爬虫服务器上,采取7*24小时运行,所以需要日志监控,异常维护。)

    知道什么是深度优先,广度优先的抓取算法,及实践中的使用规则;

    能分析简单网站的结构,会使用urllib,urllib2或requests库进行简单的数据抓取;
    如有帮助望采纳。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 已采纳回答 7月15日
  • 创建了问题 7月14日

悬赏问题

  • ¥15 工业数据采集技术+存储架构推荐
  • ¥20 树莓派4b使用Camera Module 3时出现the system should be configured for the legacy camera stack问题
  • ¥200 GitHub开源程序配置在VScode调试
  • ¥15 爬虫保存的scv文件0kb
  • ¥20 如何实现基于强化学习的带电作业机械臂的运动规划与控制
  • ¥15 使用wpf制作打砖块游戏时遇到的一个Bug
  • ¥15 qrCodeDetector.detectAndDecode
  • ¥15 海洋可控源和大地电磁一维联合反演
  • ¥15 MFC多文档程序获取视图指针问题
  • ¥15 如何把matlabR2023遗传算法工具箱里面的各类选项对应的代码调出来呢?