qq_842316758 2016-10-20 07:30 采纳率: 0%
浏览 1601
已结题

Jsoup爬虫页面的,ip被封闭,无法得到全部信息,该如何解决

Jsoup爬取页面元素,爬的次数多了,后来爬取就得不到想要的元素了,该如何解决?

  • 写回答

2条回答 默认 最新

  • 普通网友 企业官方账号 2020-07-10 14:42
    关注

    目前网络爬虫爬取数据的技术已经越来越成熟,再加上配合代理IP,让爬虫技术的工作效率越来越高。但网络爬虫对被爬取网站并没什么好处,所以设置了反爬虫机制。有时平台以便更好地阻拦恶意访问,会设置IP在规定时间内的访问次数,超出次数就会禁止访问。所以绕过反爬虫机制能够降低网络爬虫的访问频率,还能够用全球(ipidea)克服限制,保证数据采集,力求以质量卓越。

    评论

报告相同问题?

悬赏问题

  • ¥15 解决一个加好友限制问题 或者有好的方案
  • ¥15 关于#java#的问题,请各位专家解答!
  • ¥15 急matlab编程仿真二阶震荡系统
  • ¥20 TEC-9的数据通路实验
  • ¥15 ue5 .3之前好好的现在只要是激活关卡就会崩溃
  • ¥50 MATLAB实现圆柱体容器内球形颗粒堆积
  • ¥15 python如何将动态的多个子列表,拼接后进行集合的交集
  • ¥20 vitis-ai量化基于pytorch框架下的yolov5模型
  • ¥15 如何实现H5在QQ平台上的二次分享卡片效果?
  • ¥30 求解达问题(有红包)