普通网友 2017-02-26 02:03 采纳率: 0%
浏览 1638

集搜客网络爬虫好用不?会有数据缺失吗爬取的时候?拜托大神评价

集搜客网络爬虫好用不?集搜客网络爬虫好用不?会有数据缺失吗爬取的时候?拜托大神评价

  • 写回答

2条回答

  • Fuller 2017-02-26 04:22
    关注

    此软件能够自动生成爬虫代码,在网页上点选需要的内容,标注好以后,点击测试按钮,就能生成爬虫代码并测试爬取结果。

    在生成的爬虫代码中有一类校验代码,用于判断网页结构与定义好的规则是否匹配,如果匹配就执行采集,所以,能匹配上的网页不会有数据缺失。

    那些没有匹配上的网页,会设置成失败状态,使用者可以自己选择是否重新爬,或者加载上来分析失败的原因。

    在这些措施下,数据缺失问题可以有所保障,至少可以精确知道为什么缺失了

    评论

报告相同问题?

悬赏问题

  • ¥15 怎么获取下面的: glove_word2id.json和 glove_numpy.npy 这两个文件
  • ¥15 js调用html页面需要隐藏某个按钮
  • ¥15 ads仿真结果在圆图上是怎么读数的
  • ¥20 Cotex M3的调试和程序执行方式是什么样的?
  • ¥20 java项目连接sqlserver时报ssl相关错误
  • ¥15 一道python难题3
  • ¥15 牛顿斯科特系数表表示
  • ¥15 arduino 步进电机
  • ¥20 程序进入HardFault_Handler
  • ¥15 oracle集群安装出bug