edisly 2011-11-23 21:47 采纳率: 0%
浏览 259
已采纳

Heritrix中CrawlURI类什么意思?

Heritrix中CrawlURI类什么意思?
最近在研究Heritrix源码,不明白Heritrix的CrawlURI类和CandidateURI啥意思?

  • 写回答

2条回答 默认 最新

  • Java面试专栏 2011-11-23 22:06
    关注

    CrawlURI类和CandidateURI类都是Heritrix对URL进行处理的核心类。
    CrawlURI代表一个候选URL,CandidateURI也是一个URL,在被发现或检查通过后会被加到队列。
    CrawlURI和CandidateURI的区别在于CrawlURI是由通过了调度器(Frontier)的CandidateURI转换而来的。
    具体你可以看看这篇博客:
    http://www.yun5u.com/articles/heritrix-1-crawluri.html

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

悬赏问题

  • ¥15 素材场景中光线烘焙后灯光失效
  • ¥15 请教一下各位,为什么我这个没有实现模拟点击
  • ¥15 执行 virtuoso 命令后,界面没有,cadence 启动不起来
  • ¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
  • ¥20 有关区间dp的问题求解
  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置
  • ¥15 有没有研究水声通信方面的帮我改俩matlab代码
  • ¥15 ubuntu子系统密码忘记
  • ¥15 保护模式-系统加载-段寄存器