Heritrix中CrawlURI类什么意思?
最近在研究Heritrix源码,不明白Heritrix的CrawlURI类和CandidateURI啥意思?
Heritrix中CrawlURI类什么意思?
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
2条回答 默认 最新
- Java面试专栏 2011-11-23 22:06关注
CrawlURI类和CandidateURI类都是Heritrix对URL进行处理的核心类。
CrawlURI代表一个候选URL,CandidateURI也是一个URL,在被发现或检查通过后会被加到队列。
CrawlURI和CandidateURI的区别在于CrawlURI是由通过了调度器(Frontier)的CandidateURI转换而来的。
具体你可以看看这篇博客:
http://www.yun5u.com/articles/heritrix-1-crawluri.html本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报
悬赏问题
- ¥15 stm32开发clion时遇到的编译问题
- ¥15 lna设计 源简并电感型共源放大器
- ¥15 如何用Labview在myRIO上做LCD显示?(语言-开发语言)
- ¥15 Vue3地图和异步函数使用
- ¥15 C++ yoloV5改写遇到的问题
- ¥20 win11修改中文用户名路径
- ¥15 win2012磁盘空间不足,c盘正常,d盘无法写入
- ¥15 用土力学知识进行土坡稳定性分析与挡土墙设计
- ¥70 PlayWright在Java上连接CDP关联本地Chrome启动失败,貌似是Windows端口转发问题
- ¥15 帮我写一个c++工程