各位 遇到个问题, 谁能帮我解决一下
我举个例子 现在要抓取 http://www.xxx.com/123/123/321/xxx.html 下的一篇文章,其中连图片也要一起抓
所以我抓到这个页面后需要根据img 元素里的url再单独抓图片。问题来了,img给的url很多都是 像../../图片.jpg 或者 ./img/图片.jpg 等格式的相对路径,整的我没办法正常抓取,有没有什么办法
网页抓取时遇到相对路径怎么办啊,高手快帮帮我
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
1条回答 默认 最新
- goldbutterfly 2011-01-13 09:04关注
URI base=new URI(baseURI);//基本网页URI
URI abs=base.resolve(relativePath);//解析于上述网页的相对URL,得到绝对URI
URL absURL=abs.toURL();//转成URL本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报