chengkairen2 2011-01-12 10:51
浏览 189
已采纳

网页抓取时遇到相对路径怎么办啊,高手快帮帮我

各位 遇到个问题, 谁能帮我解决一下
我举个例子 现在要抓取 http://www.xxx.com/123/123/321/xxx.html 下的一篇文章,其中连图片也要一起抓
所以我抓到这个页面后需要根据img 元素里的url再单独抓图片。问题来了,img给的url很多都是 像../../图片.jpg 或者 ./img/图片.jpg 等格式的相对路径,整的我没办法正常抓取,有没有什么办法

  • 写回答

1条回答 默认 最新

  • goldbutterfly 2011-01-13 09:04
    关注

    URI base=new URI(baseURI);//基本网页URI

    URI abs=base.resolve(relativePath);//解析于上述网页的相对URL,得到绝对URI

    URL absURL=abs.toURL();//转成URL

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?