chengkairen2 2011-01-12 10:51
浏览 188
已采纳

网页抓取时遇到相对路径怎么办啊,高手快帮帮我

各位 遇到个问题, 谁能帮我解决一下
我举个例子 现在要抓取 http://www.xxx.com/123/123/321/xxx.html 下的一篇文章,其中连图片也要一起抓
所以我抓到这个页面后需要根据img 元素里的url再单独抓图片。问题来了,img给的url很多都是 像../../图片.jpg 或者 ./img/图片.jpg 等格式的相对路径,整的我没办法正常抓取,有没有什么办法

  • 写回答

1条回答 默认 最新

  • goldbutterfly 2011-01-13 09:04
    关注

    URI base=new URI(baseURI);//基本网页URI

    URI abs=base.resolve(relativePath);//解析于上述网页的相对URL,得到绝对URI

    URL absURL=abs.toURL();//转成URL

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥15 单片机学习顺序问题!!
  • ¥15 ikuai客户端多拨vpn,重启总是有个别重拨不上
  • ¥20 关于#anlogic#sdram#的问题,如何解决?(关键词-performance)
  • ¥15 相敏解调 matlab
  • ¥15 求lingo代码和思路
  • ¥15 公交车和无人机协同运输
  • ¥15 stm32代码移植没反应
  • ¥15 matlab基于pde算法图像修复,为什么只能对示例图像有效
  • ¥100 连续两帧图像高速减法
  • ¥15 如何绘制动力学系统的相图