Bob_Yanna 2019-02-18 15:17 采纳率: 0%
浏览 2890

在编写静态网页爬虫,检查元素时发现在标签里面href所指的链接不全怎么办呀,怎么获得完整的url?

实际的网页url时这样的http://www.mof.gov.cn/xinwenlianbo/shanxicaizhengxinxilianbo/201901/t20190128_3134160.htm
但是在网页上是这样的《a href = ../../xinwenlianbo/shanxicaizhengxinxilianbo/201901/t20190128_3134160.htm》 ABCD 《a》
里面为什么会出现那两个杠杠和点点呀?要怎么补全呢?有很多的链接都是这个样子,出现了杠杠和点点,前面的部分还不太一样,这种情况要怎么处理呢?求指教!
上面是尖括号,因为尖括号敲上去之后不显示标签对里面的信息,不得已改成了书名号=。=

  • 写回答

2条回答 默认 最新

  • 我冬咚咚咚 2019-02-18 16:00
    关注

    ../../xinwenlianbo/shanxicaizhengxinxilianbo/201901/t20190128_3134160.htm 这个链接点击要是可以进去的话,就可以在代码里面添加这个链接前面的那些字符,我觉得你这个链接前面手动添加的字符应该就是http://www.mof.gov.cn几个字母

    评论

报告相同问题?

悬赏问题

  • ¥15 Arduino红外遥控代码有问题
  • ¥15 数值计算离散正交多项式
  • ¥30 数值计算均差系数编程
  • ¥15 redis-full-check比较 两个集群的数据出错
  • ¥15 Matlab编程问题
  • ¥15 训练的多模态特征融合模型准确度很低怎么办
  • ¥15 kylin启动报错log4j类冲突
  • ¥15 超声波模块测距控制点灯,灯的闪烁很不稳定,经过调试发现测的距离偏大
  • ¥15 import arcpy出现importing _arcgisscripting 找不到相关程序
  • ¥15 onvif+openssl,vs2022编译openssl64