cyj2020014009 2023-02-12 21:37 采纳率: 100%
浏览 20
已结题

xpath获取数据时的一个问题

# 使用xpath去获取猪八戒网上的信息
# 获取页面源代码
url = 'https://jiangmen.zbj.com/search/service/?l=0&kw=saas&r=2'
resp = requests.get(url)
html = resp.text
resp.close()

# 用xpath去解析页面源代码
tree = etree.HTML(html)
a = tree.xpath('/html/body/div[2]/div/div/div[3]/div/div[4]/div[4]/div[1]/div[1]/div/div[3]/div[1]/span/text()')
print(a)
b = tree.xpath('//*[@id="__layout"]/div/div[3]/div/div[4]/div[4]/div[1]/div[1]/div/div[3]/div[1]/span/text()')
print(b)

运行结果:
[]
['¥500']
我遇到了一个使用xpath的问题,上面的a中的xpath是我用开发者工具使用 Copy full xpath得到的位置,我一一对应了一下,是没有错误的,但是运行的结果是一个空列表,而b是我用开发者工具中的copy xpath得到的位置,运行结果是正确的,我想不明白这是为什么?绞尽脑汁都想不明白,谢谢!

  • 写回答

3条回答 默认 最新

  • 威震四海 2023-02-13 10:54
    关注

    最好不要用全路径,路径写的越长月容易出错,页面经过浏览器渲染会增加一些诸如tbody的标签,而代码请求的相应中不一定会有,因此建议尽量简化xpath路径,我的宗旨是:在能准确定位的基础上,路径越短越好

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 2月21日
  • 已采纳回答 2月13日
  • 创建了问题 2月12日

悬赏问题

  • ¥15 ios 新安装app收不到fcm推送
  • ¥15 有没有实力的写手?有过成品的优先
  • ¥15 图像信息库的建立与识别
  • ¥15 韩国网站购物,KG支付的支付回调如何解决
  • ¥15 workstation导入ovf文件,报错,怎么解决呢?
  • ¥15 关于#c语言#的问题:构成555单稳态触发器,采用LED指示灯延时时间,对延时时间进行测量并显示(如楼道声控延时灯)需要Proteus仿真图和C语言代码
  • ¥15 workstation加载centos进入emergency模式,查看日志报警如图,怎样解决呢?
  • ¥50 如何用单纯形法寻优不能精准找不到给定的参数,并联机构误差识别,给定误差有7个?matlab
  • ¥15 workstation加载centos进入emergency模式,查看日志报警如图,没有XFS,怎样解决呢?
  • ¥15 应用商店如何检测在架应用内容是否违规?