python爬虫xpath选择多个属性

python爬虫我需要获取商品的产地，

tree.xpath(
"//div[@class='p-parameter']/ul[@class='parameter2 p-parameter-list']/li[4]/text()")
这样写是没问题的，但是如果到了下一个产品，产地就可能不是在第四个位置了，可能在第三个位置了，所以按照这个xpath写法，获取的可能就不是产地了，这要如何解决呢？而且这个title会根据商品的不同一直变化的

目前我想到的可能的解决方案：

1.我查了半天，看下xpath能否支持通配符的匹配。

tree.xpath(
"//div[@class='p-parameter']/ul[@class='parameter2 p-parameter-list']/li[@title='*省*]/text()")
以上操作不行，本意是为了让xpath查找所有的title里是否有包含‘省’的title，如果有，就提取text（）文件

2.更笨的办法，把所有的省市都列举出来，用“|”符号，这样实在太麻烦了，而且我不知道到底有多少个省市

所以想问下有没有其他的解决方法？

Python

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
oyljerry 2017-08-05 07:30
关注
tree.xpath(
"//div[@class='p-parameter']/ul[@class='parameter2 p-parameter-list']

先到这一层，然后根据条件判断，再决定下一层的数据获取

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python爬虫xpath解析返回为空有什么解决方法吗 python 爬虫
2021-12-10 11:12

回答 1 已采纳为空的地方xpath主要是为了拿到什么数据，贴一下网页和要拿到的数据，帮你写一下xpath。上面图上的xpath那么长那么绝对路径，大概率拿不到数据的。
Python爬虫 xpath 列表为空 python 有问必答爬虫
2022-03-08 08:32

回答 2 已采纳第二个li的div下少了结束标签导致etree解析出错了少了div结束标签后，etree将建筑类别后的几点全部归类到第二li下了，改下面这样就可以了 import requests from lxm
python爬虫关于xpath提取出来为空列表的问题 python 有问必答爬虫
2021-09-30 17:40

回答 2 已采纳你检查下这个网页中的内容是不是通过js代码读取外部json数据来动态更新的。requests只能获取网页的静态源代码，动态更新的内容取不到。对于动态更新的内容要用selenium 来爬取。或者是通
python 中xpath爬虫实例详解
2020-09-18 18:18

主要介绍了python实例：xpath爬虫实例,本文通过实例代码给大家介绍的非常详细，具有一定的参考借鉴价值，需要的朋友可以参考下
有谁能够解答吗 Python爬虫 XPath python 爬虫
2021-11-21 00:19

回答 2 已采纳你需要先确定返回的响应内容中有没有这些分类信息，有的话则是xpath没写对。没有分类信息的话，需要在请求时构造和浏览器相同的请求头信息。爬虫逆向社区-爬虫逆向论坛-
Python爬虫 XPath 爬取的数据为空 python
2021-11-20 15:43

回答 2 已采纳
python使用xpath提取属性值不完整 python 爬虫
2022-05-30 23:15

回答 2 已采纳不知道是不是有个逗号的原因，然后把后面给截断了，可以试试正则去提取 import requests,re url = 'https://www.renren.com/login' rep=reque
Python爬虫实战之xpath解析
2022-08-01 19:59

阿浩(￣▽￣)的博客 XPath是一门在XML文档中查找信息的语言，最初是用来搜寻XML文档的，但是它同样适用于HTML文档的搜索。所以在Python爬虫中，我们经常使用xpath解析这种高效便捷的方式来提取信息。
python如何用xpath取两个标签之间的内容 python 爬虫
2022-05-18 17:43

回答 3 已采纳 //span[text()="名字:"]/following::a[position()<count(//span[text()="名字:"]/following::a)-count(//spa
python爬虫怎么改成多线程 python 爬虫
2022-04-29 12:58

回答 6 已采纳楼上的这些线程改造方式放在这里行不通吧。楼主代码中IO操作在循环的地方，这里线程不是应该将循环改成多线程吗。。。##改了一个循环，试一下 ```python import parsel impor
python爬虫通过xpath无法正常解析欲爬取元素 html python 爬虫
2022-01-04 18:04

回答 2 已采纳我是JAVA的xpath html.xpath("//table[@id='main_table_countries_today']/tbody/tr[@style=' ']").你看着修改下
python爬虫之xpath的基本使用详解
2020-09-20 14:37

本篇文章主要介绍了python爬虫之xpath的基本使用详解，小编觉得挺不错的，现在分享给大家，也给大家做个参考。一起跟随小编过来看看吧
Python网络爬虫 XPath 找关键字 python
2021-11-20 14:36

回答 1 已采纳爬虫代码发出来啊，要不别人咋帮你分析
Python爬虫xpath详解
2022-01-01 19:43

境里婆娑的博客所以在做爬虫时完全可以使用 XPath 做相应的信息抽取。二、安装lxml lxml是Python的一个第三方解析库，支持HTML和XML解析，而且效率非常高，弥补了Python自带的xml标准库在XML解析方面的不足。由于是第三方库...
python爬虫之xpath解析(附实战)
2020-07-10 18:23

猛男技术控的博客 xpath是学爬虫的必备工具，其选择功能十分强大，它提供了非常简明的路径选择表达式，另外，它还提供了超过100个内建函数，用于字符串、数值、时间的匹配以及节点、序列的处理等，几乎所有我们想要定位的节点，都可以...
没有解决我的问题, 去提问

悬赏问题

¥15 matlab实现基于主成分变换的图像融合。
¥15 对于相关问题的求解与代码
¥15 ubuntu子系统密码忘记
¥15 信号傅里叶变换在matlab上遇到的小问题请求帮助
¥15 保护模式-系统加载-段寄存器
¥15 电脑桌面设定一个区域禁止鼠标操作
¥15 求NPF226060磁芯的详细资料
¥15 使用R语言marginaleffects包进行边际效应图绘制
¥20 usb设备兼容性问题
¥15 错误(10048): “调用exui内部功能”库命令的参数“参数4”不能接受空数据。怎么解决啊

python爬虫xpath选择多个属性

2条回答 默认 最新

悬赏问题

2条回答默认最新