m0_60128639 2022-02-25 12:44 采纳率: 100%
浏览 449
已结题

python+selenium+xpath如何定位网页table表格中的数据

如何获取网页表格中的猪肉价格?每个页面的猪肉价格所在行是变化的,如何精准定位到猪肉行?
我的代码该如何修改才能精准爬取猪肉价格呢?


from selenium.webdriver.common.by import By
from selenium import webdriver #导入selenium


url= input("请输入网址:")
driver = webdriver.Chrome()  #打开浏览器
driver.maximize_window()  # 将浏览器最大化
driver.get(url)  #打开网址

猪肉价格 = driver.find_element(By.XPATH,'/html/body/table/tbody/tr[5]/td[2]').text # xpath定位猪肉价格
print("猪肉价格是:",猪肉价格) # 打印猪肉价格

img

img

以下是页面A的源代码

<html>

<body>

<table width="400" border="1">
 <tr>
  <th align="left">A页</th>
  <th align="right">一月</th>
  <th align="right">二月</th>
 </tr>
 <tr>
  <td align="left">鸡肉</td>
  <td align="right">5元</td>
  <td align="right"></td>
 </tr>
 <tr>
  <td align="left">鸭肉</td>
  <td align="right">11元</td>
  <td align="right"></td>
 </tr>
 <tr>
  <td align="left">鹅肉</td>
  <td align="right">55元</td>
  <td align="right"></td>
 </tr>
 <tr>
  <td align="left">猪肉</td>
  <td align="right">5元</td>
  <td align="right"></td>
 </tr>

</table>

</body>
</html>


以下是页面B的源代码

<html>

<body>

<table width="400" border="1">
 <tr>
  <th align="left">B页</th>
  <th align="right">一月</th>
  <th align="right">二月</th>
 </tr>
 <tr>
  <td align="left">鸡肉</td>
  <td align="right">5元</td>
  <td align="right"></td>
 </tr>
 <tr>
  <td align="left">猪肉</td>
  <td align="right">12元</td>
  <td align="right"></td>
 </tr>
 <tr>
  <td align="left">鸭肉</td>
  <td align="right">32元</td>
  <td align="right"></td>
 </tr>
 <tr>
  <td align="left">鹅肉</td>
  <td align="right">43元</td>
  <td align="right"></td>
 </tr>

</table>

</body>
</html>

  • 写回答

2条回答 默认 最新

  • CSDN专家-HGJ 2022-02-25 14:24
    关注

    使用last()定位最后 一个tr节点,再用索引获取。示例:

    from lxml import etree
    with open('a.html','r',encoding='utf-8') as f:
        html=f.read()
    driver=etree.fromstring(html)
    猪肉价格 = driver.xpath('//tr[last()]/td[2]')[0].text  # xpath定位猪肉价格
    print("猪肉价格是:", 猪肉价格)  # 打印猪肉价格
    
    
    

    输出:

    F:\2022\pythontest>t3
    猪肉价格是: 5

    如有帮助,请点采纳。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 3月12日
  • 已采纳回答 3月4日
  • 修改了问题 2月25日
  • 修改了问题 2月25日
  • 展开全部

悬赏问题

  • ¥15 BDSBAS-B1C和B1C信号有什么不同
  • ¥15 在半圆平面内随机生成点坐标
  • ¥15 系统容量变化的几种多址方式TDMA, CDMA,FDMA,OFDMA 对比,应该给的是一个曲线 图,随着系统容量的增加,几种多址方式性能的对比 图,MATLAB程序仿真折线图
  • ¥15 用visual Studio 写c ++只运行上一个旧代码的运行结果是怎么回事
  • ¥15 系统容量变化的几种多址方式(TDMA,FDMA,OFDMA,CDMA)对比(相关搜索:曲线图)
  • ¥15 worldclim 历史及未来气候数据矫正
  • ¥15 ajax服务器不能下载
  • ¥15 运用c++和opencv实现二维码的识别和三维坐标的建立
  • ¥100 理想汽车的ADB为什么到了国外换了SIM就可以打开?
  • ¥15 k210烧入flash报错error:2005