overflow_decade 2022-01-04 18:04 采纳率: 60%
浏览 58
已结题

python爬虫通过xpath无法正常解析欲爬取元素

问题遇到的现象和发生背景

爬取某网站的新冠数据,通过lxml包中的xpath进行爬取内容分析,发现无法分析得所要内容。

问题相关代码,请勿粘贴截图

import requests
from lxml import etree
url = "https://www.worldometers.info/coronavirus/"
res = requests.get(url).content
html = etree.HTML(res)
temp_list = {}
temp_list["test"] = html.xpath('/html/body/div[2]/div[3]/div/div[6]/div[1]/div/table/tr[7]/td[2]/a')
pass

运行结果及报错内容

如图所示,无法分析得所要内容:

img

我的解答思路和尝试过的方法

首先确认所要数据在静态页面中而非动态返回,且res中存在所要数据。
其次,经过网上查询,发现xpath在处理tbody时会出错,故按照网上的说法删除掉了tbody标签,但是依然报错,不知因何原因导致。

  • 写回答

2条回答 默认 最新

  • Vae 东 2022-01-05 15:31
    关注

    我是JAVA的xpath html.xpath("//table[@id='main_table_countries_today']/tbody/tr[@style=' ']").你看着修改下

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 1月16日
  • 已采纳回答 1月8日
  • 创建了问题 1月4日

悬赏问题

  • ¥50 导入文件到网吧的电脑并且在重启之后不会被恢复
  • ¥15 (希望可以解决问题)ma和mb文件无法正常打开,打开后是空白,但是有正常内存占用,但可以在打开Maya应用程序后打开场景ma和mb格式。
  • ¥20 ML307A在使用AT命令连接EMQX平台的MQTT时被拒绝
  • ¥20 腾讯企业邮箱邮件可以恢复么
  • ¥15 有人知道怎么将自己的迁移策略布到edgecloudsim上使用吗?
  • ¥15 错误 LNK2001 无法解析的外部符号
  • ¥50 安装pyaudiokits失败
  • ¥15 计组这些题应该咋做呀
  • ¥60 更换迈创SOL6M4AE卡的时候,驱动要重新装才能使用,怎么解决?
  • ¥15 让node服务器有自动加载文件的功能