MikeWen07 2022-07-01 17:07 采纳率: 100%
浏览 146
已结题

使用xpath爬取时打印输出"[]"

问题遇到的现象和发生背景

python使用xpath爬取时打印输出"[]"

问题相关代码
import requests
from lxml import etree

url = 'https://movie.douban.com/chart'
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36'}
rs = requests.get(url,headers=headers)
rs=rs.text

e1 = etree.HTML(rs)

info = e1.xpath("/html/body/div[@id='wrapper']/div[@id='content']/div[@class='grid-16-8 clearfix']/div[@class='article']/div[@class='indent']/div/table/tbody/tr/td/div/a/text()")


print(info)
运行结果及报错内容

[]

怎么输出正确结果

  • 写回答

1条回答 默认 最新

  • ochyaken 2022-07-01 23:22
    关注

    xpath写错了,应该是:

    info = e1.xpath("/html/body/div[@id='wrapper']/div[@id='content']/div[@class='grid-16-8 clearfix']/div[@class='article']/div[@class='indent']/div/table/tr/td/div/a/text()")
    

    你在浏览器上看到的html是渲染之后的,和request接受到的不一样。
    写xpath的时候一定要以实际接收到的为准
    顺便,xpath写成这样太丑了,这样比较好

    info = e1.xpath("//div[@class='article']/div[@class='indent']/div/table/tr/td/div/a/text()")
    
    本回答被专家选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 7月12日
  • 专家已采纳回答 7月4日
  • 创建了问题 7月1日

悬赏问题

  • ¥15 素材场景中光线烘焙后灯光失效
  • ¥15 请教一下各位,为什么我这个没有实现模拟点击
  • ¥15 执行 virtuoso 命令后,界面没有,cadence 启动不起来
  • ¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
  • ¥20 有关区间dp的问题求解
  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置
  • ¥15 有没有研究水声通信方面的帮我改俩matlab代码
  • ¥15 ubuntu子系统密码忘记
  • ¥15 保护模式-系统加载-段寄存器