敲码进程0.0% 2022-07-15 16:27 采纳率: 100%
浏览 15
已结题

Xpath使用出错了

爬虫Xpath路径使用出错
爬取一位用户ID名
import requests
from lxml import etree
import re
headers = {
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko)'
        'Chrome/103.0.0.0 Safari/537.36'
}

res = requests.get('https://www.weibo.com', headers=headers)
selector = etree.HTML(res.text)
id = selector.xpath('//*[@id="scroller"]/div[1]/div[12]/div/article/div/header/div[1]/div/div[1]/a/span/text()')
print(id)


运行结果

img

路径是从开发工具,检查元素,copy Xpath得到的,是路径出问题了吗?求解!
  • 写回答

1条回答 默认 最新

  • 渔戈 2022-07-16 13:23
    关注

    该页面数据是动态加载的,不是静态页面,所以是获取不到数据的

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 7月24日
  • 已采纳回答 7月16日
  • 创建了问题 7月15日

悬赏问题

  • ¥15 基于卷积神经网络的声纹识别
  • ¥15 Python中的request,如何使用ssr节点,通过代理requests网页。本人在泰国,需要用大陆ip才能玩网页游戏,合法合规。
  • ¥100 为什么这个恒流源电路不能恒流?
  • ¥15 有偿求跨组件数据流路径图
  • ¥15 写一个方法checkPerson,入参实体类Person,出参布尔值
  • ¥15 我想咨询一下路面纹理三维点云数据处理的一些问题,上传的坐标文件里是怎么对无序点进行编号的,以及xy坐标在处理的时候是进行整体模型分片处理的吗
  • ¥15 CSAPPattacklab
  • ¥15 一直显示正在等待HID—ISP
  • ¥15 Python turtle 画图
  • ¥15 stm32开发clion时遇到的编译问题