如何使用pycharm的requests爬取数据，用xpath进行解析的时候为空[？(语言-python)

问题遇到的现象和发生背景

问题相关代码，请勿粘贴截图

job_list = tree.xpath('//div[@class = "j_joblist"]/div/a/p/span/text()')
print(job_list)

运行结果及报错内容

我的解答思路和尝试过的方法

我想要达到的结果

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-天际的海浪 2022-03-14 23:40
关注
你先输出一下request+s爬取的数据,看看是否有你需要爬取的内容

你检查下这个网页中的内容是不是通过js代码读取外部json数据来动态更新的。
requests只能获取网页的静态源代码，动态更新的内容取不到。
用F12查看到的代码是通过js动态更新后的内容,
要查看网页的静态源代码应该在页面上点击右键，右键菜单中选 "查看网页源代码"。

这样看到的才是网页的静态源代码。
如果这个网页的静态源代码中有你需要爬取的内容，就说明该页面没有动态内容，可以用requests爬取。
否则就说明该页面的内容是动态更新的，对于动态更新的内容要用selenium 来爬取。
或者是通过F12控制台分析页面数据加载的链接，找到真正json数据的地址进行爬取。

如果这个网页的静态源代码中有你需要爬取的内容，但requests获取的内容中却没有,可能是requests伪造的头部信息不全。
要在headers中添加抓包时的请求头求参数
比如

url = "https://xxxxxxxxxxx" headers={ 'User-Agent': 'xxxxxxxxxxx', 'Host' : 'xxxxxxxxxxx', 'Origin' : 'xxxxxxxxxxxxx', 'Referer' : 'xxxxxxxxxxxxxx', 'Cookie': 'xxxxxxxxxxxxxxxx' } res = requests.get(url,headers=headers)

其中请求头的参数 'User-Agent','Host','Origin', 'Referer','Cookie'可以在浏览器的f12控制台的Network中看到

如有帮助，请点击我的回答下方的【采纳该答案】按钮帮忙采纳下，谢谢!
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

安居客爬虫，采用Pycharm软件爬取安居客小区数据。.zip
2024-01-20 12:53

常用的解析工具有正则表达式、XPath、Beautiful Soup等。这些工具帮助爬虫定位和提取目标数据，如文本、图片、链接等。数据存储：爬虫将提取的数据存储到数据库、文件或其他存储介质中，以备后续分析或展示。常用...
【Python从零到壹】使用XPath解析数据爬取起点小说网数据
2024-04-18 16:03

2401_84140569的博客也就是 //div[@class=‘book-mid-info’]/h4/a/txt()但是Xpath需要依赖xml的库，所以我们需要去安装lxml的库。// 从匹配选择的当前节点选择文档中的节点，而不考虑他们的位置。选择当前节点的父节点（此处是两个点，...
最新python爬虫xpath教程_pycharm 对html代码使用xpath查询
2024-05-03 14:19

2401_84563605的博客当我学到一定基础，有自己的理解能力的时候，会去阅读一些前辈整理的书籍或者手写的笔记资料，这些笔记详细记载了他们对一些技术点的理解，这些理解是比较独到，可以学到不一样的思路。Python所有方向的技术点做的...
Python爬虫技巧：使用Requests、JSON解析与XPath定位
2025-02-05 23:55

I am SuSu的博客【代码】python开发：爬虫示例——GET和POST请求处理。
使用PyCharm批量爬取小说
2021-04-03 22:36

～程～的博客使用pycharm批量爬取小说爬取小说的思路：首先获取小说的地址，分析小说的地址
关于python使用xpath爬取网页内容返回值为空列表的解决方法
2022-06-20 06:57

是半道呀的博客在使用XPath爬取网站中遇到的写完代码发现运行后返回值为 [] 空列表解决方法：1、首先看看你的这段代码中是否有 "tbody"存在，把"tbody"去掉为什么呢？因为在用xpath解析网页的时候，会遇到tbody标签。tbody...
python爬虫xpath教程_pycharm 对html代码使用xpath查询
2025-01-13 16:30

omofun5541的博客现在要做的就是去爬取“三体全集”，“评分”以及“小说简介”这三个内容，可是怎么爬呢，那就要用到了xpath这个定位利器，用过的人都说好，他好我也好！评分以及简介同样如此，如果我们想打印多个小说的这些属性，...
Python爬取网页数据
2018-08-29 17:20

你缺少想象力的博客都说python爬网页数据方便，我们今天就来试试，python爬取数据到底有多方便简介爬取数据，基本都是通过网页的URL得到这个网页的源代码，根据源代码筛选出需要的信息准备 IDE：pyCharm 库：requests、...
Python爬取猫眼电影数据及可视化
2024-03-13 19:03

爬取猫眼的电影的数据，对数据可视化，从年份、月份、国家、明星等角度展示猫眼电影排行榜的数据。爬虫使用requests实现，解析数据使用xpath和re，保存数据用csv，使用matplotlib和pyecharts数据可视化进行比较。
python进阶-01-利用Xpath来解析Html
2024-11-14 22:19

SEEONTIME的博客 python Xpath用于在XML或HTML文档中查找节点（元素、属性等）并且用Xpath来获取我们需要的元素信息；
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月14日

如何使用pycharm的requests爬取数据，用xpath进行解析的时候为空[？(语言-python)

问题遇到的现象和发生背景

问题相关代码，请勿粘贴截图

运行结果及报错内容

我的解答思路和尝试过的方法

我想要达到的结果

3条回答 默认 最新

问题事件

3条回答默认最新