python爬取动态网页时为什么动态网页的url的源码和网页源码不一样？

想用python爬虫爬burberry官网https://cn.burberry.com/mens-new-arrivals-new-in/
的最新上架衣服图片，但网页是动态加载的(有一个查看全部按钮)

图片说明

点击查看更多后有一个XHR请求如图图片说明

修改爬虫header后访问该请求的url，得到的html和在原网页上按f12显示的源码不相同，如图(图一为原网页点击加载全部后的源码，图二为访问url得到的源码）

图片说明

为什么会不一样呢？？？？而且不一样的话按照url得到的格式我就没法用美丽汤了，只能正则找图片链接，怎么样得到原网页点击加载全部后的源码呢???（小白刚学爬虫，希望大佬指教）

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2020-01-30 21:21
关注
加载更多是通过ajax异步加载的
请求的是 Request URL: https://cn.burberry.com/service/shelf/mens-new-arrivals-new-in/?_=1580390113449

1580390113449应该是时间戳，没有特殊含义，表示1970-1-1到现在的毫秒数

包括如下附加的http header

x-content-type-options: nosniff x-newrelic-app-data: PxQEVV9WDwQTVVhQAQMEU1MTGhE1AwE2QgNWEVlbQFtcCxYkSRFBBxdFXRJJJH1nH0sSB0VHXgUBHkVbBwoFQBxSFFIWCQQBAFEBVAhNHlNIFAVQVAIPVlYCVQcPA1NeRh1QUg4VBj8= x-xss-protection: 1; mode=block

返回的json就是你要的。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python爬取动态网页时为什么动态网页的url的源码和网页源码不一样？ html5 python 正则表达式
2020-01-30 18:11

回答 1 已采纳加载更多是通过ajax异步加载的请求的是 Request URL: https://cn.burberry.com/service/shelf/mens-new-arrivals-new-in/?
为什么爬取到的内容和网页上的不一样呢？求解决方法 python 爬虫
2022-05-12 17:10

回答 2 已采纳因为他是异步加载的。解决方法：1、一般爬取到的内容和网页上的不一样，可能是请求异常或者是异步加载导致的，需要去定位数据来源。2、打开控制台全局搜索151.4，发现没结果，那么继续搜索1514，发现有
python 爬取的代码与网页上的代码不同 python 爬虫
2022-03-10 00:27

回答 1 已采纳这种结果用正则表达式提取就行，不能用xpath，另外如果结果数据类型为json的话可以把他转换成字典取值。python里面有json，jsonpath等模块就可以搞这种字符串的。有帮助的话采纳一下哦！
Python 如何爬取网页中动态加载的数据 Python源码
2023-11-07 15:07

Python 如何爬取网页中动态加载的数据 Python源码Python 如何爬取网页中动态加载的数据 Python源码Python 如何爬取网页中动态加载的数据 Python源码Python 如何爬取网页中动态加载的数据 Python源码Python 如何爬取...
Python的requests.get()获取不到正确的网页源码 python 有问必答
2021-06-21 14:46

回答 2 已采纳需要添加headers。 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36
python爬虫爬取网页代码遇到了一些问题 python 爬虫
2022-08-17 17:07

回答 3 已采纳因为元素里的你要的内容是通过 ajax 请求动态加载的，可以浏览器抓包去看下，你想要的这条数据到底是哪个请求返回的，找到真正的请求，然后模拟发送就行了
求助，python 解析爬取的网页源码中的json部分
2016-03-11 08:31

回答 2 已采纳 sum: 其实方法一直就在那，只是自己懒，怕麻烦不去尝试。。。。上面知道是json又不敢确定的时候，只用了json.load(html.text)尝试，提示没有json object就一直再乱搜
Python 如何实现定时爬取网页内容 Python源码
2023-11-07 15:05

Python 如何实现定时爬取网页内容 Python源码Python 如何实现定时爬取网页内容 Python源码Python 如何实现定时爬取网页内容 Python源码Python 如何实现定时爬取网页内容 Python源码Python 如何实现定时爬取网页内容 ...
爬虫入门，为什么我爬到的数据和网页的不一样 python 爬虫
2022-07-23 22:54

回答 2 已采纳还是显示有问题啊然后我改了一下打印了看这不是一样的嘛
Python爬虫requests反还内容与网页内容不相同 python 有问必答
2022-03-08 22:50

回答 2 已采纳 requests.get得到的是源代码，ajax动态加载或者js动态生成的html代码获取不到，需要直接请求接口获取数据或者从源代码中找到js数据源进行解析。截图中右边块的数据接口为下面这个，直接re
Python爬虫爬取网页源代码为空，求问原因&解决方案（向） python 爬虫
2015-08-11 04:55

回答 5 已采纳代码： ``` #!/usr/bin/env python3 #-*- coding=utf-8 -*- import urllib3 if __name__ == '
Python 爬取小视频之获取动态请求数据 Python源码
2023-10-23 09:03

Python 爬取小视频之获取动态请求数据 Python源码Python 爬取小视频之获取动态请求数据 Python源码Python 爬取小视频之获取动态请求数据 Python源码Python 爬取小视频之获取动态请求数据 Python源码Python 爬取小...
网络爬虫-如何爬取网页中动态加载的数据-Python实例源码.zip
2022-12-13 19:26

网络爬虫-如何爬取网页中动态加载的数据-Python实例源码.zip
精选_python爬虫--爬取网站中的多个网页_源码打包
2022-03-12 12:01

python爬虫--爬取网站中的多个网页
没有解决我的问题, 去提问

悬赏问题

¥30 这是哪个作者做的宝宝起名网站
¥60 版本过低apk如何修改可以兼容新的安卓系统
¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
¥50 有数据，怎么建立模型求影响全要素生产率的因素
¥50 有数据，怎么用matlab求全要素生产率
¥15 TI的insta-spin例程
¥15 完成下列问题完成下列问题
¥15 C#算法问题, 不知道怎么处理这个数据的转换
¥15 YoloV5 第三方库的版本对照问题
¥15 请完成下列相关问题！

python爬取动态网页时为什么动态网页的url的源码和网页源码不一样？

1条回答 默认 最新

悬赏问题

1条回答默认最新