两次查看网页源代码的结果不一致，如何解决

小白在练习爬取一款商品信息，但是结果有时正常有时错误，print（req.text）后发现结果有两种，不得其解。后在浏览器种右键-查看网页源代码（同一个网页），发现不同的时间也有两种结果；同一时间内，浏览器查看的源代码和print(req.text)的往往也不一样，这是什么原因？怎么确保爬到charset="gbk"的那个？

主要网页截图和代码如下

# 需要调用的requests 库和 BeautifulSoup库中的bs4工具
import requests
from bs4 import BeautifulSoup
from fake_useragent import UserAgent
import chardet


num = 0  # 定义条数的初始值
# 定义一个变量url，为需要爬取数据我网页网址
url = 'https://detail.1688.com/offer/1256595978.html?spm=a261y.7663282.trade-type-tab.1.7a1e31e31MYdsg&sk=consign'
# 获取这个网页的源代码，存放在req中，{}中为不同浏览器的不同User-Agent属性，针对不同浏览器可以自行百度
ua=UserAgent(use_cache_server=False)
headers = {'User-Agent': ua.chrome}
req = requests.get(url, headers=headers)
print(req)
print(req.status_code)
print(req.url)
print(req.encoding)
print('----------')
#chardet.detect(req.content)
req.encoding='GBK'
print(req.encoding)
print(req.text)
# 生成一个Beautifulsoup对象，用以后边的查找工作
soup = BeautifulSoup(req.text, 'lxml')
#建立列表
xml=[]
# 找到所有p标签中的内容并存放在xml这样一个类似于数组队列的对象中
xml.append(soup.find(class_="chinaname hidden"))
# 利用循环将xml[]中存放的每一条打印出来


print(url)


print("\n旺旺：",xml[0].string)


# for i in range(len(xml)):  # 表示从0到xml的len()长度
#     msg = xml[i].string
#     if msg is not None:
#         num += 1

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
qq_24862331 2020-07-04 05:36
关注
懂了，在新的浏览器里直接粘贴网址进入会有验证界面，utf-8版本就是验证界面的网页源代码，之所以商品网页也可以刷出utf-8版本也许可能是放置过久，已需要验证。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python爬虫requests反还内容与网页内容不相同 python 有问必答
2022-03-08 22:50

回答 2 已采纳 requests.get得到的是源代码，ajax动态加载或者js动态生成的html代码获取不到，需要直接请求接口获取数据或者从源代码中找到js数据源进行解析。截图中右边块的数据接口为下面这个，直接re
在postman使用MD5加密出来的结果与使用python加密出来的结果不一致？ python
2021-09-03 12:18

回答 5 已采纳这个问题太坑了，我找了好久才找到问题所在，以下是修改的程序代码，主要问题就在于request.data这里所以这个位置，看似一样，其实本质还是不同。希望能能够采纳支持，谢谢！！！ #!/u
python爬虫爬取网页代码遇到了一些问题 python 爬虫
2022-08-17 17:07

回答 3 已采纳因为元素里的你要的内容是通过 ajax 请求动态加载的，可以浏览器抓包去看下，你想要的这条数据到底是哪个请求返回的，找到真正的请求，然后模拟发送就行了
python爬虫显示无此模板_Python如何解决源代码与检查元素不一致的爬虫问题
2021-03-06 16:57

北广阿橘的博客针对源代码和检查元素不一致的网页爬虫——利用Selenium、PhantomJS、bs4爬取12306的列车途径站信息整个程序的核心难点在于上次豆瓣爬虫针对的是静态网页，源代码和检查元素内容相同；而在12306的查找搜索过程中，其...
Python的requests.get()获取不到正确的网页源码 python 有问必答
2021-06-21 14:46

回答 2 已采纳需要添加headers。 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36
Python爬虫爬取网页源代码为空，求问原因&解决方案（向） python 爬虫
2015-08-11 04:55

回答 5 已采纳代码： ``` #!/usr/bin/env python3 #-*- coding=utf-8 -*- import urllib3 if __name__ == '
VScode中Python代码不高亮显示？？ python vscode 有问必答
2022-04-10 22:05

回答 2 已采纳安装这两个插件然后设置颜色主题或者你也可以安装其它你喜欢的然后颜色主题插件
python爬取内容和f12不一致_记录几个爬取动态网页时的问题(下拉框，旧的元素无法获取，获取的源代码和f12看到的不一致，爬取延迟)...
2020-11-30 12:07

weixin_39747049的博客这个动态网页其实直接抓取ajax请求就可以了，很简单，我之前想复杂了，虽然也实现了，但是效率极低，不过没关系，就当作是对Selenium的一次学习吧1.最近在爬取一个动态网页，其中为了更新页面，需要选择不同的选项，...
xpath爬取图片，得不到src ，python求解决 python 有问必答爬虫
2022-01-27 12:25

回答 4 已采纳图片是js解析出来的，xpath无效，数据在js变量里面，正则提取下数据用json.loads加载获取代码如下 import requests import re import json def
用visual studio code运行Python结果显示不出来 python 有问必答
2022-03-20 22:07

回答 3 已采纳你最后一行 gee() 要放在函数外面把最后一行 gee() 前面的空格都删除gee()要与第一行def对齐如有帮助，请点击我的回答下方的【采纳该答案】按钮帮忙采纳下，谢谢!
Python，cfg库安装不了，如何解决？ python
2022-05-01 23:04

回答 1 已采纳没有名叫cfg的第三方模块啊，你是要做什么功能？任何找不到的模块都是报这个错误。
python如何提交源代码_提交流程
2020-12-09 14:24

weixin_39523835的博客重要说明由于本届评测报名人数较多，为了保证评测过程的顺利进行，所有系统必须通过CodaLab进行提交，不接受线下调试，敬请谅解。请各参赛队伍一定充分预留时间熟悉Codalab平台，避免最终提交失败。难点在配置运行...
python爬虫爬虫的网站源码不齐全怎么办 python
2019-04-26 16:05

回答 1 已采纳现在都是动态网页,你爬取到的只是一个基本框架而已。你可以用f12 然后检测一下http请求，基本上获取到的都是第一个请求。后面的数据都是通过js修改后的网页。交互式的。所以要想做复杂爬虫，
全网最全Python项目体系练习500例（附源代码），练完可就业
2021-06-10 20:28

yk 坤帝的博客 2.补充缺失的代码 3.输入日期，判断这一天是这一年的第几天？ 4.打乱一个排好序的list对象alist？ 5.现有字典 d= {‘a’:24,‘g’:52,‘i’:12,‘k’:33}请按value值进行排序? 6.字典推导式 7.请反转字符串 “aStr...
GCN-图卷积神经网络算法简单实现（含python代码）
2022-10-29 15:25

99.99％的博客 GCN-图卷积神经网络算法简单实现（含python代码）
没有解决我的问题, 去提问

悬赏问题

¥15 安装svn网络有问题怎么办
¥15 Python爬取指定微博话题下的内容，保存为txt
¥15 vue2登录调用后端接口如何实现
¥65 永磁型步进电机PID算法
¥15 sqlite 附加（attach database）加密数据库时，返回26是什么原因呢？
¥88 找成都本地经验丰富懂小程序开发的技术大咖
¥15 如何处理复杂数据表格的除法运算
¥15 如何用stc8h1k08的片子做485数据透传的功能？(关键词-串口)
¥15 有兄弟姐妹会用word插图功能制作类似citespace的图片吗？
¥15 latex怎么处理论文引理引用参考文献

两次查看网页源代码的结果不一致，如何解决

5条回答 默认 最新

悬赏问题

5条回答默认最新