python 爬虫过程中遇到经过base64加密的网页该如何解密？

最近在学习python爬虫，案例中有一个猫眼的爬虫，但是由于教材是2年前的，现在猫眼对网页内容进行了base64的加密，按照原来的代码无法获取想要的数据，正常requests.get(url)出来的结果应该是这样的
图片说明

但现在出来的结果是这样的

图片说明

现在的代码是这样的

import requests
import re
def get_one_page(url):
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.106 Safari/537.36'
}
response = requests.get(url, headers = headers)
if response.status_code == 200:
return response.text
return None

def main():
url = 'https://maoyan.com/board/4'
html = get_one_page(url)
print(html)

main()

所以我要怎么修改代码才可以得到正常的网页内容？请各位大佬赐教！

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
夜晓码农 2020-07-10 16:48
关注
那段Base64就是内容了，Base64编码过的图片，直接保存就可以了，浏览器可以识别的

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python爬虫请求数据加密怎么破解？？？ python
2021-03-04 22:33

回答 3 已采纳页面地址 http://tool.liumingye.cn/music/?page=searchPage 脚本里有个encode函数，是这么加密的。如果要爬取的话用selenium比较适
python中binascii.Error: Invalid base64-encoded string问题怎么解决？ python
2022-08-01 22:13

回答 2 已采纳请看👉 ：python_base64_binascii.Error: Incorrect padding解决
python爬虫html获取不全 html python 爬虫
2022-06-24 19:43

回答 1 已采纳其实有的，但是这个网站应该是为了懒加载把url用base64密了一下，然后再动态加载，其实我下面发的这个就是url 是base64后的url 解码后就是https://s1.aigei.com/
Python 爬虫处理base64加密，解密方法
2020-07-28 09:47

乱写乱画的博客 import base64 import time ctime = str(time.time()) user_str = str({'user':user, 'user_type':user_type, 'user_id':user_id}) # 加密 token = base64.b64encode(user_str.encode(encoding='utf-8')).decode() ...
Python爬虫requests.get方法无法显示div中折叠内容 https python 有问必答爬虫
2021-11-27 19:16

回答 2 已采纳该页面数据是动态加载的，需要用此链接用post请求去获取https://www.xuetangx.com/api/v1/lms/get_product_list/?page=1
关于使用python实现的网页爬虫程序卡死的问题 python 有问必答爬虫
2021-08-07 13:04

回答 3 已采纳你可以用time模块进行计时，每过10分钟先用os.system()重新打开程序，然后调用sys.exit()关闭旧进程如果有用，希望采纳哦~
python爬虫返回的html文件打开网页是空的 python
2022-06-15 23:07

回答 1 已采纳很正常，一个网页能运行，不但需要html文件，还需要css和js文件在背后支撑。（前端和后端）你只是爬下来了一个html文件，自然什么都不会展示出来。你仔细想想，如果这么轻易的就能被你爬到百度的htm
Python实现base64加解密，轻松爬取网页数据
2024-02-05 10:53

景天科技苑的博客 base64是一种编码方式而不是加密算法。只是看上去像是加密而已。比如A用10编码 *用c来编码。 Base64使用A--Z，a--z，0--9，+，/ 这64个字符实现对数据进行加密。用这64个符号来描述出不同的字节。
python爬虫如何自动获取Network中的某个XHR地址？ python 爬虫网络
2018-08-25 08:43

回答 4 已采纳楼主问的可能有点不清楚，我的理解是：https://zh.flightaware.com/live/airport/+{机场代号} 楼主有几千个机场代号，需要爬取这几千个URL的https://zh
Python爬虫遇到POST响应connection为close的该怎么解决 postman python
2021-04-25 13:00

回答 1 已采纳解决方法（1）随机切换User-Agent： user_agent_list = ["Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537
Python网络爬虫中json解析失败 json python 有问必答爬虫
2022-02-26 20:51

回答 2 已采纳这个接口返回的是jsonp数据，不是json，要获取text替换掉回调函数名称和前后的括号后才是json数据
Python爬虫加密即拿即用【Base64加密、解密】
2021-08-07 11:28

顽强拼搏的阿k的博客 Python爬虫加密即拿即用【DES对称加密算法】 """ base64加密 # 被编码的参数必须是二进制数据 Base64编码是一种“防君子不防小人”的编码方式。广泛应用于MIME协议，作为电子邮件的传输编码，生成的编码可逆，后一两...
Python爬虫requests反还内容与网页内容不相同 python 有问必答
2022-03-08 22:50

回答 2 已采纳 requests.get得到的是源代码，ajax动态加载或者js动态生成的html代码获取不到，需要直接请求接口获取数据或者从源代码中找到js数据源进行解析。截图中右边块的数据接口为下面这个，直接re
爬虫入门经典(二十二) | 破解base64加密之爬取安居客
2020-11-23 20:19

Python研究所的博客作为一名互联网行业的小白，博主写博客一方面是为了记录自己的学习过程，另一方面是总结自己所犯的错误希望能够帮助到很多和自己一样处于起步阶段的萌新。但由于水平有限，博客中难免会有一些错误出现，有纰漏之处...
Python爬虫：逆向分析某云音乐加密参数
2020-09-22 14:43

夏小悠的博客本篇博文通过对网易云音乐进行逆向分析，用Python代码模拟了AES和RSA加密过程，并在文章的末尾提供了一些参数，可以用这些参数来获取歌曲对应的歌词及用户的评论。
没有解决我的问题, 去提问

悬赏问题

¥15 sqlite 附加（attach database）加密数据库时，返回26是什么原因呢？
¥88 找成都本地经验丰富懂小程序开发的技术大咖
¥15 如何处理复杂数据表格的除法运算
¥15 如何用stc8h1k08的片子做485数据透传的功能？(关键词-串口)
¥15 有兄弟姐妹会用word插图功能制作类似citespace的图片吗？
¥200 uniapp长期运行卡死问题解决
¥15 latex怎么处理论文引理引用参考文献
¥15 请教：如何用postman调用本地虚拟机区块链接上的合约？
¥15 为什么使用javacv转封装rtsp为rtmp时出现如下问题：[h264 @ 000000004faf7500]no frame？
¥15 乘性高斯噪声在深度学习网络中的应用

python 爬虫过程中遇到经过base64加密的网页该如何解密？

2条回答 默认 最新

悬赏问题

2条回答默认最新