weixin_40545502 2020-07-10 16:44 采纳率: 0%
浏览 717

python 爬虫过程中遇到经过base64加密的网页该如何解密?

最近在学习python爬虫,案例中有一个猫眼的爬虫,但是由于教材是2年前的,现在猫眼对网页内容进行了base64的加密,按照原来的代码无法获取想要的数据,正常requests.get(url)出来的结果应该是这样的
图片说明

但现在出来的结果是这样的

图片说明

现在的代码是这样的

import requests
import re
def get_one_page(url):
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.106 Safari/537.36'
}
response = requests.get(url, headers = headers)
if response.status_code == 200:
return response.text
return None

def main():
url = 'https://maoyan.com/board/4'
html = get_one_page(url)
print(html)

main()

所以我要怎么修改代码才可以得到正常的网页内容?请各位大佬赐教!

  • 写回答

2条回答 默认 最新

  • 夜晓码农 2020-07-10 16:48
    关注

    那段Base64就是内容了,Base64编码过的图片,直接保存就可以了,浏览器可以识别的

    评论

报告相同问题?