weixin_40545502 2020-07-10 16:44 采纳率: 0%
浏览 705

python 爬虫过程中遇到经过base64加密的网页该如何解密?

最近在学习python爬虫,案例中有一个猫眼的爬虫,但是由于教材是2年前的,现在猫眼对网页内容进行了base64的加密,按照原来的代码无法获取想要的数据,正常requests.get(url)出来的结果应该是这样的
图片说明

但现在出来的结果是这样的

图片说明

现在的代码是这样的

import requests
import re
def get_one_page(url):
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.106 Safari/537.36'
}
response = requests.get(url, headers = headers)
if response.status_code == 200:
return response.text
return None

def main():
url = 'https://maoyan.com/board/4'
html = get_one_page(url)
print(html)

main()

所以我要怎么修改代码才可以得到正常的网页内容?请各位大佬赐教!

  • 写回答

2条回答 默认 最新

  • 夜晓码农 2020-07-10 16:48
    关注

    那段Base64就是内容了,Base64编码过的图片,直接保存就可以了,浏览器可以识别的

    评论

报告相同问题?

悬赏问题

  • ¥15 sqlite 附加(attach database)加密数据库时,返回26是什么原因呢?
  • ¥88 找成都本地经验丰富懂小程序开发的技术大咖
  • ¥15 如何处理复杂数据表格的除法运算
  • ¥15 如何用stc8h1k08的片子做485数据透传的功能?(关键词-串口)
  • ¥15 有兄弟姐妹会用word插图功能制作类似citespace的图片吗?
  • ¥200 uniapp长期运行卡死问题解决
  • ¥15 latex怎么处理论文引理引用参考文献
  • ¥15 请教:如何用postman调用本地虚拟机区块链接上的合约?
  • ¥15 为什么使用javacv转封装rtsp为rtmp时出现如下问题:[h264 @ 000000004faf7500]no frame?
  • ¥15 乘性高斯噪声在深度学习网络中的应用