python爬虫html获取不全

最近发现了一个网站，想用python爬虫爬取其中的图片
https://www.aigei.com/view/70774.html?page=1

首先使用requests库试了一下

import requests
import re

url = r"https://www.aigei.com/view/70774.html?page=2"
print(url)
headers =  (太长了，这里就不放了，其中有user-agent  ， cookie）

html = requests.get(url, headers=headers).content.decode("utf-8")
print(html)

但是发现没有想要的内容

出现了很多的空行，用selenium试了一下，依然不行

from selenium import webdriver
import re

browser = webdriver.Chrome()
browser.get(r"https://www.aigei.com/view/70774.html?page=2")

html = browser.page_source
print(html)

browser.quit()

本人是初学者，希望各位达人帮忙解决

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
虎子8 2022-06-24 21:24
关注
其实有的，但是这个网站应该是为了懒加载把url用base64密了一下，然后再动态加载，其实我下面发的这个就是url 是base64后的url 解码后就是
https://s1.aigei.com/src/img/png/4a/4a6de48586f54845b67f8d3d874dacf5.png?imageMogr2/auto-orient/thumbnail/!116x115r/gravity/Center/crop/116x115/quality/85/&e=1735488000&token=P7S2Xpzfz11vAkASLTkfHN7Fw-oOZBecqeJaxypL:Po14r-y2O1ya-md6RQhO1iuxTxQ=

原文
src='//cdn-sqn.aigei.com/assets/site/img/icon/grey.gif' data-original='aHR0cHM6Ly9zMS5haWdlaS5jb20vc3JjL2ltZy9wbmcvNGEvNGE2ZGU0ODU4NmY1NDg0NWI2N2Y4
ZDNkODc0ZGFjZjUucG5nP2ltYWdlTW9ncjIvYXV0by1vcmllbnQvdGh1bWJuYWlsLyExMTZ4MTE1
ci9ncmF2aXR5L0NlbnRlci9jcm9wLzExNngxMTUvcXVhbGl0eS84NS8mZT0xNzM1NDg4MDAwJnRv
a2VuPVA3UzJYcHpmejExdkFrQVNMVGtmSE43Rnctb09aQmVjcWVKYXh5cEw6UG8xNHIteTJPMXlh
LW1kNlJRaE8xaXV4VHhRPQ==' data-is-original-base64='true'

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python爬虫是指使用Python编程语言编写的程序，用于从互联网上获取数据爬虫程序通过模拟浏览器的行为
2024-02-21 00:37

总的来说，Python爬虫是通过Python编程语言实现的自动化数据获取工具，它涉及到网络请求、网页解析、反爬策略、数据存储等多个方面，广泛应用于数据分析、市场研究、内容监控等场景。通过不断学习和实践，我们可以...
Python爬虫是一种使用Python编程语言来自动化获取网页数据的技术这项技术主要涉及到向目标服务器发送请求，获取HTML页
2024-05-02 14:49

Python爬虫是一种利用Python编程语言实现自动化的网页数据抓取技术。它的工作原理主要包括以下几个步骤：首先向目标服务器发送HTTP请求；接着获取服务器返回的HTML页面内容；然后对HTML进行解析以提取所需的数据。...
Python 爬虫基础网络爬虫、数据采集、Python编程、数据处理
2023-08-12 18:32

资源描述：这个资源是关于Python爬虫基础的教程，旨在帮助初学者掌握如何使用Python编程语言构建简单的网络爬虫，从网页中抓取数据，并进行基本的数据处理和存储。内容概要：教程涵盖了Python爬虫的基本概念、...
Python 爬虫编程从入门到实践
2024-03-11 13:42

Python编程语言以其简洁明了的语法和强大的功能在IT领域，特别是网络爬虫技术中，占据了重要的地位。本文将深入探讨Python爬虫编程的基础知识，从入门到实践，帮助初学者掌握这一技能。首先，我们要了解什么是网络...
Python 爬虫基础知识.html
2024-09-03 09:31

Python作为一种高级编程语言，因其简洁的语法和强大的第三方库支持，成为了开发网络爬虫的热门选择。本文将详细探讨Python爬虫的基础知识，涵盖其工作原理、常用库及实现步骤等方面。首先，我们需要了解爬虫的工作...
Python爬虫项目合集（源代码）
2024-06-23 19:13

通过学习这些源代码，你可以了解如何将Python爬虫技术应用到实际问题中，提升编程技能和解决问题的能力。同时，要注意遵守网站的robots.txt规则和相关法律法规，尊重数据隐私，合理合法地使用爬虫技术。这个项目合集...
Python爬虫知识点梳理
2023-04-23 20:37

爬虫涉及的技术包括但不限于熟练一门编程语言（这里以 Python 为例） HTML 知识、HTTP 协议的基本知识、正则表达式、数据库知识，常用抓包工具的使用、爬虫框架的使用、涉及到大规模爬虫，还需要了解分布式的概念、...
基于Python的Nyspider多语言爬虫设计源码
2024-10-04 12:37

Python作为一种简洁易学的编程语言，在网络爬虫领域有着广泛的应用，尤其在数据科学、人工智能等前沿领域。本项目“基于Python的Nyspider多语言爬虫设计源码”便是在这样的背景下诞生的一款高效的网络爬虫系统。该...
基于python爬虫的中国疫情数据可视化分析
2022-04-24 15:32

本项目通过Python爬虫技术获取中国疫情的相关数据，并利用数据分析和可视化工具进行深入研究，以揭示疫情的发展趋势和特征。首先，我们需要理解Python爬虫的基本概念。Python爬虫是一种自动化程序，用于从互联网上...
基于python的百度云网盘爬虫
2024-01-30 11:04

【标题】"基于Python的百度云网盘爬虫"是一个项目，旨在教用户如何使用Python编程语言编写程序来抓取并下载百度云网盘上的公开资源。该项目涵盖了网络爬虫技术，结合了百度云盘的API接口，以及可能涉及的前端和后端...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 7月3日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 6月25日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 6月24日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 6月24日

python爬虫html获取不全

1条回答 默认 最新

问题事件

1条回答默认最新