用Python爬取一个网页，向下滚动会不断生成div，想要爬取这些div但爬取下来只有个loading

问题遇到的现象和发生背景：
用Python爬取一个网页，这个网页的特点是如果向下滚动，会源源不断的生成

标签，没有尽头，如果爬取这个网页，生成器

标签爬取下来之后只有只有个loading，而我想要获得的就是这些生成的

标签，应该怎么办？
问题相关代码：

import urllib.request,urllib.error# 制定URL，获取网页数据
def askUrl(url):
    head = {# 模拟浏览器头部信息，想浏览器发送消息
        "authority": "cupfox.app",
        "method": "GET",
        "scheme": "https",
        "path":"/ list?category = % E7 % 83 % AD % E6 % 92 % AD % E6 % 96 % B0 % E5 % 89 % A7",
        "user-agent": "Mozilla / 5.0(Linux;Android 6.0;Nexus 5 Build / MRA58N) AppleWebKit / 537.36(KHTML, like Gecko) Chrome / 99.0.4844.74 bile Safari / 537.36 Edg / 99.0.1150.55"
    }# 告诉服务器，我们能够接受什么类型的内容
    request = urllib.request.Request(url,headers=head) #把URL和头部信息headers封装成一个request对象赋给request，
    html = ''# 定义一个对象，用于封装服务器返回的数据

    #爬取网页的时候，可能会遇到很多问题，这时候需要进行异常处理：
    try:
        response = urllib.request.urlopen(request,timeout=100)  # 把封装的request对象发送给服务器，告诉它我们要打开一个URL，并且我们能够接收的类型在head里面有说明,timeout是超时时间，如果超过10秒服务器没有响应，判定为超时
        html = response.read().decode('utf-8')#读取服务器返回的数据，因为数据经过utf-8编码，所以需要decode解码
    except urllib.error.URLError as e :
        if hasattr(e,"code"):
            print(e.code) # 把有什么问题打印出来
        if hasattr(e,"reason"):
            print(e.reason)# 把什么原因没有获取成功打印出来
    return html
print(askUrl("https://cupfox.app/list?category=%E7%83%AD%E6%92%AD%E6%96%B0%E5%89%A7"))

运行结果及报错内容：
网页如果向下滑动网页会源源不断的生成div标签：

下面是爬取到的内容

<title id="qr5y417-aria">Loading.</title>

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Vae 东 2022-03-30 09:58
关注
阿这.你这个URL所需要的电影数据不是写在接口里嘛?????打开F12开发者工具.刷新页面.选择XHR.就能看到这个网站数据返回是JSON接口
https://api.jackeriss.com/api/v1/recommend/?subject=tv_%E7%83%AD%E9%97%A8&page_start=0&page_limit=24

如有帮助.点击采纳,谢谢

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

python爬取动态网页,如何使用Python抓取具有动态生成的URL的页面？
2020-11-23 16:25

小温小台的博客 Let's try loading it into a new tab. Here's what we get: WOW! We now have the very exact source of our data. The last hurdle though is will it work when we try to pull the CSCO data using this string...
python爬取动态网页_如何使用Python抓取具有动态生成的URL的页面？
2020-11-23 16:25

weixin_39662834的博客 Let's try loading it into a new tab. Here's what we get: WOW! We now have the very exact source of our data. The last hurdle though is will it work when we try to pull the CSCO data using this string...
python爬取天猫_Python如何抓取天猫商品详细信息及交易记录
2020-12-05 14:53

weixin_39687301的博客本文实例为大家分享了Python抓取天猫商品详细信息及交易记录的具体代码，供大家参考，具体内容如下一、搭建Python环境本帖使用的是Python 2.7涉及到的模块：spynner, scrapy, bs4, pymmssql二、要获取的天猫数据三、...
python 3利用BeautifulSoup抓取div标签的方法示例
2020-09-21 07:51

接下来，我们来看一个具体的示例代码，了解如何使用Python 3结合BeautifulSoup来抓取`div`标签。 ```python # -*- coding: utf-8 -*- # python3环境 # XiaoDeng # 示例URL: http://tieba.baidu.com/p/2460150866 # ...
Python Scrapy：爬取动态加载的内容
2025-04-08 17:12

AI Python 编程的博客 Python Scrapy：爬取动态加载的内容关键词：Scrapy、动态内容、爬虫、JavaScript渲染、AJAX、Selenium、Playwright 摘要：本文深入探讨了使用Scrapy框架爬取动态加载内容的技术方案。我们将从基础概念入手，分析...
Python实战：爬取百度热搜榜，制作动态可视化报告
2025-09-06 18:13

王伯安呢的博客本文介绍了一个完整的Python项目：爬取百度热搜榜数据并生成高颜值可视化图表。通过Requests和BeautifulSoup实现数据爬取，使用Pandas进行数据处理，重点展示了两种增强型可视化方法：1)炫彩柱状图，采用多色配色、...
Python爬虫爬取Google图片 -续- ：使用Selenium进行网页操作
2020-07-20 16:46

Ice星空的博客 element(s)driver.switch_to.active_elementKeyboardsend_keyskey_downkey_upclearMouseClickDrag-and-dropHttp proxiesPage loading strategySelenium 爬取谷歌图片自动检查页面元素得到所有图片元素下载图片完整...
基于Python的qixqi排行榜数据爬取及网页数据展示系统
2022-03-17 20:41

biyezuopinvip的博客由于 flask 网络框架比较轻量，所以 Python 编写网页比较方便快捷，app.py 文件也比较简洁，共有三个页面，@app.route(‘/’)配置主页面路由，@app.route(‘getBook’, methods=[‘GET’])是 js 文件获取爬取使用，@...
python爬虫爬取新闻实战01：小白如何迅速学会爬虫爬取上千条新闻
2021-06-21 21:21

theworld666的博客爬虫爬取新闻实战01：小白如何迅速学会爬虫爬取千条新闻文章目录爬虫爬取新闻实战01：小白如何迅速学会爬虫爬取千条新闻1....比较适合想要快速使用爬虫而学习时间没有那么多的小白（python语言的一个
Python爬虫学习（一）使用Requests和正则表达式爬取简单网页
2018-06-28 17:29

HJ_彼岸的博客使用Requests库和正则表达式爬取猫眼电影TOP100中的电影信息，包括电影名称、主演、上映时间、评分、图片等信息。然后将获取的信息保存到文本文件。 2.网页分析要爬取的网页为猫眼电影TOP100...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 4月9日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 4月1日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月28日

用Python爬取一个网页，向下滚动会不断生成div，想要爬取这些div但爬取下来只有个loading

2条回答 默认 最新

问题事件

2条回答默认最新