爬虫只能运行第一页，不能爬取后续页码

想爬取美女图片，网址：http://www.tu11.com/xingganmeinvxiezhen/list_1_1.html
编写了如下爬虫：

import requests
from bs4 import BeautifulSoup

def get_1_page(url):

    headers = {"User-Agent":"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36"}

    response = requests.get(url,headers=headers).text
    return response

def parse_1_page(html):
    soup=BeautifulSoup(html,'lxml')
    for a in soup.find_all(class_='col-xs-1-5'):
        print(a.img['src'])

for i in range(1,10):
    url='http://www.tu11.com/xingganmeinvxiezhen/list_1_'+str(i)+'.html'
    html=get_1_page(url)
    parse_1_page(html)

但是只能爬取第一页，之后就报错误：图片说明

求大神看看

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
slongzhang_ 2020-11-16 10:17
关注
https

解决
无用 4
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python爬虫翻页爬取的数据是第一页的重复数据 python 爬虫问答团队
2021-12-18 19:23

回答 1 已采纳爬下一页就好了
Python 爬虫爬取页面pagetext不完整是静态页面 python 有问必答爬虫
2021-10-21 15:16

回答 1 已采纳该页面信息通过用户选择选项，js动态渲染加载数据的，比如在选项框中输入name,在XHR中就可以看到name的动态加载链接，对其进行请求可获取相关信息的json数据信息。
Python爬虫能不能用正则表达式爬取学历部分？ python 爬虫
2022-09-25 14:35

回答 2 已采纳你好，这种HTML结构一般用xpath匹配，对于js般用正则表达式匹配，如果非要用正则表达式匹配HTML一般用：开头+（.*?）+结尾，括号里面的内容就是你要匹配的
【网络爬虫】(3) 案例小结，文本内容爬取，附Python代码
2024-03-25 13:54

立Sir的博客本节总结一下各种文本内容爬取的方法，进行一下案例实战，附详细解析，包含：微博评论爬取；结果展示，文件名是问题，内容是回答，以txt保存。结果展示，评论信息保存在excel中。2. 豆瓣TOP250电影信息爬取。结果...
python爬虫爬取图片，图片打不开 python 爬虫
2022-10-18 21:52

回答 1 已采纳图片是从cdn上过来的，做了防盗链。在headers中添加Refer，指向该网站就行了。 import re import requests import os if not os.path.ex
在以瀑布流方式翻页的网站,使用scrapy网络爬虫,但是只爬取了第一页数据,没有爬取第二页. python 爬虫
2021-09-05 19:18

回答 2 已采纳那叫ajax，
Python selenium的爬虫无法完整爬取整个页面的内容 python selenium 爬虫
2021-10-24 09:44

回答 1 已采纳爬取内容不完整，应该是文档的更多内容，要往下滑动页面才会出现这个不太清楚，应该不是什么反爬，就是类似于中途给你弹出个广告，要具体分析怎么弄VIP内容肯定是需要你的账号是VIP才能看得到的，与selen
Python爬虫案例2：爬取前程无忧网站数据
2023-10-27 13:56

VIV-的博客运用python的selenium模块爬取前程无忧网站的1万条数据
python 爬虫，如何爬取相关数据 python 有问必答爬虫
2021-11-11 11:15

回答 1 已采纳先确定需要爬取的网站，然后分析网站的数据来源，是后端生成数据还是ajax生成数据，确定数据来源方式就根据HTTP请求编写代码，这个涉及一些请求参数的加密、转换等等处理，然后清洗数据和数据入库
Python爬虫配合VPN爬取出现报错 python 爬虫
2021-12-22 17:33

回答 1 已采纳你这个是VPN代理问题，你可以将VPN设置成部分代理，不要全部代理你的网络。
求每次只能爬取第一页的数据，如何爬取这种翻页的网页代码！ python 有问必答
2021-08-20 20:07

回答 4 已采纳直接请求数据接口就行了，分页参数是pn，这修改就行，示例代码如下，有帮助麻烦点个采纳【本回答右上角】，谢谢~~有其他问题可以继续交流~ http://3.push2.eastmoney.com/api
[Python从零到壹] 六.网络爬虫之BeautifulSoup爬取作者个人博客网站详解
2021-02-17 22:20

Eastmount的博客前一篇文章讲述了...这篇文章将详细讲解 BeautifulSoup 爬取作者个人博客网站，通过案例的方式让大家熟悉Python网络爬虫，同时作者博客网站也是非常适合入门的案例，也能普及简单的预处理知识。希望对您有所帮助
用爬虫爬取网页，表格第一行内容无法获得 python 爬虫
2021-12-14 09:11

回答 1 已采纳如果是想要获得标题，表头用的是th，不是td。和表格正文内容不是一样的。
Python爬虫爬取动态页面思路+实例（一）
2016-12-21 17:48

孔天逸的博客简介有时候，我们天真无邪的使用urllib库或Scrapy下载HTML网页时会发现，我们要提取的网页元素并不在我们下载到的HTML之中，尽管它们在浏览器里看起来唾手可得。...爬取动态页面目前来说有两种方法分析页面请求（这篇
【爬虫】学习记录之Python 爬虫实战：爬取研招网招生信息详情
2023-07-03 17:33

永不言弃h的博客【简介】本篇博客为爱冲锋，爬取北京全部高校的全部招生信息，最后持久化存储为表格形式，可以用作筛选高校。
没有解决我的问题, 去提问

悬赏问题

¥15 关于#python#的问题：求帮写python代码
¥20 MATLAB画图图形出现上下震荡的线条
¥15 LiBeAs的带隙等于0.997eV,计算阴离子的N和P
¥15 关于#windows#的问题：怎么用WIN 11系统的电脑克隆WIN NT3.51-4.0系统的硬盘
¥15 来真人，不要ai！matlab有关常微分方程的问题求解决，
¥15 perl MISA分析p3_in脚本出错
¥15 k8s部署jupyterlab，jupyterlab保存不了文件
¥15 ubuntu虚拟机打包apk错误
¥199 rust编程架构设计的方案有偿
¥15 回答4f系统的像差计算