爬虫只能运行第一页，不能爬取后续页码

想爬取美女图片，网址：http://www.tu11.com/xingganmeinvxiezhen/list_1_1.html
编写了如下爬虫：

import requests
from bs4 import BeautifulSoup

def get_1_page(url):

    headers = {"User-Agent":"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36"}

    response = requests.get(url,headers=headers).text
    return response

def parse_1_page(html):
    soup=BeautifulSoup(html,'lxml')
    for a in soup.find_all(class_='col-xs-1-5'):
        print(a.img['src'])

for i in range(1,10):
    url='http://www.tu11.com/xingganmeinvxiezhen/list_1_'+str(i)+'.html'
    html=get_1_page(url)
    parse_1_page(html)

但是只能爬取第一页，之后就报错误：图片说明

求大神看看

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
slongzhang_ 2020-11-16 10:17
关注
https

解决
无用 4
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python爬虫翻页爬取的数据是第一页的重复数据 python 爬虫问答团队
2021-12-18 19:23

回答 1 已采纳爬下一页就好了
Python 爬虫爬取页面pagetext不完整是静态页面 python 有问必答爬虫
2021-10-21 15:16

回答 1 已采纳该页面信息通过用户选择选项，js动态渲染加载数据的，比如在选项框中输入name,在XHR中就可以看到name的动态加载链接，对其进行请求可获取相关信息的json数据信息。
Python爬虫能不能用正则表达式爬取学历部分？ python 爬虫
2022-09-25 14:35

回答 2 已采纳你好，这种HTML结构一般用xpath匹配，对于js般用正则表达式匹配，如果非要用正则表达式匹配HTML一般用：开头+（.*?）+结尾，括号里面的内容就是你要匹配的
【网络爬虫】(3) 案例小结，文本内容爬取，附Python代码
2024-03-25 13:54

立Sir的博客本节总结一下各种文本内容爬取的方法，进行一下案例实战，附详细解析，包含：微博评论爬取；结果展示，文件名是问题，内容是回答，以txt保存。结果展示，评论信息保存在excel中。2. 豆瓣TOP250电影信息爬取。结果...
python爬虫爬取图片，图片打不开 python 爬虫
2022-10-18 21:52

回答 1 已采纳图片是从cdn上过来的，做了防盗链。在headers中添加Refer，指向该网站就行了。 import re import requests import os if not os.path.ex
在以瀑布流方式翻页的网站,使用scrapy网络爬虫,但是只爬取了第一页数据,没有爬取第二页. python 爬虫
2021-09-05 19:18

回答 2 已采纳那叫ajax，
Python selenium的爬虫无法完整爬取整个页面的内容 python selenium 爬虫
2021-10-24 09:44

回答 1 已采纳爬取内容不完整，应该是文档的更多内容，要往下滑动页面才会出现这个不太清楚，应该不是什么反爬，就是类似于中途给你弹出个广告，要具体分析怎么弄VIP内容肯定是需要你的账号是VIP才能看得到的，与selen
[Python从零到壹] 六.网络爬虫之BeautifulSoup爬取作者个人博客网站详解
2021-02-17 22:20

Eastmount的博客前一篇文章讲述了...这篇文章将详细讲解 BeautifulSoup 爬取作者个人博客网站，通过案例的方式让大家熟悉Python网络爬虫，同时作者博客网站也是非常适合入门的案例，也能普及简单的预处理知识。希望对您有所帮助
python 爬虫，如何爬取相关数据 python 有问必答爬虫
2021-11-11 11:15

回答 1 已采纳先确定需要爬取的网站，然后分析网站的数据来源，是后端生成数据还是ajax生成数据，确定数据来源方式就根据HTTP请求编写代码，这个涉及一些请求参数的加密、转换等等处理，然后清洗数据和数据入库
Python爬虫配合VPN爬取出现报错 python 爬虫
2021-12-22 17:33

回答 1 已采纳你这个是VPN代理问题，你可以将VPN设置成部分代理，不要全部代理你的网络。
求每次只能爬取第一页的数据，如何爬取这种翻页的网页代码！ python 有问必答
2021-08-20 20:07

回答 4 已采纳直接请求数据接口就行了，分页参数是pn，这修改就行，示例代码如下，有帮助麻烦点个采纳【本回答右上角】，谢谢~~有其他问题可以继续交流~ http://3.push2.eastmoney.com/api
Python爬虫案例2：爬取前程无忧网站数据
2023-10-27 13:56

VIV-的博客运用python的selenium模块爬取前程无忧网站的1万条数据
用爬虫爬取网页，表格第一行内容无法获得 python 爬虫
2021-12-14 09:11

回答 1 已采纳如果是想要获得标题，表头用的是th，不是td。和表格正文内容不是一样的。
Python爬虫爬取动态页面思路+实例（一）
2016-12-21 17:48

孔天逸的博客简介有时候，我们天真无邪的使用urllib库或Scrapy下载HTML网页时会发现，我们要提取的网页元素并不在我们下载到的HTML之中，尽管它们在浏览器里看起来唾手可得。...爬取动态页面目前来说有两种方法分析页面请求（这篇
python循环爬取页面_使用for或while循环来处理处理不确定页数的网页数据爬取
2020-12-09 11:06

weixin_39605345的博客本文转载自以下网站: Python For 和 While 循环...第一种方式使用 For 循环配合 break 语句，尾页的页数设置一个较大的参数，足够循环爬完所有页面，爬取完成时，break 跳出循环，结束爬取。第二种方法使用 While...
没有解决我的问题, 去提问

悬赏问题

¥60 版本过低apk如何修改可以兼容新的安卓系统
¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
¥50 有数据，怎么建立模型求影响全要素生产率的因素
¥50 有数据，怎么用matlab求全要素生产率
¥15 TI的insta-spin例程
¥15 完成下列问题完成下列问题
¥15 C#算法问题, 不知道怎么处理这个数据的转换
¥15 YoloV5 第三方库的版本对照问题
¥15 请完成下列相关问题！
¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像，如何解决？

爬虫只能运行第一页，不能爬取后续页码

1条回答 默认 最新

悬赏问题

1条回答默认最新