大众点评的数据爬取每天都在修修改改缝缝补补还是这样都不知道怎么解决了。😭😭有人会嘛吗

代码用了很多方面反反爬
随机IP池随机请求头验证码的处理模拟人类行为爬等

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2023-12-09 08:27
关注
【相关推荐】

你可以参考下这个问题的回答, 看看是否对你有帮助, 链接: https://ask.csdn.net/questions/7734128
你也可以参考下这篇文章：【日常】利用代理IP伪装进行多进程爬虫
除此之外, 这篇博客: 数据：快来爬我呀！小白：ip被封了数据：做个ip代理池吧！这样就可以继续爬我了中的 2.通过爬取的IP代理和自己的IP访问网址的量进行对比 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:

上面那个运行完毕之后，会在同一个文件夹下面出现一个ip.txt的文件，上面的可用的ip代理就在这个文件里面，如下：

大家也许会觉得很少，但不要忘记我这里只是爬取了一页西祠代理上面可用的ip，然后，我用这些ip来访问了一下快代理，发现如下：

可以发现，运用这几个ip代理可以访问快代理这个网址到一千多页，如果不用ip代理，或许最多也只能访问一百多页吧！
代码如下：

import requests with open(file='./ip.txt',mode='r',encoding='utf-8') as f: str1=f.read() list1=str1.split('\n')[:-1] j=0 for i in range(1,3001): try: proxies={'https':list1[j]} try: response=requests.get(url='https://www.kuaidaili.com/free/inha/{}/'.format(i),proxies=proxies) print(response.url) print(response.status_code) except: j+=1 print('第{}ip开始'.format(j)) except: print('所有代理已经全部使用！') break

不用ip代理运行结果：

在访问这个网址时，发现如下，无论我怎样刷新都是这样，或许是ip被封了吧！

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

一文带你搞定七大编程语言的环境配制(Windows系统)与简单项目的构建(保姆级教程)
2025-06-22 13:00

Hello,Mr Crab的博客本文，我将为大家讲解TIOBE排行榜上排名前七的编程语言在Windows系统上的环境配置。这七种编程语言分别是Python,C++,C,java,C#,Go,javaScript,并且教会大家如何在IDE中构建简单的项目并书写这七种语言。
2025年java总结：缝缝补补又一年？
2025-12-30 12:58

沛哥儿的博客在Python、Go、Rust等语言的冲击下，Java似乎总是在"打补丁"而非彻底革新。然而，在2025年这个技术剧变的时代，我想分享一个不同的视角：这些所谓的"缝补"，实际上是精心设计的系统性进化。正如在《Effective Java...
【Linux网络编程】数据链路层
2024-04-27 10:06

LuckyRich1的博客这篇文章是整个网络通信的最后一层数据链路层，我们主要学习MAC帧，虽然IP具有将数据跨网络送到目标主机的能力，但是在跨网络送之前是如何解决同一个局域网内送到下一跳路由器呢？我们要了解局域网通信的原理，以及...
CHIP——基于事后扰动的「人形自适应柔顺力控制」：不动reward或参考轨迹，把“受力后的位姿偏移”解释成policy本来就该跟的目标，以兼顾追踪模仿和受力后的柔顺性
2025-12-18 15:51

v_JULY_v的博客该方法在不修改参考轨迹和奖励函数的前提下，仅通过调整输入观测值来训练策略，使机器人既能保持运动敏捷性，又能对外力作出柔顺响应。相比传统方法需要大量合成数据或离线运动编辑，CHIP可直接集成到现有运动跟踪...
Java软件设计模式精讲
2021-06-20 22:24

当遇到产品需求，总是对代码缝缝补补，不能很快的去解决。而且平时工作中，总喜欢把代码堆在一起，出现问题时，不知道如何下手，工作效率很低，而且自己的能力也得不到提升。而这些都源于一个问题，那就是软件设计没...
收藏多年的MySQL函数大全笔记，笔记一生一起走，那些日子不再有
2021-08-21 10:29

退休的龙叔的博客在文章末尾也会给大家附上我自己整理的源文件，可以在文件的基础上进行灵活地修改和批注等操作，形成属于自己的资料笔记。文章目录前言 @[toc] 一、流程控制函数二、聚合函数三、加密函数四、日期函数五、...
为什么90%的质量问题查不到根源？这套全流程质量管控体系请收好！
2025-05-30 13:49

Leo.yuan的博客制造业质量管理面临信息碎片化、数据追溯难、经验依赖和组织协同不足等痛点。构建数字化质量管理体系需分六步：数据采集、质量追溯、资源配置、工艺调整、人员培训和预防措施。三个底层原则强调质量设计优先、波动...
《你烧钱养的，不是爆款，可能是数据债》—— 一位电商数仓专家的利润洞察
2025-11-27 19:47

老徐电商数据笔记的博客摘要：电商企业常面临"...解决方案是构建数据基建体系：整合多系统数据、建立标准化利润模型、开发可视化实时利润驾驶舱。建议企业优先解决核心商品利润报表自动化，逐步完善数据体系，以数据驱动精准决策。
生活在缝缝补补中前进
2025-03-13 00:43

给自己做加法的博客入职第一天就发现服务环境没有搞好，centos还是那种最基础的镜像版本，装啥啥失败，印象中一键安装到这里全部失效，网上的安装教程在这里统统失效，人都麻了。总算环境弄好了，开发进度快速推进，感觉以前一星期的...
它依然仅仅只是在互联网之上的缝缝补补，并且工具依然还是互联网技术
2022-09-08 23:49

互联网志的博客当支撑产业互联网的技术并未成熟，当互联网依然是产业互联网的内在技术，纵然是产业互联网再具有颠覆性和创新性，那么，它依然仅仅只是在互联网之上的缝缝补补，并且缝缝补补的工具，依然还是互联网技术，无法从内在...
2022年海外年度宏观报告：缝缝补补又一年.pdf
2022-02-22 11:50

2022年海外年度宏观报告：缝缝补补又一年.pdf
r语言中怎么提取矩阵中的第i行_数据运算026篇数据的行拆分
2020-11-21 15:25

weixin_39965514的博客 “tidyr的separate_rows及数据预处理”生活科学哥-R语言科学 2020-10-08 7：03赶上长假的尾巴，今天早起处理一个朋友的简单的R问题，这里给大家分享一下。问题很简单，但是需要一点点数据的预处理：针对一数据框中的...
Python Spider学习笔记（一）：爬取B站视频基本信息
2023-09-03 01:16

Smile_to_destiny的博客利用Selenium获取BV_ID 对于B站视频来说，只要知道了他的BV号就相当于一个人你知道了他的身份证号，想要知晓他的更多的信息也就不是什么难事儿了，因此在本文中，我们要进行的第一步就是获取到我们想要爬取信息的B站...
爬取某公司特定年份年报+年报表格信息提取
2023-06-20 21:06

RaYuj的博客从巨潮爬取公司年报，利用pdfplumber提取表格信息
部编人教版四年级下册小学道德与法治第06课有多少浪费本可避免同步练习（一课一练）.doc
2021-10-26 00:03

这篇文档是针对小学四年级下学期的一份道德与法治课程同步练习，主题为"有多少浪费本可避免"，旨在教育孩子们观察生活中的浪费现象，理解浪费的危害，并培养他们节约资源的习惯。以下是根据文档内容提炼出的相关知识...
codex可以100%正式接管所有编程工作了吗？
2026-03-06 10:03

JamesYoung7971的博客 AI编程助手已能高效完成明确编码任务，但难以承担工程责任。实际使用中，它擅长边界清晰的代码生成和小功能实现，但缺乏系统级判断力，容易忽略隐性约束和历史兼容问题。关键在于开发者需保持审核能力，将AI作为执行...
概念说三遍！真正内心强大的人，允许一切发生——早读（逆天打工人爬取热门微信文章解读）
2024-11-21 16:58

爱学习的爬虫者的博客任何事情的发生，都有它的因缘所在，都有迹可循。辜负你的人，因你的轻信而来；伤害你的人，因你的软弱而来。有些人，是为了教会你一些道理；有些事，是为了倒逼你做出改变。如果我们能明白，事出必有因，自己...
PyTorch如何修改模型（魔改）
2024-04-29 12:16

鱼儿也有烦恼的博客对模型缝缝补补、修修改改，是我们必须要掌握的技能，本文详细介绍了如何修改PyTorch模型？也就是我们经常说的如何魔改。PyTorch 的模型是一个 torch.nn.Module 的某个子类的对象，修改模型实际就等价于修改某个类，...
D. 连续最大积吗为什么要留代码呢因为我缝缝补补的就过了也不知道咋回事
2016-03-12 19:16

---Panda的博客第一行输入一个正整数T，表示总共有T组数据(T )。接下来的T组数据，每组数据第一行输入N，表示数组的元素总个数（1）。再接下来输入N个由0，-2，2组成的元素，元素之间用空格分开。 Output ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月8日

大众点评的数据爬取 每天都在修修改改缝缝补补 还是这样 都不知道怎么解决了。😭😭有人会嘛吗

2条回答 默认 最新

问题事件

大众点评的数据爬取每天都在修修改改缝缝补补还是这样都不知道怎么解决了。😭😭有人会嘛吗

2条回答默认最新