求解决关于python爬虫问题，进不去循环？

def getData(base_url,num):
html = askUrl(base_url)
soup = BeautifulSoup(html,'html.parser')
count = num
data = []
for addr in soup.find_all('div',class_='imgbox'): #

addr = str(addr)
address = re.findall(find_img_address,addr)
data.append(address)
print(addr)

askUrl(base_url)正常返回的是网页html代码，但是在循环中打印addr就显示不出来，应该是没进入循环体，求大佬告知为啥没进入循环

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-HGJ 2021-07-07 16:24
关注
估计是soup.find_all('div',class_='imgbox')没有返回值。从这几个方面排查修改：检查所写节点是否正确，根据页面代码进行修改; html应该是文本格式，即在askUrl中返回的是html.text;在soup中改用其他解析器,如'lxml’，'html5lib'

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

解决python爬虫假死问题(程序偷停问题)
2024-01-31 10:09

红目香薰的博客解决python爬虫假死问题(程序偷停问题)
Python爬虫系列（一）——手把手教你写Python爬虫
2021-10-23 15:47

纸照片的博客每个浏览器关于查看网页源码有着不同的操作，以谷歌浏览器为例，是在页面中点击鼠标右键，再选择“检查”，在出现的框中选择元素（Elements），我们使用爬虫查询的内容也就包含在这些元素中。比如，我们可以找到...
python爬虫详解
2021-07-11 21:56

穆瑾轩的博客 python爬虫简介 1、基本概念 1.1、什么是爬虫网络爬虫，是一种按照一定规则，自动抓取互联网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。随着网络的迅速发展，万维网...
简单的python爬虫，代码完整
2018-06-21 10:24

在IT行业中，Python爬虫是获取网络数据的重要工具，尤其对于数据挖掘、网站分析和自动化任务有着不可忽视的作用。本资源提供了一个完整的Python2.7版本的简单网络爬虫代码，旨在帮助学习者理解和实践爬虫的基本原理...
Python爬虫详解（一看就懂）
2022-06-21 22:07

练习时长两年半的Programmer的博客爬虫简单的来说就是用程序获取网络上数据这个过程的一种名称。如果要获取网络上数据，我们要给爬虫一个网址（程序中通常叫URL），爬虫发送一个HTTP请求给目标网页的服务器，服务器返回数据给客户端（也就是我们的...
【Python爬虫详解】第一篇：Python爬虫入门指南
2025-04-20 09:15

Luck_ff0810的博客为了应对不同的爬取需求和反爬挑战，Python生态系统提供了多种爬虫相关的库。库名特点适用场景Requests简单易用的HTTP库基础网页获取HTML/XML解析器静态网页内容提取Scrapy全功能爬虫框架大型爬虫项目Selenium浏览器...
Python爬虫实战：爬取视频到本地，超详细实战教程
2025-09-17 11:09

xcLeigh的博客该教程针对批量保存网站视频的需求，详解用 Python 实现爬取的方法。先介绍所需的 requests、BeautifulSoup4、you-get 等工具库及安装步骤，说明网站单视频与合集视频的 URL 特点。接着分阶段讲解核心功能，从单...
Python网络爬虫调试技巧：解决爬虫中的问题
2024-10-09 11:08

master_chenchengg的博客随着Web技术的发展，越来越多的网站采用了JavaScript来动态生成页面内容，这对传统的基于HTML解析的爬虫提出了新的挑战。让我们一起探索新奇的事物，分享生活的点滴，让这个小角落成为我们共同的精神家园。这意味着...
python爬虫翻页功能循环_python 爬虫循环分页
2020-12-03 03:33

weixin_39807352的博客 import osfrom time import sleepimport fakerimport requestsfrom lxml import etreefake = faker.Faker()base_url = "http://angelimg.spbeen.com"def get_next_link(url):content = downloadHtml(url)...
Python爬虫新手指南及简单实战
2024-08-06 09:49

4.0啊的博客在本文中，我们全面介绍了使用Python和Microsoft Edge浏览器进行网页爬取的过程，从环境准备到编写爬虫代码，再到进阶技巧与问题处理，最后通过实际案例展示了爬虫技术的应用。我们强调了安装selenium库和配置...
没有解决我的问题, 去提问

求解决关于python爬虫问题，进不去循环？

2条回答 默认 最新

2条回答默认最新