最近学习爬虫，可是代码出来之后效果很不对劲，有大神看看出了什么问题，谢谢了……

import requests
from bs4 import BeautifulSoup

url = 'https://699pic.com/qingnianshenghuo.html'

resp = requests.get(url)
resp.encoding='utf-8'

main_page= BeautifulSoup(resp.text, 'html.parser')

alist = main_page.find_all("div", class_="photo-tag")
child_href_list=[]
for a in alist:


    w=a.find("a")

    hrefs = "https:"+w.get("href")
    child_href_list.append(hrefs)
    
    for href in child_href_list:
        child_page_resp = requests.get(href)
        child_page_resp.encoding="utf_8"
        child_page_text = child_page_resp.text
        child_page=BeautifulSoup(child_page_text,"html.parser")
        p = child_page.find("a", class_="photo-img-link")

        img = p.find("img")



        print("https:"+img.get("src"))

主要是抓取的图片重复的太厉害，尤其是第一张图片，没有规律的循环重复……

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-HGJ 2021-04-20 22:51
关注
for href in child_href_list: child_page_resp = requests.get(href) child_page_resp.encoding="utf_8" child_page_text = child_page_resp.text child_page=BeautifulSoup(child_page_text,"html.parser") p = child_page.find("a", class_="photo-img-link") img = p.find("img") print("https:"+img.get("src"))

这段代码不要放到for a in alist:循环里，提到外面就可以了
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

最近学习爬虫，可是代码出来之后效果很不对劲，有大神看看出了什么问题，谢谢了…… python 有问必答
2021-04-20 22:35

回答 4 已采纳 for href in child_href_list: child_page_resp = requests.get(href) child_page_resp.e
python爬虫代码运行不报错，但是保存到CSV的数据为空，是哪里出了问题 python
2022-08-09 16:38

回答 8 已采纳 respone.text获取的json数据格式有问题,用 json.loads(respone.text)解析出错另外写csv文件的代码要放到for循环外面,所有数据获取之后再一起写入 cit
关于#python#的问题：我想知道这段python爬虫代码有什么问题，为什么爬取不到我想要的信息呀代码如下： python 开发语言爬虫
2023-02-16 10:59

回答 3 已采纳。。我试了一下，确实在构造infos时，XPATH没问题，但是infos没有值这里看到protected Attributes 了吗，说明哔哩哔哩还是有反爬机制的。百度一下~https://ask
Python爬虫案例解析：五个实用案例及代码示例（学习爬虫看这一篇文章就够了）
2023-07-07 23:59

Eric，会点编程的博客结论：在本篇博客中，我们介绍了五个实用的Python爬虫案例，并提供了相应的代码示例和解析。这些案例涵盖了不同的应用场景，包括爬取天气数据、图片下载、电影评论、新闻文章爬取和文本分析，以及股票数据爬取和...
python爬虫爬取网页代码遇到了一些问题 python 爬虫
2022-08-17 17:07

回答 3 已采纳因为元素里的你要的内容是通过 ajax 请求动态加载的，可以浏览器抓包去看下，你想要的这条数据到底是哪个请求返回的，找到真正的请求，然后模拟发送就行了
请教一个有关于python写的爬虫代码和vue、java之间的联系的问题 java python vue.js
2022-04-01 09:25

回答 2 已采纳就普通的web应用，后台用java，前端vue，然后爬虫用java调用python脚本就行
Python爬虫，帮我看看有什么错误吗，找不到啊 python 有问必答
2021-06-08 20:18

回答 2 已采纳你是不是打成中文的冒号了，或者多了空格之类的
Python 万能代码模版：爬虫代码篇
2021-09-14 15:27

AI悦创|编程1v1的博客但今天的 Python 课程是个例外，因为今天讲的 **Python 技能，不需要你懂计算机原理，也不需要你理解复杂的编程模式。**即使是非开发人员，只要替换链接、文件，就可以轻松完成。并且这些几个实用技巧，简直是 ...
python爬虫问题，在网页代码找不到自己想要的数据 python 爬虫
2022-02-24 11:15

回答 2 已采纳那个网站啊.你看下是不是写在接口中.F12开发者模式.选择XHR看下
Python爬虫代码可以运行不报错，也显示第几页爬取成功，但就是文件里啥也没有，空白的，可以给看看是哪里出问题了吗？ python 爬虫
2021-11-13 19:59

回答 2 已采纳有写入csv操作，但csv写入的话不可以用字典传进去，写入代码如下： import csv file=open('文件名字.csv','a',encoding='utf-8',newline='')
python爬虫爬取网页为什么获得的不是正常网页数据 python 爬虫
2022-05-12 14:48

回答 2 已采纳这代码里面好多错误，你是怎么运行成功的？
Python爬虫完整代码拿走不谢
2023-03-22 09:46

q56731523的博客对于新手做Python爬虫来说是有点难处的，前期练习的时候可以直接套用模板，这样省时省力还很方便。
python爬虫问题求解 python 爬虫
2022-04-29 11:12

回答 1 已采纳我给你改了一下，你对比看看吧： from bs4 import BeautifulSoup import pandas as pd import requests def crawer_travel
python爬虫代码运行之后不报错也没有结果_看完！一小时带你入门Python爬虫
2020-12-14 13:03

weixin_39615643的博客一、什么叫爬虫爬虫，又名“网络爬虫”，就是能够自动访问互联网并将网站内容下载下来的程序。它也是搜索引擎的基础，像百度和GOOGLE都是凭借强大的网络爬虫，来检索海量的互联网信息的然后存储到云端，为网友提供...
81个Python爬虫源代码
2018-12-13 14:23

81个Python爬虫源代码，内容包含新闻、视频、中介、招聘、图片资源等网站的爬虫资源
没有解决我的问题, 去提问

悬赏问题

¥15 装 pytorch 的时候出了好多问题，遇到这种情况怎么处理？
¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
¥15 手机接入宽带网线，如何释放宽带全部速度
¥30 关于#r语言#的问题：如何对R语言中mfgarch包中构建的garch-midas模型进行样本内长期波动率预测和样本外长期波动率预测
¥15 ETLCloud 处理json多层级问题
¥15 matlab中使用gurobi时报错
¥15 这个主板怎么能扩出一两个sata口
¥15 不是，这到底错哪儿了😭
¥15 2020长安杯与连接网探
¥15 关于#matlab#的问题：在模糊控制器中选出线路信息，在simulink中根据线路信息生成速度时间目标曲线（初速度为20m/s，15秒后减为0的速度时间图像）我想问线路信息是什么

最近学习爬虫，可是代码出来之后效果很不对劲，有大神看看出了什么问题，谢谢了……

4条回答 默认 最新

悬赏问题

4条回答默认最新