juzi_go 2021-11-29 19:12 采纳率: 80%

浏览 56

已结题

python爬虫如何垂直爬取网页内容？

爬取国家地理画廊想爬取点击图片链接进去页面的图片，如何爬取，现在下面的代码只能爬取当前页面的图片与内容，如何修改才能实现爬取图片里面那个链接的内容？

import requests
from lxml import etree


r_url = 'http://www.dili360.com/gallery'
res = requests.get(r_url)

res_html = etree.HTML(res.text)
title = res_html.xpath("/html/body/div[1]/div[3]/ul/li/div[2]/h3/text()")
img_srcs = res_html.xpath("/html/body/div[1]/div[3]/ul/li/div[1]/a/img/@src")
print(img_srcs)
img_lst = []


for item in title:
    print(item)
for src in img_srcs:
    print(src)

运行结果及报错内容

我的解答思路和尝试过的方法

我想要达到的结果

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
YipSzeTo 2021-11-30 14:45
关注
img = requests.get(url=img_url) # img_url：图片的路径 with open('{}.jpg'.format(n), 'wb') as f: # n：文件名 f.write(img.content)
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月3日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月26日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月29日

悬赏问题

¥15 linux驱动，linux应用，多线程
¥20 我要一个分身加定位两个功能的安卓app
¥15 基于FOC驱动器，如何实现卡丁车下坡无阻力的遛坡的效果
¥15 IAR程序莫名变量多重定义
¥15 (标签-UDP|关键词-client)
¥15 关于库卡officelite无法与虚拟机通讯的问题
¥15 目标检测项目无法读取视频
¥15 GEO datasets中基因芯片数据仅仅提供了normalized signal如何进行差异分析
¥100 求采集电商背景音乐的方法
¥15 数学建模竞赛求指导帮助