python爬虫得到的图片打不开

python爬虫爬取到的图片打不开，但是在爬取到的网页进去是正常的，可以看到图片，就不知道是怎么回事，请大佬帮忙看看。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

willion88 2021-11-16 11:54

关注

import requests
from lxml import etree
import os
url = 'https://pic.netbian.com/new/'

page_text = requests.get(url).content
tree = etree.HTML(page_text)
div_list = tree.xpath('//div[@class="slist"]/ul/li')
if not os.path.exists('upian'):
    os.mkdir('upian')
for img in div_list:
    src = 'https://pic.netbian.com/'+img.xpath('./a/@href')[0]

    name = img.xpath('./a/img/@alt')[0]+'.jpg'
    print(src,name)
    pic = requests.get(src).content
    tree2 = etree.HTML(pic)
    picurl = 'https://pic.netbian.com'+tree2.xpath('//*[@id="img"]/img/@src')[0]
    print(picurl)
    response = requests.get(picurl).content
    pic_path = 'upian/'+name

    with open(pic_path,'wb')as f:
        f.write(response)
        print(name,'done*****************')

不写绝对路径，默认是当前工作文件夹，所以直接加tupian,前面的./没毛用。
再有就是你把获取到的网址就当做图片的网址是不对的。页面里还有很多其他的照片，文字等等。真实地址要打开之后只能看到图片。

报告相同问题？

关注问题

python爬虫爬取图片，图片打不开 python 爬虫
2022-10-18 21:52

回答 1 已采纳图片是从cdn上过来的，做了防盗链。在headers中添加Refer，指向该网站就行了。 import re import requests import os if not os.path.ex
python 爬虫 requests.get() 所有网页都打不开 python 爬虫
2022-09-24 23:49

回答 1 已采纳 http协议都没加
python爬虫html获取不全 html python 爬虫
2022-06-24 19:43

回答 1 已采纳其实有的，但是这个网站应该是为了懒加载把url用base64密了一下，然后再动态加载，其实我下面发的这个就是url 是base64后的url 解码后就是https://s1.aigei.com/
python 爬虫图片打不开_爬虫下载图片打不开是什么原因，最新简易爬虫教程
2020-12-19 22:30

weixin_39789206的博客前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。作者： GitPythonPS：如有需要Python学习资料的小伙伴可以加点击下方链接自行获取...
通过python爬虫，爬取到的图片无法打开，请问要怎么办？ pycharm python
2021-08-11 23:59

回答 2 已采纳你是真的秀，没有请求图片地址获得数据肯定打不开啊，你写入的是列表的的文本的二进制，并不是图片的。应该在图片链接后面再请求一次图片网址，然后写入获得的响应数据的二进制内容，望采纳哈
python爬虫返回的html文件打开网页是空的 python
2022-06-15 23:07

回答 1 已采纳很正常，一个网页能运行，不但需要html文件，还需要css和js文件在背后支撑。（前端和后端）你只是爬下来了一个html文件，自然什么都不会展示出来。你仔细想想，如果这么轻易的就能被你爬到百度的htm
python爬虫问题求解 python 爬虫
2022-04-29 11:12

回答 1 已采纳我给你改了一下，你对比看看吧： from bs4 import BeautifulSoup import pandas as pd import requests def crawer_travel
python爬虫：Python 爬虫知识大全
2024-06-22 14:59

python爬虫：Python 爬虫知识大全； python爬虫：Python 爬虫知识大全； python爬虫：Python 爬虫知识大全； python爬虫：Python 爬虫知识大全； python爬虫：Python 爬虫知识大全； python爬虫：Python 爬虫知识...
Python 爬虫爬取页面pagetext不完整是静态页面 python 有问必答爬虫
2021-10-21 15:16

回答 1 已采纳该页面信息通过用户选择选项，js动态渲染加载数据的，比如在选项框中输入name,在XHR中就可以看到name的动态加载链接，对其进行请求可获取相关信息的json数据信息。
python 爬虫正则表达式打印遇到问题 python 正则表达式爬虫
2021-12-30 23:54

回答 2 已采纳 ulrs = re.findall('<img src="(.*?)" alt=".*?">', html) 改成这样就行了，有帮助的话采纳一下哦！谢谢！
python爬虫爬取网页为什么获得的不是正常网页数据 python 爬虫
2022-05-12 14:48

回答 2 已采纳这代码里面好多错误，你是怎么运行成功的？
python爬虫基础python爬虫基础
2023-12-28 00:56

python爬虫基础python爬虫基础python爬虫基础python爬虫基础python爬虫基础python爬虫基础python爬虫基础python爬虫基础python爬虫基础python爬虫基础python爬虫基础python爬虫基础python爬虫基础python爬虫基础...
python爬虫数据显示问题 python 爬虫
2022-07-20 16:54

回答 3 已采纳首先，你这里写错了divs = query(".cm-content-box").items()
python爬虫大作业报告+代码
2021-12-30 17:42

所学Python技术设计并实现一个功能完整的系统，并撰写总结报告。...爬取图片不能少于500张。采集数据不能少于1000条，统计分析的目标不能少于3个。（3）实现时要考虑模块化，不能将所有功能均在一个程序内实现。
【python爬虫】python爬虫基础知识及简单实践
2024-05-17 11:31

【python爬虫】python爬虫基础知识及简单实践【python爬虫】python爬虫基础知识及简单实践【python爬虫】python爬虫基础知识及简单实践【python爬虫】python爬虫基础知识及简单实践【python爬虫】python爬虫基础知识...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月13日

悬赏问题

¥20 python忆阻器数字识别
¥15 无法输出helloworld
¥15 高通uboot 打印ubi init err 22
¥20 PDF元数据中的XMP媒体管理属性
¥15 R语言中lasso回归报错
¥15 网站突然不能访问了，上午还好好的
¥15 有没有dl可以帮弄”我去图书馆”秒选道具和积分
¥15 semrush,SEO,内嵌网站，api
¥15 Stata:为什么reghdfe后的因变量没有被发现识别啊
¥15 振荡电路，ADS仿真

python爬虫得到的图片打不开

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新