python爬虫运行后找不到爬取的图片

#!/usr/bin/python

-*- coding: UTF-8 -*-

import re
import urllib.request

def getHtml(url):
page=urllib.request.urlopen(url)
html=page.read()
return html

html=getHtml("http://tieba.baidu.com/p/3205263090")
html=html.decode('UTF-8')

def getImg(html):
reg=r'src="(.+?.jpg)"pic_ext'
imgre=re.compile(reg)
imgList=re.findall(imgre,html)
return imgList

imgList=getImg(html)
imgName=0
for imgPath in imgList:
f=open("F:/pic/"+str(imgName)+".jpg",'wb')
f.write((urllib.request.urlopen(imgPath)).read())
f.close()
imgName+=1
print("all done")
代码如上,在f盘的pic文件夹下找不到图片。

3个回答

你的正则有点问题

我写了一个类似的方法,亲测可用,可以参考一下

 # -*- coding: utf-8 -*-
import re
import requests

url = "http://tieba.baidu.com/p/3205263090"
html = requests.get(url).content.decode('UTF-8')

reg = re.compile(r'BDE_Image" src="(.+?\.jpg)" pic_ext')
img_list = reg.findall(html)

for idx, img in enumerate(img_list):
    with open('F:/pic/{}.jpg'.format(idx), 'wb') as f:
        f.write(requests.get(img).content)

print("all done")

运行结果如下:
图片说明

xiaobuding007
tian_shl 回复qq_15098375: 'F:/pic/{}.jpg' 这个路径改一下 改成你系统有的盘符
接近 3 年之前 回复
qq_15098375
qq_15098375 你好,运行时能够运行,怎么找不到图片呢
接近 3 年之前 回复

我换了一个新的url就不可以了,是不是有贴吧有反爬虫啊

xiaobuding007
tian_shl 可能是tabName不一样
接近 3 年之前 回复

你好,运行时能够运行,怎么找不到图片呢

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
立即提问
相关内容推荐