qq_15098375 2017-11-06 13:37 采纳率: 0%
浏览 3396

python爬虫运行后找不到爬取的图片

#!/usr/bin/python

-*- coding: UTF-8 -*-

import re
import urllib.request

def getHtml(url):
page=urllib.request.urlopen(url)
html=page.read()
return html

html=getHtml("http://tieba.baidu.com/p/3205263090")
html=html.decode('UTF-8')

def getImg(html):
reg=r'src="(.+?.jpg)"pic_ext'
imgre=re.compile(reg)
imgList=re.findall(imgre,html)
return imgList

imgList=getImg(html)
imgName=0
for imgPath in imgList:
f=open("F:/pic/"+str(imgName)+".jpg",'wb')
f.write((urllib.request.urlopen(imgPath)).read())
f.close()
imgName+=1
print("all done")
代码如上,在f盘的pic文件夹下找不到图片。

  • 写回答

3条回答

  • tian_shl 2017-11-06 14:27
    关注

    你的正则有点问题

    我写了一个类似的方法,亲测可用,可以参考一下

     # -*- coding: utf-8 -*-
    import re
    import requests
    
    url = "http://tieba.baidu.com/p/3205263090"
    html = requests.get(url).content.decode('UTF-8')
    
    reg = re.compile(r'BDE_Image" src="(.+?\.jpg)" pic_ext')
    img_list = reg.findall(html)
    
    for idx, img in enumerate(img_list):
        with open('F:/pic/{}.jpg'.format(idx), 'wb') as f:
            f.write(requests.get(img).content)
    
    print("all done")
    
    

    运行结果如下:
    图片说明

    评论

报告相同问题?

悬赏问题

  • ¥15 素材场景中光线烘焙后灯光失效
  • ¥15 请教一下各位,为什么我这个没有实现模拟点击
  • ¥15 执行 virtuoso 命令后,界面没有,cadence 启动不起来
  • ¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
  • ¥20 有关区间dp的问题求解
  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置
  • ¥15 有没有研究水声通信方面的帮我改俩matlab代码
  • ¥15 ubuntu子系统密码忘记
  • ¥15 保护模式-系统加载-段寄存器