啊陈脑壳疼 2021-01-29 20:07 采纳率: 0%
浏览 227

python批量淘宝网页图片爬取

在家无聊,在家自学爬虫!照着书上的代码敲得,能运行,没有报错,但就是爬取不到图片!求大佬指点!

import urllib.request
import re
key_name = urllib.request.quote("笔记本电脑")
def savefile (data):
    path ="C://Users/Administrator/Desktop/taobao_url.txt"
    file = open(path,"a")
    file.write(data+"\n")
    file.close()
for p in range (0,6):
    url ="https://s.taobao.com/search?q=" + key_name + \
          "&imgfile=&ie=utf8&p4ppushleft=5%2C48"+"&s="+str(p*48)
    datal = urllib.request.urlopen(url).read().decode("utf-8")
    savefile(url)
    pat = 'pic_url":"//(.*?)"'
    img_url = re.compile(pat).findall(datal)
    print(img_url)
    for a_i in range (0,len(img_url)):
        this_img = img_url[a_i]
        this_img_url = "http://"+this_img
        print(this_img_url)
        img_path = "D:\imagetb"+str(p)+str(a_i)+".jpg"
        urllib.request.urlretrieve(this_img_url,img_path)

    我感觉应该是网址的问题,改了以后经常报错然后就改回来了!

  • 写回答

3条回答 默认 最新

  • 天中云雾 2021-01-29 20:33
    关注

    被js反爬了

    评论

报告相同问题?

悬赏问题

  • ¥15 odoo17处理受托加工产品
  • ¥15 如何用MATLAB编码图三的积分
  • ¥15 为什么我安装了Homebrew之后,无法像官网的那样通过执行命令安装Watchman
  • ¥15 圆孔衍射光强随孔径变化
  • ¥15 MacBook pro m3max上用vscode运行c语言没有反应
  • ¥15 ESP-PROG配置错误,ALL ONES
  • ¥15 结构功能耦合指标计算
  • ¥50 AI大模型精调(百度千帆、飞浆)
  • ¥15 非科班怎么跑代码?如何导数据和调参
  • ¥15 福州市的全人群死因监测点死亡原因报表