python批量淘宝网页图片爬取

在家无聊，在家自学爬虫！照着书上的代码敲得，能运行，没有报错，但就是爬取不到图片！求大佬指点！

import urllib.request
import re
key_name = urllib.request.quote("笔记本电脑")
def savefile (data):
    path ="C://Users/Administrator/Desktop/taobao_url.txt"
    file = open(path,"a")
    file.write(data+"\n")
    file.close()
for p in range (0,6):
    url ="https://s.taobao.com/search?q=" + key_name + \
          "&imgfile=&ie=utf8&p4ppushleft=5%2C48"+"&s="+str(p*48)
    datal = urllib.request.urlopen(url).read().decode("utf-8")
    savefile(url)
    pat = 'pic_url":"//(.*?)"'
    img_url = re.compile(pat).findall(datal)
    print(img_url)
    for a_i in range (0,len(img_url)):
        this_img = img_url[a_i]
        this_img_url = "http://"+this_img
        print(this_img_url)
        img_path = "D:\imagetb"+str(p)+str(a_i)+".jpg"
        urllib.request.urlretrieve(this_img_url,img_path)

我感觉应该是网址的问题，改了以后经常报错然后就改回来了！

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
天中云雾 2021-01-29 20:33
关注
被js反爬了

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python爬虫 BeautifulSoup解析网页爬取内容为None python 有问必答
2021-08-31 14:07

回答 2 已采纳你抓的频率太快，IP被墙了
python 批量爬取图片并保存到本地文件夹中不成功 python 有问必答
2021-06-29 15:43

回答 2 已采纳你的temp只是一个字符串，应该是一个url，你还没发送请求，用requests发送一下请求
python爬虫的图片爬取 python 爬虫
2021-08-30 12:26

回答 2 已采纳按照下图这样就可以了
Python应用开发——爬取网页图片
2022-09-06 19:00

柒壹漆的博客当我们需要从网页上面下载很多图片的时候，一...答案是有的，Python爬虫就可以完美的做到这一点，而且作为一个Python的初学者，我可以很负责任的告诉你，这门语言入门挺简单的，特别是对于那些有其他编程语言经验的人。
python爬虫爬取图片，图片打不开 python 爬虫
2022-10-18 21:52

回答 1 已采纳图片是从cdn上过来的，做了防盗链。在headers中添加Refer，指向该网站就行了。 import re import requests import os if not os.path.ex
python爬虫动态网页爬取报错 python 爬虫
2022-11-22 23:06

回答 2 已采纳 news 数据获取错误 import requests import json url = 'https://www.ptpress.com.cn/newsInfo/getCurrentAffairs
python爬虫如何垂直爬取网页内容？ python 开发语言爬虫
2021-11-29 19:12

回答 1 已采纳 img = requests.get(url=img_url) # img_url：图片的路径 with open('{}.jpg'.format(n), 'wb') as f: # n：文件名
Python用beautifulsoup爬取网页数据 python
2022-04-29 00:54

回答 1 已采纳是不是最后一页的数据？导出覆盖了吧
python爬虫爬取网页代码遇到了一些问题 python 爬虫
2022-08-17 17:07

回答 3 已采纳因为元素里的你要的内容是通过 ajax 请求动态加载的，可以浏览器抓包去看下，你想要的这条数据到底是哪个请求返回的，找到真正的请求，然后模拟发送就行了
python爬取百度手机号网页 python 有问必答
2021-09-24 13:08

回答 2 已采纳可以用requests.post获取，需要将参数正确传递。代码可以这么写： import requests import time num=input('input cellphone number:
python爬取百度图片以及图像批量处理
2019-03-09 11:05

本教程将聚焦于如何使用Python来爬取百度图片，并进行图像的批量处理，包括调整图片的大小、格式等。首先，我们需要了解Python中的几个关键库：requests、BeautifulSoup和PIL（Python Imaging Library）。 1. **...
python 爬虫，如何爬取相关数据 python 有问必答爬虫
2021-11-11 11:15

回答 1 已采纳先确定需要爬取的网站，然后分析网站的数据来源，是后端生成数据还是ajax生成数据，确定数据来源方式就根据HTTP请求编写代码，这个涉及一些请求参数的加密、转换等等处理，然后清洗数据和数据入库
python 批量爬取网页pdf_批量抓取网页pdf文件
2020-12-05 12:10

weixin_39630637的博客任务：批量抓取网页pdf文件有一个excel，里面有数千条指向pdf下载链接的网页地址，现在，需要批量抓取这些网页地址中的pdf文件。python环境：anaconda3openpyxlbeautifulsoup4读取excel，获取网页地址使用openpyxl库...
python爬虫项目——自动批量抓取m3u8网页视频
2021-10-14 05:59

通过学习和实践此类项目，开发者不仅可以提升自己的Python编程能力，还能深入理解网络爬虫的工作机制，以及多媒体文件在网络传输中的处理方式。这对于从事数据分析、媒体分析或内容监控等领域的工作大有裨益。
没有解决我的问题, 去提问

悬赏问题

¥15 odoo17处理受托加工产品
¥15 如何用MATLAB编码图三的积分
¥15 为什么我安装了Homebrew之后，无法像官网的那样通过执行命令安装Watchman
¥15 圆孔衍射光强随孔径变化
¥15 MacBook pro m3max上用vscode运行c语言没有反应
¥15 ESP-PROG配置错误，ALL ONES
¥15 结构功能耦合指标计算
¥50 AI大模型精调（百度千帆、飞浆）
¥15 非科班怎么跑代码？如何导数据和调参
¥15 福州市的全人群死因监测点死亡原因报表

python批量淘宝网页图片爬取

3条回答 默认 最新

悬赏问题

3条回答默认最新