xirurensheng_123 2018-05-14 03:21 采纳率: 0%
浏览 1441
已结题

python爬虫为什么下载图片和下载音乐不起作用

图片说明代码如下:
class MyimagePipeline(ImagesPipeline):
20 ----
21 def get_media_request(self, item, spider):
22 for url_tmp in item["singer_img"]:
23 if url_tmp != '':
24 yield Request(url=url_tmp, meta={"item":item, "file_name":item["singer_img_path"]})
25 ----
26 def file_path(self, request, response=None, info=None):
27 item = request.meta["item"]
28 image_name = item["singer_name"]+".jpg"
29 dir_name = request.meta["file_name"]
30 dir_name = re.sub(r'[?\*|"<>:/]', '', name)
31 filename = u'{0}/{1}'.format(dir_name, image_name)
32 print('=='*20)
33 print(filename)
34 print('=='*20)
35 return filename
配置文件设置如下:
67 ITEM_PIPELINES = {
68 #'mp3.pipelines.Mp3Pipeline': 300,
69 #'mp3.pipelines.MyfilePipeline': 150,
70 'mp3.pipelines.SongPipeline': 100,
71 'mp3.pipelines.MyimagePipeline': 4,
72 }
73 IMAGES_STORE='/root/workspace/pcap/mp3/mp3/File/'

注意:
其中spider中已经将所有定义要提取的数据已经获取到了,其中MyfilePipeline是将提取出来的数据写在文件里边这个是没有问题的,剩下的两个SongPipeline和MyimagePipeline分别为下载歌曲和下载图片的,使用pdb在这两个类中打断点代码不会进去

  • 写回答

3条回答

  • judiankawu 2018-05-14 03:24
    关注

    其中spider中已经将所有定义要提取的数据已经获取到了

    评论

报告相同问题?

悬赏问题

  • ¥15 如何在3D高斯飞溅的渲染的场景中获得一个可控的旋转物体
  • ¥88 实在没有想法,需要个思路
  • ¥15 MATLAB报错输入参数太多
  • ¥15 python中合并修改日期相同的CSV文件并按照修改日期的名字命名文件
  • ¥15 有赏,i卡绘世画不出
  • ¥15 如何用stata画出文献中常见的安慰剂检验图
  • ¥15 c语言链表结构体数据插入
  • ¥40 使用MATLAB解答线性代数问题
  • ¥15 COCOS的问题COCOS的问题
  • ¥15 FPGA-SRIO初始化失败