抓取一个电影网站图片，图片链接没有规律，该怎么改才能运行

image_url = html.xpath('//div[@class="media-wrapper"]/a/img/@data-original')
# # print(div_image)
# for j in image_url:
# response1 = requests.get(img_url1,headers=headers)
#
# # with open("./data/{}-{}.jpg".format(name_list, j), "wb") as f:
# # f.write(response1.content)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

CSDN专家-showbo 2021-12-10 15:09

关注

不知道是不是题主要的，下载图片的代码题主自加下

import requests
from lxml import etree
from openpyxl import Workbook
wb=Workbook()
ws=wb.active
ws.append(["电影名称","电影分类","所属国家","年份","导演","演员","封面图片"])
#准备url和headers
headers={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.87 Safari/537.36 SE 2.X MetaSr 1.0"}

tmpurl="https://www.kkdsa.com/vodtype/6-{}.html"#分页url模板

for i in range(1,2):#############################采集多个分页修改这里的2
    url=tmpurl.format(i)
    response=requests.get(url=url,headers=headers)
    html=etree.HTML(response.text)
    div_list=html.xpath('//div[@class="cards video-list"]/div')
    for div in div_list:
        name=div.xpath('.//div[@class="card-heading text-ellipsis"]/strong/a/text()')[0]# 剧名
        director='，'.join(div.xpath('.//div[@class="caption"]/p[1]/a/text()'))# 导演
        actor ='，'.join(div.xpath('.//div[@class="caption"]/p[2]/a/text()'))# 演员
        img=div.xpath('.//img[@class="lazy"]/@data-original')[0]
       
        # 分类 国家 年份
        arr=''.join(div.xpath('.//div[@class="card-content text-ellipsis text-muted"]//text()')).split('/')
        classify=arr[0]#分类
        country=arr[1]#国家
        year=arr[2]#年份
        print(name,classify,country,year,director,actor,img)
        ws.append([name,classify,country,year,director,actor,img])
    
wb.save("天堂电影网.xlsx")

本回答被题主选为最佳回答 , 对您是否有帮助呢?

编辑记录

报告相同问题？

关注问题

抓取一个电影网站图片，图片链接没有规律，该怎么改才能运行 python 有问必答
2021-12-10 14:42

回答 1 已采纳不知道是不是题主要的，下载图片的代码题主自加下 import requests from lxml import etree from openpyxl import Workbook wb=Wor
抓取韩剧网站多个网页的韩剧详情页链接，图片，现在怎么改才能运行出来 python 有问必答
2021-12-10 18:36

回答 2 已采纳请求的headers和url都要写正确，添加referer，请求头改为 "user-agent"，原代码中detaillink的xpath不正确，多页请求时添加延时。测试代码如下，可获取数据。 imp
抓取一个电影网站多个网页的剧名，主演，年份，现在怎么改才能运行出来 python 有问必答
2021-12-09 19:00

回答 2 已采纳这样？ import requests from lxml import etree from openpyxl import Workbook wb=Workbook() ws=wb.active
python爬取图片论文_一篇文章教会你利用Python网络爬虫抓取王者荣耀图片
2021-03-06 16:08

上已酒的博客【一、项目背景】王者荣耀作为当下最火的游戏之一，里面的人物信息更是惟妙惟肖，但受到官网的限制，想下载一张高清的图片很难。(图片有版权)。以彼岸桌面这个网站为例，爬取王者荣耀图片的信息。【二、项目目标】...
抓取一个韩剧网站多个网页的剧名，演员，更新状态，现在怎么改才能运行出来 python 有问必答
2021-12-09 15:43

回答 2 已采纳题主要的xpath采集代码如下 import requests from lxml import etree from openpyxl import Workbook wb=Workbook()
python抓取图片无法正常显示 python
2021-03-06 19:08

回答 1 已采纳 import os import requests import re import time import random if __name__ == "__main__" : # 创
一个Python抓取网页数据的问题 python 有问必答
2021-04-21 08:19

回答 7 已采纳这个长的字符串, 前面后面各加一个[ ], 就成了'[[],[]]'' 这种格式, 可以用eval()再转换一下, 就成了[[],[]] 可以生成数组或者dataframe,dataframe可转成
python多线程爬取图片_python 多线程爬取网站图片（详解）
2021-03-06 01:20

ShuYini的博客 1网站整个图片的意思是，网站有用的图片，广告推荐位，等等除外萌新上路，老司机请略过第一步找出网站url分页的规律选择自己要爬取的分类(如果要所有的图片可以不选，显示的就是所有的照片，具体怎么操作请根据实际...
python 如何抓取网页地址保存为图片？ python
2021-11-09 13:05

回答 1 已采纳 PIL ,或者pyautogui
Python获取摄像头图片问题 opencv python
2022-11-18 12:59

回答 2 已采纳感觉可以初始化两个cap执行 camera0 cap0= cv2.VideoCapture(0) camera1 cap1= cv2.VideoCapture(1)
为什么这个python代码只能抓取豆瓣top250最后一页的内容 python 有问必答
2021-08-06 14:39

回答 2 已采纳因为解析语句没有在for循环当中，下面这样就可以有帮助，望采纳！ #!/usr/bin/python # -*- coding: UTF-8 -*- """ @author: YangPC @QQ:3
基于Python的海量豆瓣电影、数据获取、数据预处理、数据分析、可视化、大屏设计项目（含数据库）
2023-06-27 15:05

王小王-123的博客本文基于Python的网络爬虫手段对豆瓣电影网站进行数据的抓取，通过合理的分析豆瓣网站的网页结构，并设计出规则来获取电影数据的JSON数据包，采用正态分布的延时措施对数据进行大量的获取。并利用Python的Pandas数据...
这个应该怎么改才能抓取详情信息 python 有问必答
2021-06-24 09:17

回答 2 已采纳 name = link["title"]，，link没有title这个属性，应该是定位问题吧如果对你有帮助，可以点击我这个回答右上方的【采纳】按钮，给我个采纳吗，谢谢
python爬取手机app图片_python 手机app数据爬取
2020-12-04 00:39

weixin_39813009的博客 @一：爬取主要流程简述1.APP的爬取比Web爬取更加容易，反爬虫没有那么强，且大部分数据是以JSON形式传输的，解析简单。2.在APP中想要查看请求与响应(类似浏览器的开发者工具监听到的各个网络请求和响应)，就需要借助...
用python批量下载网络图片_批量下载网站图片的Python实用小工具
2020-11-22 11:50

weixin_39597987的博客只要懂得如何安装Python库以及运行Python程序，就能使用本文给出的程序批量下载指定图片啦！在网上冲浪的时候，总有些“小浪花”令人喜悦。没错，小浪花就是美图啦。边浏览边下载，自然是不错的；不过，好花不常开，...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 12月11日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月10日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月10日

悬赏问题

¥15 wegame打不开英雄联盟
¥15 公司的电脑，win10系统自带远程协助，访问家里个人电脑，提示出现内部错误，各种常规的设置都已经尝试，感觉公司对此功能进行了限制（我们是集团公司）
¥15 救！ENVI5.6深度学习初始化模型报错怎么办？
¥30 eclipse开启服务后，网页无法打开
¥30 雷达辐射源信号参考模型
¥15 html+css+js如何实现这样子的效果？
¥15 STM32单片机自主设计
¥15 如何在node.js中或者java中给wav格式的音频编码成sil格式呢
¥15 不小心不正规的开发公司导致不给我们y码，
¥15 我的代码无法在vc++中运行呀，错误很多

抓取一个电影网站图片，图片链接没有规律，该怎么改才能运行

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新