抓取一个韩剧网站多个网页的剧名，演员，更新状态，现在怎么改才能运行出来

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

CSDN专家-showbo 2021-12-09 16:32

关注

题主要的xpath采集代码如下

import requests
from lxml import etree
from openpyxl import Workbook

wb=Workbook()
ws=wb.active
ws.append(["韩剧名","主演","更新状态"])
#准备url和headers
headers={
  "User-agent": "Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.87 Mobile Safari/537.36"
}
url ="https://www.hjutv.cn/show_2___________.html"
response = requests.get(url=url,headers=headers)
# 使用etree.HTML()将字符串转换成HTML对象     
html = etree.HTML(response.text)        
# print(html)
#获取ul标签下所有的li
li_list = html.xpath('//ul[@class="vodlist vodlist_wi author*qq3626/95/000 clearfix"]/li')
for li in li_list: 
    # 获取剧名
    name = li.xpath('.//p[@class="vodlist_title"]/a/text()')[0]
    # 获取演员
    actor = li.xpath('.//p[@class="vodlist_sub"]/a/text()')
    if len(actor)==0:#没有演员信息，默认个值
        actor="--"
    else:
        actor=actor[0]
    # 获取更新状态
    updatestatus=li.xpath('.//span[@class="pic_text text_right"]/text()')[0]
    print(name,actor,updatestatus)
    ws.append([name,actor,updatestatus])
wb.save("韩剧.xlsx")

有帮助麻烦点下【采纳该答案】，谢谢~~

本回答被题主选为最佳回答 , 对您是否有帮助呢?

编辑记录

查看更多回答(1条)

报告相同问题？

关注问题

抓取一个韩剧网站多个网页的剧名，演员，更新状态，现在怎么改才能运行出来 python 有问必答
2021-12-09 15:43

回答 2 已采纳题主要的xpath采集代码如下 import requests from lxml import etree from openpyxl import Workbook wb=Workbook()
抓取一个电影网站多个网页的剧名，主演，年份，现在怎么改才能运行出来 python 有问必答
2021-12-09 19:00

回答 2 已采纳这样？ import requests from lxml import etree from openpyxl import Workbook wb=Workbook() ws=wb.active
抓取韩剧网站多个网页的韩剧详情页链接，图片，现在怎么改才能运行出来 python 有问必答
2021-12-10 18:36

回答 2 已采纳请求的headers和url都要写正确，添加referer，请求头改为 "user-agent"，原代码中detaillink的xpath不正确，多页请求时添加延时。测试代码如下，可获取数据。 imp
python简单爬虫抓取网页内容实例
2018-06-08 15:50

一个简单的python示例，实现抓取嗅事百科首页内容，大家可以自行运行测试
抓取一个电影网站图片，图片链接没有规律，该怎么改才能运行 python 有问必答
2021-12-10 14:42

回答 1 已采纳不知道是不是题主要的，下载图片的代码题主自加下 import requests from lxml import etree from openpyxl import Workbook wb=Wor
一个Python抓取网页数据的问题 python 有问必答
2021-04-21 08:19

回答 7 已采纳这个长的字符串, 前面后面各加一个[ ], 就成了'[[],[]]'' 这种格式, 可以用eval()再转换一下, 就成了[[],[]] 可以生成数组或者dataframe,dataframe可转成
如何分析并抓取一个网页满足特定日期条件的所有数据？ python
2022-06-12 17:23

回答 1 已采纳抓取网页数据的几种方法_LiZhen798的博客-CSDN博客_网页数据抓取相信所有个人网站的站长都有抓取别人数据的经历吧，目前抓取别人
使用 Python 进行网页抓取
2022-12-30 21:24

鲸落✗的博客我们将重点介绍为什么您应该使用 Python 进行网页抓取，并为您提供有关如何完成它的快速教程，包括使用哪些Python 开发工具。因此，下一步是部署抓取程序，将信息复制到您请求的数据库中。要获得您希望抓取为Python...
为什么这个python代码只能抓取豆瓣top250最后一页的内容 python 有问必答
2021-08-06 14:39

回答 2 已采纳因为解析语句没有在for循环当中，下面这样就可以有帮助，望采纳！ #!/usr/bin/python # -*- coding: UTF-8 -*- """ @author: YangPC @QQ:3
如何同时提取多个同种div下的第某个span标签(语言-python) css3 html python 有问必答
2021-12-26 11:47

回答 2 已采纳先获取所有class='hd'的div保存到列表中，然后遍历列表中每一项获取这一项div的第二个span targets2 = soup.find_all("div", class_="hd") fo
这个应该怎么改才能抓取详情信息 python 有问必答
2021-06-24 09:17

回答 2 已采纳 name = link["title"]，，link没有title这个属性，应该是定位问题吧如果对你有帮助，可以点击我这个回答右上方的【采纳】按钮，给我个采纳吗，谢谢
python爬虫多个url_Python爬虫爬取网页中所有的url的多种实现方法
2021-02-10 18:41

苏橙橙的博客在使用python爬虫进行网络页面爬取的过程中，第一步肯定是要爬取url，若是面对网页中很多url，，又该如何爬取所以url呢？本文介绍Python爬虫爬取网页中所有的url的三种实现方法：1、使用BeautifulSoup快速提取所有...
请问爬虫里怎么自动爬取多个网页的数据汇总到一个表？ python
2022-02-13 21:26

回答 2 已采纳寻找200多个链接的规律呀，先爬取200多个链接放到列表里，然后便历链接列表对每个链接发请求就行
Python爬虫抓取网页
2022-03-10 12:13

睿科知识云的博客本节讲解第一个 Python 爬虫实战案例：抓取您想要的网页，并将其保存至本地计算机。首先我们对要编写的爬虫程序进行简单地分析，该程序可分为以下三个部分：拼接 url 地址发送请求将照片保存至本地明确逻辑后，...
Python网页抓取教程
2021-09-24 14:52

Oxylabs中文站的博客在之前的文章中我们介绍了怎么用C#和JAVA两种方法来抓取网页，这一期给大家介绍一种更容易，也是使用最广泛的一种抓取方法，那就是Python。说起Python，大家应该并不陌生，它是目前入门最简单的一种方法了，因为它...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 12月17日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月9日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 12月9日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月9日

悬赏问题

¥20 MIT控制器能控制不稳定系统吗
¥15 公司代码X对业务伙伴X无效，处理方法？
¥15 微信内链接跳转到浏览器打开怎么实现
¥15 三角波可以直接加施密特电路整形到矩形波吗实物
¥15 html,php，在使用html请求php文件时发生了错误，无法请求到php文件读取数据库并用javascript进行数据显示，刷新
¥15 touchsocket udp组播
¥20 MAC怎么安装Silverlight 插件？以及安装了怎么启用
¥15 VS2012中查询语句无法填入解析，数值传不进去
¥15 gis系统开发出现命名空间“ESRI.ArcGIS”中不存在类型或命名空间名“Analyst3D”报错
¥15 怎么让ai定时给我发信息 c#或者python

抓取一个韩剧网站多个网页的剧名，演员，更新状态，现在怎么改才能运行出来

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新