想爬多个网页,出不来结果

import requests,re
from openpyxl import Workbook
wb=Workbook()
ws =wb.active
ws.append(["韩剧名","主演"])
headers = {
"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/93.0.4577.63 Safari/537.36"
}
page_url="https://www.hjutv.cn/show_2________{}___.html"
detail_url="https://www.hjutv.cn/{}.html"
response =requests.get(url=page_url,headers=headers)
for i in range(1,28):
    url = page_url.format(i)
    response = requests.get(url=url, headers=headers)
    html = response.text  
    tvplay_pattern = re.compile(r'<li class="vodlist_item .*?">(.*?)</li>',re.S)
    tvplay_list = tvplay_pattern .findall(html)
    print(len(tvplay_list))
   # 匹配剧名
name_pattern =re.compile(r'<p class="vodlist_title"><a .*?>(.*?)</a></p>',re.S)
   # 匹配演员名
actor_name_pattern =re.compile(r'<p class="vodlist_sub"><a .*?>(.*?)</a></p>',re.S)
        for tvplay in tvplay_list:
        name = name_pattern.findall(tvplay)[0]
        actor_name=actor_name_pattern.findall(tvplay)[0]
        print(name,actor_name)
        ws.append([name,actor_name])
wb.save("./data/韩剧.xlsx")
该怎么写

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-showbo 2021-12-08 22:07
关注
代码重新编辑，用</>格式化下，要不内容不全

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python爬虫html获取不全 html python 爬虫
2022-06-24 19:43

回答 1 已采纳其实有的，但是这个网站应该是为了懒加载把url用base64密了一下，然后再动态加载，其实我下面发的这个就是url 是base64后的url 解码后就是https://s1.aigei.com/
爬虫构建网页获取不了多个网页 python
2022-10-23 18:36

回答 1 已采纳 range(0,41,10)分别得到0,10,20,30,40range三个参数意思分别是：start开始,end结束，step步长
python selenium 多开浏览器能够同步做一样的动作吗 python selenium 爬虫
2022-05-06 09:33

回答 1 已采纳可以做到，使用thread里面的event函设置等待事件，比如说在一个线程（一个游览器）完成点击事件后设置一个等待（event().wait()），只有在全部完成后才能进行下一步，这儿要在主线程里面设
python爬取多个网页内容_Python 爬虫第三篇（循环爬取多个网页）
2020-11-20 21:39

weixin_39803977的博客前两篇文章的Python履带(urllib + regex)和第二篇文章的Python履带(urllib + BeautifulSoup),介绍如何获取网页信息的一个给定的URL和解析它。内容。本文将更进一步并获取和解析给定的URL的内容及其相关的URL根据给定...
python 爬虫 post请求返回的数据不全，和postman模拟的不一样，关键内容是个空列表 python 有问必答爬虫
2021-09-08 11:50

回答 2 已采纳经过实际测试，该站对 refer和 origin 没有验证，却验证了 content-type，你在header里加上content-type就可以了 import requests impor
python爬虫爬小说时，爬了一百多张就会报错，从新启动后爬取速度变慢了 python 有问必答爬虫
2022-08-17 20:13

回答 5 已采纳可能是访问次数频繁，被禁止访问，解决方法：使用代理 python 关于Max retries exceeded with url 的错误_Lucas__liu的博客-C
python爬虫中如果有两个相同的class标签，而爬取目标为第二个，如何解决 python 爬虫
2022-08-09 16:58

回答 3 已采纳 soup.find_all('div',class_='box_con')[1]这样呢
分享Python7个爬虫小案例（附源码）
2022-10-22 07:00

艾派森的博客本次的7个python爬虫小案例涉及到了re正则、xpath、beautiful soup、selenium等知识点，非常适合刚入门python爬虫的小伙伴参考学习。
关于#爬虫#的问题：爬虫爬取tr中的td内容，我的代码之前可以爬另一个几乎一样的网页(语言-python) python 爬虫
2023-03-08 20:02

回答 1 已采纳回答：你可以把你的脚本贴一下，这个网页结构还是比较清晰的，可以用beautifulsoup比较容易获取到内容
Python，爬虫session怎么重置清空，或者怎么退出网页帐号登录 python
2021-08-02 16:25

回答 1 已采纳 session =None
python 爬虫 first=True不是第一个是真实的吗？ python 有问必答
2021-08-10 23:22

回答 1 已采纳看了一下官方文档，first参数的意思是是否只返回第一个对象，因为正常的xpath返回的是一个element的列表，而first=true之后就是一个element对象，你可以对一个对象调用text属
Python爬虫：为什么你爬取不到网页数据
2022-08-09 19:01

坚持不懈的大白的博客 https://liuze.blog.csdn.net/article/details/105965562），但是当时小编也是胡乱编写的，其实里面有很多问题的，现在小编重新发布一篇关于爬虫爬取不到数据文章，希望各位读者更加了解爬虫。......
Python爬虫深造篇(一)——多线程网页爬取
2021-10-17 20:11

何壹时的博客一、前情提要相信来看这篇深造爬虫文章的同学，大部分已经对爬虫有不错的了解了，也在之前已经写过不少爬虫...但在介绍Python 如何让多个爬虫一起爬取数据之前，我想先为大家介绍一个概念——并发。文章目录一、前
【Python 爬虫】多线程爬取
2022-03-20 15:03

骑着蜗牛ひ追导弹'的博客文章目录前言一、多进程库（multiprocessing）二、多线程爬虫三、案例实操四、案例解析1、获取网页内容2、获取每一章链接3、获取每一章的正文并返回章节名和正文4、将每一章保存到本地5、多线程爬取文章前言简单...
python爬虫多个url_Python爬虫爬取网页中所有的url的多种实现方法
2021-02-10 18:41

苏橙橙的博客在使用python爬虫进行网络页面爬取的过程中，第一步肯定是要爬取url，若是面对网页中很多url，，又该如何爬取所以url呢？本文介绍Python爬虫爬取网页中所有的url的三种实现方法：1、使用BeautifulSoup快速提取所有...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 12月16日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月8日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 12月8日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 12月8日
展开全部

悬赏问题

¥20 关于游戏c++语言代码问题
¥15 如何制作永久二维码，最好是微信也可以扫开的。（相关搜索：管理系统）
¥15 delphi indy cookie 有效期
¥15 labelme打不开怎么办
¥35 按照图片上的两个任务要求，用keil5写出运行代码，并在proteus上仿真成功，🙏
¥15 免费的电脑视频剪辑类软件如何盈利
¥30 MPI读入tif文件并将文件路径分配给各进程时遇到问题
¥15 pycharm中导入模块出错
¥20 Ros2 moveit2 Windows环境配置，有偿，价格可商议。
¥15 有关“完美的代价”问题的代码漏洞

想爬多个网页,出不来结果

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新