爬取豆瓣top榜名字 print最后

问题遇到的现象和发生背景

最后print输出结果为空

问题相关代码，请勿粘贴截图

#先用requests拿到页面源代码
#通过re正则提取有效=信息
import requests
import re

url = "https://movie.douban.com/top250"

headers = {
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.110 Safari/537.36'
}

qinqiu =requests.get(url,headers=headers)#将url打开然后才能text爬取
#用headers进行反反爬策略绕过机器验证

page_content = qinqiu.text  #将页面源代码赋值给page_content

#解析数据
obj =re.compile(r'<li>.*?<div class="item">.*?<span class="title">(?P<name>.*?)</span>')

objs = obj.finditer(page_content)
for yu in objs:
    print(yu.group('name'))

运行结果及报错内容

运行结果为空无报错

我的解答思路和尝试过的方法

我先print了一下页面源代码是没问题的

我想要达到的结果

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-showbo 2022-01-05 15:32
关注
re.S加上

obj =re.compile(r'<li>.*?<div class="item">.*?<span class="title">(?P<name>.*?)</span>',re.S)
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

python爬虫——爬取豆瓣top250电影数据（适合初学者）
2023-09-12 14:49

长弓同学的博客爬取豆瓣top250其实是初学者用于练习和熟悉爬虫技能知识的简单实战项目，通过这个项目，可以让小白对爬虫有一个初步认识，因此，如果你已经接触过爬虫有些时间了，可以跳过该项目，选择更有挑战性的实战项目来提升...
Python爬虫——爬取豆瓣电影Top250代码实例
2020-09-19 11:06

### Python爬虫——爬取豆瓣电影Top250代码实例 #### 一、项目背景与目标本项目旨在使用Python语言实现对豆瓣电影Top250榜单数据的爬取，并将爬取到的数据存储到Excel表格中。通过本项目的实践，可以加深对Python...
Python爬取豆瓣top榜电影
2021-11-13 14:56

white_poland的博客该程序用于爬取豆瓣电影数据，并将数据保存到mysql。 1.你需要在你的python中下载需要的模块，bs4，xlwt，以及pymysql 2.程序主要的步骤是分析网页，提取网页中的数据，存储。具体的mysql表结构如下： 3.python...
Python爬虫—爬取豆瓣TOP250电影数据
2025-06-05 13:56

小尤笔记的博客豆瓣TOP250电影是一个经典的电影排行榜，下面我将详细讲解如何使用Python编写爬虫来获取这些数据。我们将使用requests库发送HTTP请求，库解析HTML内容，以及pandas库存储和保存数据。
python爬虫教学（爬取豆瓣top250名单和数据）
2024-08-27 16:42

LWS大蛇的博客处理源代码先搞定名字，找到名字之后，发现电影名字被和包着，于是就可以写出以下正则: obj = re.complie(r'(?P.*?)', re.S) 其他的按照正则同样的原理写，最终得到如下： import requests import re url = '...
python爬虫爬取豆瓣top250
2024-02-28 23:02

Sol_9的博客本人大一，为了学习python写个爬虫，代码需要优化的地方，还望各位大佬能不吝赐教！写博客的初心只是为了记录学习，如果对大家有帮助就更好喽~~
Python爬虫爬取豆瓣top250
2022-05-01 22:15

温沐沐的博客豆瓣是一页25条数据（现在是2022年5月1日，以后人家更新具体会换每页几条数据不确定，但是随之页码也要换，不换就有可能报错） import urllib.request import urllib.parse def create_request(page): base_...
python爬取豆瓣网站TOP250
2024-06-24 15:49

m0_73511684的博客 UA（user-agent）伪装，是我本次采用的伪装策略，也是最简单的伪装策略，有些网站的反爬机制比较复杂，则需要采用更加复杂的反反爬机制来进行伪装，不过，对于豆瓣来说，UA伪装就够用了。状态码是418，意思是服务器...
Python爬虫实战 —— 爬取豆瓣TOP250电影榜
2023-09-19 21:59

debugBiubiubiu2000的博客 Python 爬虫；豆瓣电影榜
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月13日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月5日

爬取豆瓣top榜名字 print最后

问题遇到的现象和发生背景

问题相关代码，请勿粘贴截图

运行结果及报错内容

我的解答思路和尝试过的方法

我想要达到的结果

2条回答 默认 最新

问题事件

2条回答默认最新