爬虫代码应该是对的，但是运行不出来只有一行路径

想要爬取出我要的数据


import requests
import re
url="https://movie.douban.com/top250"
head={
    #UA，服务器对当前的网络设置进行检测
    "User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.87 Safari/537.36 SE 2.X MetaSr 1.0"
}
resp=requests.get(url,headers=head)#处理反爬
resp.encoding='utf-8'


obj = re.compile(r'<div class="item">.*?<span class="title">(?P<name>.*?)</span>'
               r'.*?<br>(?P<year>.*?)&nbsp;.*? <span class="rating_num"'
               r'property="v:average">(?P<pingfeng>.*?)</span>.*?'
               r'<span>(?P<num>.*?)人评价</span>',re.S)

result = obj.finditer(resp.text)
for item in result:
    dic=item.groupdict()
    dic['year'] = dic['year'].strip()
    print(dic)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

CSDN专家-showbo 2022-02-01 17:03

关注

评分正则有问题，少了空格

改下面就可以了

 
import requests
import re
url="https://movie.douban.com/top250"
head={
    #UA，服务器对当前的网络设置进行检测
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36"
}
resp=requests.get(url,headers=head)#处理反爬
resp.encoding='utf-8'
 
 
obj = re.compile(r'<div class="item">.*?<span class="title">(?P<name>.*?)</span>'
               r'.*?<br>(?P<year>.*?)&nbsp;.*?<span class="rating_num"'
               r' property="v:average">(?P<pingfeng>.*?)</span>.*?'
               r'<span>(?P<num>.*?)人评价</span>',re.S)
 
result = obj.finditer(resp.text)
for item in result:
    dic=item.groupdict()
    dic['year'] = dic['year'].strip()
    print(dic)

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(1条)

报告相同问题？

关注问题

python 爬虫代码
2023-03-09 21:49

qq_繁华的博客 python 爬虫代码
Python爬虫详解（一看就懂）
2022-06-21 22:07

练习时长两年半的Programmer的博客如果要获取网络上数据，我们要给爬虫一个网址（程序中通常叫URL），爬虫发送一个HTTP请求给目标网页的服务器，服务器返回数据给客户端（也就是我们的爬虫），爬虫再进行数据解析、保存等一系列操作。爬虫可以节省...
微软开源最强Python自动化爬虫神器！不用写一行代码！
2024-09-25 16:21

Python子木_的博客相信玩过爬虫的朋友都...是一个强大的Python库，仅用一个API即可自动执行、、等主流浏览器自动化操作，并同时支持以无头模式、有头模式运行。Playwright提供的自动化技术是绿色的、功能强大、可靠且快速，支持、以及
python爬虫详解
2021-07-11 21:56

穆瑾轩的博客 python爬虫简介 1、基本概念 1.1、什么是爬虫网络爬虫，是一种按照一定规则，自动抓取互联网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。随着网络的迅速发展，万维网...
用python写爬虫代码如何换行_10行代码完成一个爬虫，就这么简单
2020-12-02 21:49

weixin_39637921的博客用Python开发一个简单爬虫非常简单，10多行代码即可完成，实现功能。1、获取网页代码就是将互联网上URL对应的网页下载到本地(内存)中。再进行内容分析和提取。这部分要实现的功能，相当于浏览器，当我们在浏览器上...
初学者如何用 Python 写第一个爬虫？
2025-05-16 15:08

长风清留扬的博客也许在这个过程中，你遇到了一些挑战，比如代码报错、数据提取不准确，但请相信，每一次解决问题都是一次成长。学会 Python 之后，你的世界将变得更加广阔。在数据领域，你可以轻松地从互联网上收集大量数据，进行...
python实例代码爬虫_python 网络爬虫实例代码
2021-03-06 02:31

GUlijiwa古力的博客本节内容：python 网络爬虫代码。一共两个文件，一个是toolbox_insight.py，是一个工具文件另一个是test.py，是一个用到toolbox_insight.py中工具的测试文件代码示例:#filename: toolbox_insight.pyfrom sgmllib ...
用python60行代码写一个简单的笔趣阁爬虫
2021-01-11 18:30

白胡子是这个世界上最猛的男人的博客系列文章目录 python爬虫实战——爬取淘宝商品信息并导入EXCEL表格（超详细） python多线程爬取壁纸妈妈再也不担心我没壁纸了！. python爬虫爬取虎牙数据（简单...利用python写一个简单的笔趣阁爬虫，根据输入的小说
打卡学习Python爬虫第一天|python爬虫环境搭建
2024-08-16 18:56

你好皮～的博客 Anaconda 包及其依赖项和环境的管理工具为 conda 命令，文与传统的 Python pip 工具相比 Anaconda 的conda 可以更方便地在不同环境之间...编译的源代码，功能上有更多的选择性，为 Python 安装提供了更多的灵活性。
python爬虫实战——小说爬取
2023-05-21 21:01

清清清清弦的博客基于requests库和lxml库编写的爬虫，目标小说网站域名http://www.365kk.cc/，类似的小说网站殊途同归，均可采用本文方法爬取。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 2月9日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 2月1日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月1日

爬虫代码应该是对的，但是运行不出来 只有一行路径

2条回答 默认 最新

问题事件

爬虫代码应该是对的，但是运行不出来只有一行路径

2条回答默认最新