import requests
import re
#爬取十个页面
url="https://movie.douban.com/top250?start={}"
for i in range(10):
start = i * 25
a = url.format(start)
headers={"user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.107 Safari/537.36 Edg/92.0.902.55"}
r=requests.get(a,headers=headers)
b=r.text
# 解析网页
obj=re.compile(r'<li>.*?<div class="item">.*?<span class="title">(?P<name>.*?)</span>',re.S)
result=obj.finditer(b)
for it in result:
print(it.group("name"))
为什么这个python代码只能抓取豆瓣top250最后一页的内容
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
2条回答 默认 最新
关注 因为解析语句没有在for循环当中,下面这样就可以
有帮助,望采纳!#!/usr/bin/python # -*- coding: UTF-8 -*- """ @author: YangPC @QQ:327844761 @微信公众号:ewbang """ import requests import re # 爬取十个页面 url = "https://movie.douban.com/top250?start={}" for i in range(10): start = i * 25 a = url.format(start) headers = { "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.107 Safari/537.36 Edg/92.0.902.55"} r = requests.get(a, headers=headers) b = r.text # 解析网页 obj = re.compile(r'<li>.*?<div class="item">.*?<span class="title">(?P<name>.*?)</span>', re.S) result = obj.finditer(b) for it in result: print(it.group("name"))
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 1无用
悬赏问题
- ¥15 fpga自动售货机数码管(相关搜索:数字时钟)
- ¥20 Python安装cvxpy库出问题
- ¥15 用前端向数据库插入数据,通过debug发现数据能走到后端,但是放行之后就会提示错误
- ¥15 python天天向上类似问题,但没有清零
- ¥30 3天&7天&&15天&销量如何统计同一行
- ¥30 帮我写一段可以读取LD2450数据并计算距离的Arduino代码
- ¥15 C#调用python代码(python带有库)
- ¥15 活动选择题。最多可以参加几个项目?
- ¥15 飞机曲面部件如机翼,壁板等具体的孔位模型
- ¥15 vs2019中数据导出问题