爬虫为什么只能爬到一部分内容？

python爬虫爬取猫眼电影Top100，每一页有10个电影，但是爬虫只能爬取第一个，后面都爬不到不止是为什么
代码如下，大神帮忙看看，感激不尽
import requests
from requests.exceptions import RequestException
import re
def get_one_page(url):
try:
headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36'}
response=requests.get(url,headers=headers)
if response.status_code==200:
return response.text
return None
except RequestException:
return None

def parse_one_page(html):
pattern=re.compile('

.*?board-index-1">(\d+).*?data-src="(.*?)".*?/>.*?name">(.*?)'+
'.*?star">(.*?).*?releasetime">(.*?).*?integer">(.*?).*?fraction">(.*?).*?

',re.S)
items=re.findall(pattern,html)
print(items)

def main():
url='http://maoyan.com/board/4?'
html=get_one_page(url)
parse_one_page(html)

if name=='__main__':
main()

结果显示
C:\Users\Administrator\python37\python.exe C:/Users/Administrator/PycharmProjects/Maoyantop100/spder.py
[('1', 'https://p1.meituan.net/movie/20803f59291c47e1e116c11963ce019e68711.jpg@160w_220h_1e_1c', '霸王别姬', '\n 主演：张国荣,张丰毅,巩俐\n ', '上映时间：1993-01-01', '9.', '5')]

Process finished with exit code 0

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2019-10-04 09:42
关注
可能是ajax异步加载的，建议你用f12抓包看下，加载更多的数据是请求的什么地址，什么参数，程序照着模仿

解决
无用 1
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python爬虫只解析了一部分网页？ python 爬虫
2021-11-19 14:39

回答 1 已采纳第一个问题，你用html.xpath('//div[@class="co_content8"]/ul/table')找不到，是因为在table那一类，有很多分支标签，所以定位不到具体的元素。第二个问题
Python爬虫requests.get方法无法显示div中折叠内容 https python 有问必答爬虫
2021-11-27 19:16

回答 2 已采纳该页面数据是动态加载的，需要用此链接用post请求去获取https://www.xuetangx.com/api/v1/lms/get_product_list/?page=1
python爬虫爬取网页为什么获得的不是正常网页数据 python 爬虫
2022-05-12 14:48

回答 2 已采纳这代码里面好多错误，你是怎么运行成功的？
Python爬虫详解（一看就懂）
2022-06-21 22:07

练习时长两年半的Programmer的博客比如我要获取豆瓣电影 Top250 榜单，如果不用爬虫，我们要先在浏览器上输入豆瓣电影的 URL ，客户端（浏览器）通过解析查到豆瓣电影网页的服务器的 IP 地址，然后与它建立连接，浏览器再创造一个 HTTP 请求发送给...
Python爬虫requests反还内容与网页内容不相同 python 有问必答
2022-03-08 22:50

回答 2 已采纳 requests.get得到的是源代码，ajax动态加载或者js动态生成的html代码获取不到，需要直接请求接口获取数据或者从源代码中找到js数据源进行解析。截图中右边块的数据接口为下面这个，直接re
爬虫入门，为什么我爬到的数据和网页的不一样 python 爬虫
2022-07-23 22:54

回答 2 已采纳还是显示有问题啊然后我改了一下打印了看这不是一样的嘛
为什么用python 爬取数据到excel中300多行只剩下一行？ python vscode 开发语言有问必答
2021-08-01 12:32

回答 4 已采纳将写入文件语句放到循环外，加上列名并逐行写入，后面的代码可以这样写： #code with open('data/51job.csv','w') as f: f.write(','.join(
Python爬虫系列（一）——手把手教你写Python爬虫
2021-10-23 15:47

纸照片的博客适合初学者快速上手入门，以爬取CSDN和百度图片为例。
爬虫爬出的数据，print输出可以全部输出，但是写入CSV文件时只能写最后一行 python 爬虫
2022-02-22 08:10

回答 3 已采纳 # -*- coding:utf-8 -*- import requests import csv,re url1 = 'http://category.dangdang.com/' url2
python爬虫代码运行输出结果不完整 pycharm python 爬虫
2021-11-20 01:32

回答 1 已采纳不知道你解决了没，我就简单说一下我的解决方法。 obj3 = re.compile(r'<div id="Zoom">.*?◎片　　名(?P<movie>.*?)<br
python简单爬虫正常运行遍历，没有报错，但最后csv文件为什么只保存了一条信息 python
2019-07-29 00:53

回答 1 已采纳 with open(r'C:\Users\Administrator\Desktop\python\豆瓣电影分类前100.csv', 'w', newline='', encoding='utf8')
分享Python7个爬虫小案例（附源码）
2022-10-22 07:00

艾派森的博客本次的7个python爬虫小案例涉及到了re正则、xpath、beautiful soup、selenium等知识点，非常适合刚入门python爬虫的小伙伴参考学习。
python中要提取一部分内容，想问下正则怎么匹配 python 有问必答爬虫
2021-09-30 11:45

回答 1 已采纳可以匹配http:// 加空格。http://(.*)[\s] 或者直接spilt[' '].
Python爬虫：为什么你爬取不到网页数据
2022-08-09 19:01

坚持不懈的大白的博客之前小编写了一篇关于爬虫为什么爬取不到数据文章（文章链接为：https://liuze.blog.csdn.net/article/details/105965562），但是当时小编也是胡乱编写的，其实里面有很多问题的，现在小编重新发布一篇关于爬虫爬取...
Python 万能代码模版：爬虫代码篇
2021-09-14 15:27

AI悦创|编程1v1的博客很多同学一听到 Python 或编程语言，可能条件反射就会觉得“很难”。但今天的 Python 课程是个例外，因为今天讲的 **Python 技能，不需要你懂计算机原理，也不需要你理解复杂的编程模式。**即使是非开发人员，只要...
没有解决我的问题, 去提问

悬赏问题

¥30 求一段fortran代码用IVF编译运行的结果
¥15 深度学习根据CNN网络模型，搭建BP模型并训练MNIST数据集
¥15 lammps拉伸应力应变曲线分析
¥15 C++ 头文件/宏冲突问题解决
¥15 用comsol模拟大气湍流通过底部加热（温度不同）的腔体
¥50 安卓adb backup备份子用户应用数据失败
¥20 有人能用聚类分析帮我分析一下文本内容嘛
¥15 请问Lammps做复合材料拉伸模拟，应力应变曲线问题
¥30 python代码，帮调试，帮帮忙吧
¥15 #MATLAB仿真#车辆换道路径规划

爬虫为什么只能爬到一部分内容？

1条回答 默认 最新

悬赏问题

1条回答默认最新