爬Ajax地址的结果与network代码不同，缺失一部分变成null怎么解决？

事情是这样的，懵新需要爬：
http://film.mtime.com/search/movies/movies?type=year&word=2020
该网址是Ajax加载的，于是从F12里找到了内容列表的Ajax请求地址，
我添加了headers，试过用post、session、urllib.request和parse，但是输出仍是如下：

而网页源代码是：

可以看到爬取的结果在 "data":{"movies":null 处缺失了。

求高人帮忙QAQ
另：selenium也尝试过，但不知道为什么爬不出目标代码

我的爬取目标是这个：

以下是我的代码尝试：


'''列表'''
import requests
import time

headers = {
  'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.15 Safari/537.36',
  'referer': 'http://film.mtime.com/search/movies/movies/',
  'Cookie':'_tt_=4C0AFCA656D18084A23E7B6412F25E1B; _mi_=d3a134e125f4fa820a77efdb9d273749; _mu_=74E13B5A06A0337502CB85D0824A4D36; searchHistoryCookie=%u4F60%u597D%u674E%u7115%u82F1; Hm_lvt_07aa95427da600fc217b1133c1e84e5b=1646656056,1647854587,1647913019,1648107725; Hm_lpvt_07aa95427da600fc217b1133c1e84e5b=1648192257',
  'Content-Encoding': 'gzip',
  'Accept-Language': 'zh-CN,zh;q=0.9',
  'Connection': 'keep-alive',
  'Content-Type': 'application/x-www-form-urlencoded',
  'X-Requested-With': 'XMLHttpRequest'
}

year = 2020
params = {
    'genreTypes':'' ,
    'area':'' ,
  'type':'2020',
  'pageIndex':'1',
  'pageSize':'20',
  'searchType':'0',
  "locationId":'290',
  'keyword': '',
}

url='http://front-gateway.mtime.com/mtime-search/search/unionSearch2'

#遵守robots协议
ROBOTSTXT_OBEY = True
#并发请求个数（越小越慢）
CONCURRENT_REQUESTS = 1
#下载延迟时间（越大请求越慢）
DOWNLOAD_DELAY = 60
#默认False;为True表示启用AUTOTHROTTLE扩展
AUTOTHROTTLE_ENABLED = True
#默认3秒;初始下载延迟时间
AUTOTHROTTLE_START_DELAY = 60
#默认60秒；在高延迟情况下最大的下载延迟
AUTOTHROTTLE_MAX_DELAY = 60
#使用httpscatch缓存
HTTPCACHE_ENABLED = True
HTTPCACHE_EXPIRATION_SECS = 1
HTTPCACHE_DIR = 'httpcache'
HTTPCACHE_IGNORE_HTTP_CODES = []
HTTPCACHE_STORAGE = 'scrapy.extensions.httpcache.FilesystemCacheStorage'


'''
#模拟浏览器爬
from urllib import request, parse
import urllib.request
import urllib.parse
import json
data = urllib.parse.urlencode(params).encode('utf-8')
response = request.Request(url=url, data=data, headers=headers, method='POST')

import ssl# 全局取消证书验证
ssl._create_default_https_context = ssl._create_unverified_context

response = urllib.request.urlopen(response)
print(response.read().decode('utf-8'))


'''
#session会话爬
session = requests.session()
res = session.post(
  url=url,
  params=params,#json=params也没有目标内容
  headers=headers,timeout=None)
print(res.content)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

CSDN专家-showbo 2022-03-27 20:32

关注

没问题啊？


import requests
import time
 
headers = {
  'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36',
  'referer': 'http://film.mtime.com/search/movies/movies/',
  'Content-Type': 'application/x-www-form-urlencoded',
  'X-Requested-With': 'XMLHttpRequest'
}
postData={"keyword":"2020","pageIndex":"1","pageSize":"20","searchType":"0","locationId":"290","genreTypes":"","area":"","year":""}
url='http://front-gateway.mtime.com/mtime-search/search/unionSearch2'
r=requests.post(url,headers=headers,data=postData).json()

for movie in r['data']['movies']:
    print(movie['movieId'],movie['name'])

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(1条)

报告相同问题？

关注问题

爬Ajax地址的结果与network代码不同，缺失一部分变成null怎么解决？ ajax python 有问必答爬虫
2022-03-27 19:53

回答 2 已采纳没问题啊？ import requests import time headers = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win
为什么我的ajax传到后端，后端却显示为null ajax java 前端
2022-07-28 21:55

回答 3 已采纳后端不要写@RequestBody，默认从url获取参数ajax去掉dataType:'text', url路径不对，参数'stdlib':stdlib拼接在url后采用 ?key=value格式进行
通过ajax从数据库请求成功数据后，如何将数据渲染到前端页面？ ajax javascript 前端
2021-12-11 22:33

回答 1 已采纳你应该是用原生js吧用获取到的数据生成html片段，然后插入到页面中.例如：获取到的数据是data=[ ] for(let i =0;i<data.length;i++){
你还在为找工作发愁嘛？最新前端高频面试题（适合应届生），拿走不谢！
2022-07-19 21:24

如歌~的博客 HTML、CSS相关盒子模型：一个盒子可以分成四个部分：外边距，边框，内边距，内容默认情况下，盒子的width和height属性只是设置content（内容）的宽和高盒子真正的宽应该是：内容宽度+左右填充+左右边距+左右边框 ...
在前端用的是ajax进行传参，后端用的是HttpServletRequest获取参数，为什么传的参数print出来的是null？ ajax java 前端
2023-02-06 11:39

回答 3 已采纳你用的是post传递json参数，实际的参数是在requestBody里面，你如果通过request取的话，需要通过从HttpServletRequest的Reader流中获取请求body参数 Buf
python爬虫如何自动获取Network中的某个XHR地址？ python 爬虫网络
2018-08-25 08:43

回答 4 已采纳楼主问的可能有点不清楚，我的理解是：https://zh.flightaware.com/live/airport/+{机场代号} 楼主有几千个机场代号，需要爬取这几千个URL的https://zh
关于#falsk,ajax#的数据传递问题(前端传后端)，如何解决？(标签-flask) flask python 前端
2023-03-11 12:26

回答 5 已采纳 ajax请求的网址另外用一个路由，共用区分下请求类型是get或者post，get返回模板，否则返回post请求的值，示例如下 from flask import Flask, request,rend
【面试宝典】2023前端面试题
2023-01-17 14:16

简单Janeee的博客前端常见面试题，不定期更新！
前端用Ajax怎么给后端发送请求获取数据？ ajax html java
2023-02-07 22:28

回答 3 已采纳后端返回数据就行。前端可以在 success 里获取到 data就是返回的数据
使用ajax和php，ajax的返回结果为什么一直是php代码？ ajax html5 php
2018-07-22 13:17

回答 5 已采纳服务器上安装php了么？这里有个php的安装教程：http://www.cnblogs.com/timmmmit/archive/2017/10/22/7709483.html 如果你嫌麻烦
mui中，使用ajax，for循环读取数据，为什么只能显示最后一行数据？怎么解决呢？ ajax html5 前端有问必答
2022-02-27 16:44

回答 2 已采纳最好发代码出来看下目测应该是变量作用域的问题，比如for中的循环变量用var申明，这样引用到的是最后一次遍历到的值。将变量var申明改为let申明，这样变量在for循环中有效，为当前的值有其他问题
Python 爬虫案例
2022-10-19 07:37

wespten的博客演示代码如下： 1 book_info = pd.DataFrame(data_info) 2 print(book_info.isnull()) # 缺失值判断 3 print(book_info.duplicated()) # 重复值判断第3行代码中的duplicated()函数用于判断是否有重复行，如果有，...
AJAX请求返回XML出现错误，如何解决？ ajax html javascript 有问必答
2022-01-14 12:06

回答 3 已采纳 =号去掉，要调用xhr对象的oen方法后才能send 建议onreadystatechange该这样，要不服务器端有问题就会和没反应一样，只能开浏览器调试工具看网络请求 <h3>ajax请
前端面试题
2019-08-08 11:49

缒幕的博客前端面试题汇总一、HTML和CSS 21 你做的页面在哪些流览器测试过？这些浏览器的内核分别是什么? 21 每个HTML文件里开头都有个很重要的东西，Doctype，知道这是干什么的吗？ 21 Quirks模式是什么？它和Standards模式...
前端知识点汇总—面试看这一篇就够了
2019-11-04 15:34

Python导师大白的博客本篇文章用了近一个月时间，搜集整理了网上各种面试笔试题及本人针对前端的一些理解以及各路大神针对前端难点部分的详细介绍，可以作为以后面试或者考察面试人员的参考。相信通过这两篇文章的学习，一定会让你对...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 4月4日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月27日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月27日

悬赏问题

¥15 echarts动画效果失效的问题。官网下载的例子。
¥60 许可证msc licensing软件报错显示已有相同版本软件，但是下一步显示无法读取日志目录。
¥15 Attention is all you need 的代码运行
¥15 一个服务器已经有一个系统了如果用usb再装一个系统，原来的系统会被覆盖掉吗
¥15 使用esm_msa1_t12_100M_UR50S蛋白质语言模型进行零样本预测时，终端显示出了sequence handled的进度条，但是并不出结果就自动终止回到命令提示行了是怎么回事：
¥15 前置放大电路与功率放大电路相连放大倍数出现问题
¥30 关于<main>标签页面跳转的问题
¥80 部署运行web自动化项目
¥15 腾讯云如何建立同一个项目中物模型之间的联系
¥30 VMware 云桌面水印如何添加

爬Ajax地址的结果与network代码不同，缺失一部分变成null怎么解决？

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新