罗林公爵 2018-03-18 06:59 采纳率: 50%
浏览 3265
已采纳

python爬取ashx页面的post请求

我以一个类似的情况来提问,也是论坛中有个网友1年前提出的问题,但是他没有写出后续....

网页地址:http://www.lzggzyjy.cn/InfoPage/InfoList.aspx?SiteItem=8

需求:python post请求获取该页面(感觉很简单)

分析页面:
图片说明

图片说明

我把代码贴上来:

 #! /usr/bin/env python3
# -*- coding:utf-8 –*-


import requests
import json

import sys
reload(sys) 
sys.setdefaultencoding('utf-8')


def testDownloadLanZhou():
    testUrl = 'http://www.lzggzyjy.cn/ajax/Controls_InfoListControl,App_Web_2ewqtbev.ashx?_method=getCurrentData&_session=rw'
    testHeaders = {
            'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.162 Safari/537.36',
            'Host':'www.lzggzyjy.cn',
            'Referer':'http://www.lzggzyjy.cn/InfoPage/InfoList.aspx?SiteItem=8',
            'X-Requested-With':'XMLHttpRequest',
            # "Content-Type":'text/plain;charset=UTF-8',
            "Cookie":'ASP.NET_SessionId=hcdc1tywt5dgszd5bziox4sc; SERVERID=b925605187c7d5d37f1395627a969c75|1521298751|1521298681'
            }

    # testParams = {'_method':'getCurrentData', '_session':'rw'}
    testData = {'currentPage':'1', 'Query':''}

    # 将dic 转换成json字符串
    # jsonDataString = json.dumps(testData)
    # print(jsonDataString)
    # print(type(jsonDataString))

    # # 对应每个参数添加换行隔开
    # newString = jsonDataString.replace(',', '\n')
    # print(newString)

    resq = requests.post(testUrl, headers=testHeaders, data=testData)
    print(resq.content)

这个请求怎么弄都不对,获取不到正确的html页面......请各位指点迷津

  • 写回答

2条回答 默认 最新

  • 三阶魔方 2018-03-18 09:52
    关注

    这个网站有多一层东西,你可以这么干。
    先请求http://www.lzggzyjy.cn/InfoPage/InfoList.aspx?SiteItem=8
    然后用正则找到
    然后请求这个/ajax/Controls_InfoListControl,App_Web_xxxxxxx.ashx。

    获得内容:

    var Controls_InfoListControl = {
    getCurrentData:function(currentPage,Query,callback,context){return new ajax_request(this.url + '?_method=getCurrentData&_session=rw','currentPage=' + enc(currentPage)+ '\r\nQuery=' + enc(Query),callback, context);},
    getTotalPages:function(Query,callback,context){return new ajax_request(this.url + '?_method=getTotalPages&_session=rw','Query=' + enc(Query),callback, context);},
    url:'/ajax/Controls_InfoListControl,App_Web_xxxxxxxx.ashx'
    }

    然后再去请求http://www.lzggzyjy.cn/ajax/Controls_InfoListControl,App_Web_xxxxxxxx.ashx?_method=getCurrentData&_session=rw

    就可以了。

    主要就是这xxxxxxx,每次都不一样。cookie和sessionid不动不影响的。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

悬赏问题

  • ¥20 求会6sv辐射传输模型,辅导(可py6s🙏🏻有偿
  • ¥15 .xla后缀的文件拖到excel里什么内容也没有怎么办
  • ¥20 Workbench中Mechanical打不开、闪退是什么原因?
  • ¥240 MapReduce应用实践 学生课程
  • ¥15 hlss视频显示AUTHORITY_INVALID
  • ¥15 MAX9296A+MAX96717,美信gmsl解串有人做过吗?
  • ¥15 求帮我解决一下inode 爆满的问题(有偿)
  • ¥15 关于#vscode#的问题:布料滤波算法中C++实现pcl在Vscode中pcl库没有#include <pcl>
  • ¥15 fpga:ov5640采集tft显示
  • ¥100 python怎么连接wxSQLite3加密的数据库