天山卷卷卷 2019-04-24 00:50 采纳率: 0%
浏览 949
已结题

python 爬取php页面信息返回内容为空

打算在中关村网站按照手机型号查询手机具体参数和用户评论
图片说明

网址为http://detail.zol.com.cn/index.php?c=SearchList&keyword=vivox20a

一开始按照 base = http://detail.zol.com.cn/index.php?

然后在后面加参数的方法爬取,发现返回是空的,f12中查看了一下,感觉也不是ajax加载的,并没有看到json格式的数据。。

图片说明

所以还是不知道问题出在哪里了,下面是我的代码,返回一直为空,拜托拜托大佬们给我一点思路或者用什么方法去爬,我是真实刚入门小白……

import requests
from urllib.parse import urlencode
import json
base_url = "http://detail.zol.com.cn/index.php?"
headers = {
    "Host": "detail.zol.com.cn",
    "Referer": "http://detail.zol.com.cn/index.php?c=SearchList&keyword=vivox20a",
    "User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.90 Safari/537.36 2345Explorer/9.7.0.18838",
    "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8",
    "Accept-Encoding": "gzip,deflate",
    "Accept-Language": "zh-CN,zh;q=0.8"
}
def get_page(key):
    parmas = {
        "c":"SearchList",
        "subcateId":57,
        "keyword": key
    }
    url = base_url+urlencode(parmas)
    print(url)
    try:
        r = requests.get(url, headers = headers)
        if r.content:
            return json.loads(r.text)
    except requests.ConnectionError as e:
        print(e.args)
if __name__ == '__main__':
    get_page("vivox20a")
  • 写回答

2条回答

  • oyljerry 2019-04-24 08:44
    关注

    可能跟cookie有关,网页能打开的时候,有一些cookie信息

    Cookie:gr_session_id_9b437fe=bbaa9b51.............................................................................................................................................................. z_day=ixgo20%3D1%26izol105805%3D2%26rdetail%3D6; visited_subcateId=57; visited_subcateProId=5 visited_sox20a
    
    评论

报告相同问题?

悬赏问题

  • ¥15 无线电能传输系统MATLAB仿真问题
  • ¥50 如何用脚本实现输入法的热键设置
  • ¥20 我想使用一些网络协议或者部分协议也行,主要想实现类似于traceroute的一定步长内的路由拓扑功能
  • ¥30 深度学习,前后端连接
  • ¥15 孟德尔随机化结果不一致
  • ¥15 apm2.8飞控罗盘bad health,加速度计校准失败
  • ¥15 求解O-S方程的特征值问题给出边界层布拉休斯平行流的中性曲线
  • ¥15 谁有desed数据集呀
  • ¥20 手写数字识别运行c仿真时,程序报错错误代码sim211-100
  • ¥15 关于#hadoop#的问题