天山卷卷卷 2019-04-24 00:50 采纳率: 0%
浏览 949
已结题

python 爬取php页面信息返回内容为空

打算在中关村网站按照手机型号查询手机具体参数和用户评论
图片说明

网址为http://detail.zol.com.cn/index.php?c=SearchList&keyword=vivox20a

一开始按照 base = http://detail.zol.com.cn/index.php?

然后在后面加参数的方法爬取,发现返回是空的,f12中查看了一下,感觉也不是ajax加载的,并没有看到json格式的数据。。

图片说明

所以还是不知道问题出在哪里了,下面是我的代码,返回一直为空,拜托拜托大佬们给我一点思路或者用什么方法去爬,我是真实刚入门小白……

import requests
from urllib.parse import urlencode
import json
base_url = "http://detail.zol.com.cn/index.php?"
headers = {
    "Host": "detail.zol.com.cn",
    "Referer": "http://detail.zol.com.cn/index.php?c=SearchList&keyword=vivox20a",
    "User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.90 Safari/537.36 2345Explorer/9.7.0.18838",
    "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8",
    "Accept-Encoding": "gzip,deflate",
    "Accept-Language": "zh-CN,zh;q=0.8"
}
def get_page(key):
    parmas = {
        "c":"SearchList",
        "subcateId":57,
        "keyword": key
    }
    url = base_url+urlencode(parmas)
    print(url)
    try:
        r = requests.get(url, headers = headers)
        if r.content:
            return json.loads(r.text)
    except requests.ConnectionError as e:
        print(e.args)
if __name__ == '__main__':
    get_page("vivox20a")
  • 写回答

2条回答 默认 最新

  • oyljerry 2019-04-24 08:44
    关注

    可能跟cookie有关,网页能打开的时候,有一些cookie信息

    Cookie:gr_session_id_9b437fe=bbaa9b51.............................................................................................................................................................. z_day=ixgo20%3D1%26izol105805%3D2%26rdetail%3D6; visited_subcateId=57; visited_subcateProId=5 visited_sox20a
    
    评论

报告相同问题?

悬赏问题

  • ¥15 安卓adb backup备份应用数据失败
  • ¥15 eclipse运行项目时遇到的问题
  • ¥15 关于#c##的问题:最近需要用CAT工具Trados进行一些开发
  • ¥15 南大pa1 小游戏没有界面,并且报了如下错误,尝试过换显卡驱动,但是好像不行
  • ¥15 没有证书,nginx怎么反向代理到只能接受https的公网网站
  • ¥50 成都蓉城足球俱乐部小程序抢票
  • ¥15 yolov7训练自己的数据集
  • ¥15 esp8266与51单片机连接问题(标签-单片机|关键词-串口)(相关搜索:51单片机|单片机|测试代码)
  • ¥15 电力市场出清matlab yalmip kkt 双层优化问题
  • ¥30 ros小车路径规划实现不了,如何解决?(操作系统-ubuntu)