小轩砸 2017-05-18 13:36 采纳率: 0%
浏览 4562

采用java爬虫或phantomjs一部分百度网盘访问不了

本人小白,最近我在写一个爬虫遇到了一个问题,访问百度网盘的时候短链接地址无法访问,比如http://yun.baidu.com/s/1i4Pa7rv, 但后来我又尝试访问了几个长连接的地址都可以获取到网页源代码,我用phantomjs来访问也是如此,请问这种情况有没有人遇到,求大神指点
phantomjs代码如下:

 var page = require('webpage').create();
page.settings.userAgent = 'Mozilla/4.0 (compatible; MSIE 6.1; Windows XP)';
phantom.outputEncoding="gbk";
page.open('https://yun.baidu.com/s/1i4Pa7rv', function (status) {
    if (status == 'success') {

        console.log(page.title);
    } else {
        console.log('cannot open page');
    }
    phantom.exit();
});

运行结果如下:

图片说明

  • 写回答

2条回答 默认 最新

  • threenewbee 2017-05-18 16:45
    关注

    用fiddler抓包看下,返回什么,是不是404

    评论

报告相同问题?

悬赏问题

  • ¥100 速求!商品购买力最优化问题(用遗传算法求解,给出python代码)
  • ¥15 虚拟机检测,可以是封装好的DLL,可付费
  • ¥15 kafka无法正常启动(只启动了一瞬间会然后挂了)
  • ¥30 使用matlab将观测点聚合成多条目标轨迹
  • ¥15 Workbench中材料库无法更新,如何解决?
  • ¥20 如何推断此服务器配置
  • ¥15 关于github的项目怎么在pycharm上面运行
  • ¥15 内存地址视频流转RTMP
  • ¥100 有偿,谁有移远的EC200S固件和最新的Qflsh工具。
  • ¥15 有没有整苹果智能分拣线上图像数据