小轩砸 2017-05-18 13:36 采纳率: 0%
浏览 4562

采用java爬虫或phantomjs一部分百度网盘访问不了

本人小白,最近我在写一个爬虫遇到了一个问题,访问百度网盘的时候短链接地址无法访问,比如http://yun.baidu.com/s/1i4Pa7rv, 但后来我又尝试访问了几个长连接的地址都可以获取到网页源代码,我用phantomjs来访问也是如此,请问这种情况有没有人遇到,求大神指点
phantomjs代码如下:

 var page = require('webpage').create();
page.settings.userAgent = 'Mozilla/4.0 (compatible; MSIE 6.1; Windows XP)';
phantom.outputEncoding="gbk";
page.open('https://yun.baidu.com/s/1i4Pa7rv', function (status) {
    if (status == 'success') {

        console.log(page.title);
    } else {
        console.log('cannot open page');
    }
    phantom.exit();
});

运行结果如下:

图片说明

  • 写回答

2条回答

  • threenewbee 2017-05-18 16:45
    关注

    用fiddler抓包看下,返回什么,是不是404

    评论

报告相同问题?

悬赏问题

  • ¥15 安装svn网络有问题怎么办
  • ¥15 Python爬取指定微博话题下的内容,保存为txt
  • ¥15 vue2登录调用后端接口如何实现
  • ¥65 永磁型步进电机PID算法
  • ¥15 sqlite 附加(attach database)加密数据库时,返回26是什么原因呢?
  • ¥88 找成都本地经验丰富懂小程序开发的技术大咖
  • ¥15 如何处理复杂数据表格的除法运算
  • ¥15 如何用stc8h1k08的片子做485数据透传的功能?(关键词-串口)
  • ¥15 有兄弟姐妹会用word插图功能制作类似citespace的图片吗?
  • ¥15 latex怎么处理论文引理引用参考文献