本人小白,最近我在写一个爬虫遇到了一个问题,访问百度网盘的时候短链接地址无法访问,比如http://yun.baidu.com/s/1i4Pa7rv, 但后来我又尝试访问了几个长连接的地址都可以获取到网页源代码,我用phantomjs来访问也是如此,请问这种情况有没有人遇到,求大神指点
phantomjs代码如下:
var page = require('webpage').create();
page.settings.userAgent = 'Mozilla/4.0 (compatible; MSIE 6.1; Windows XP)';
phantom.outputEncoding="gbk";
page.open('https://yun.baidu.com/s/1i4Pa7rv', function (status) {
if (status == 'success') {
console.log(page.title);
} else {
console.log('cannot open page');
}
phantom.exit();
});
运行结果如下: