采用java爬虫或phantomjs一部分百度网盘访问不了

本人小白，最近我在写一个爬虫遇到了一个问题，访问百度网盘的时候短链接地址无法访问，比如http://yun.baidu.com/s/1i4Pa7rv，但后来我又尝试访问了几个长连接的地址都可以获取到网页源代码，我用phantomjs来访问也是如此，请问这种情况有没有人遇到，求大神指点
phantomjs代码如下：

 var page = require('webpage').create();
page.settings.userAgent = 'Mozilla/4.0 (compatible; MSIE 6.1; Windows XP)';
phantom.outputEncoding="gbk";
page.open('https://yun.baidu.com/s/1i4Pa7rv', function (status) {
    if (status == 'success') {

        console.log(page.title);
    } else {
        console.log('cannot open page');
    }
    phantom.exit();
});

运行结果如下：

图片说明

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2017-05-18 16:45
关注
用fiddler抓包看下，返回什么，是不是404

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

selenium-java + phantomjs 怎么捕获网页不定时推送的元素事件 java selenium
2017-12-09 00:47

回答 5 已采纳建议，分析下网页的那个ajax请求，然后直接模拟个请求抓取需要的数据。
java如何通过cmd运行phantomjs java
2016-03-18 05:28

回答 1 已采纳 ``` public static void main(String[] args) { try { Process
关于Python 网络数据爬虫爬取不到数据 python
2020-06-01 15:18

回答 1 已采纳抓包看看，尤其注意url上的参数、cookie、postdata、method(get/post)、referer、useragent和content-type
从博客时间轴总结这一年
2019-03-30 16:42

程序员bigsai的博客或许会问为什么这个时候总结这一年，因为这个时候刚好是我认为真的步入正轨学习而有所收获的刚刚一整年，看了下csdn的文章记录，不禁回想起一年前的时光：本人现在双非大三下，在大学期间可谓是平平淡淡而过，...
phantomjs根据它的调用方式不一致 php
2015-03-21 22:26

回答 3 已采纳 So, after playing around with phantomjs and some CJK fonts, I've fixed my problem. However, this i
使用PhantomJS访问网站 php
2013-11-20 01:40

回答 1 已采纳 How about simply using page.content? Does this work: var page = require('webpage').create(); var
phantomjs linux环境网页截图生成pdf内容空白原因
2017-06-29 02:38

回答 5 已采纳估计主要问题是缺少字体。看看你pdf用的啥字体，linux有没有吧。
C# PhantomJS定时执行问题 c# c语言有问必答
2021-07-11 11:13

回答 1 已采纳不是在C#中控制退出，PhantomJS执行的js脚本要调用 phantom.exit();退出
.net+PhantomJS+Selenium关于同一个窗体中加载其他页面的问题 selenium
2018-02-07 11:15

回答 2 已采纳用chrome headless可解决
.net+PhantomJS+Selenium c#
2018-02-06 13:05

回答 2 已采纳 https://github.com/Codeception/Codeception/issues/1372 还可以用webdriver https://stackoverflow.com/q
想知道你和她在网易云喜欢的音乐的重合率？
2018-06-01 10:25

BrainZou的博客仔细一想，其实获取到歌单后做一个简单的计算重合率的应该还是挺简单的。一方面想试试简单的爬取两个界面，另外一方面想利用下自己的服务器。经过几天时间，虽说初步实现了，但是……后面会详细说遇到的问题。如何...
来自cron的phantomjs php脚本 php
2017-03-15 18:50

回答 1 已采纳 Not really an answer, but, an ugly hack. It seems to work for now, but I still would like to know
python爬虫框架-PySpider
2017-03-24 14:52

weixin_34241036的博客 From:http://cuiqingcai.com/2652.html From:... PySpider PySpider github地址 PySpider 官方文档 PySpider 中文文档 ...PySpider是binux做的一个爬虫架构的开源化实现。主要的功能...
Python带你薅羊毛：手把手教你揪出最优惠航班信息 !
2019-07-01 16:31

Python资深程序员的博客导读：简单地说，我们的目标是编写一个网络爬虫，帮你自动搜索飞往特定目的地，时间在一个弹性范围（在首选日期前后最多3天）内的航班价格。它会把搜索结果保存在一个 Excel 表格中，并把精炼过的统计信息通过电子...
计算飞机票价格python_Python 带你薅羊毛：手把手教你揪出特价机票信息
2020-12-10 13:04

weixin_39640573的博客原标题：Python 带你薅羊毛：手把手教你揪出特价机票信息简单地说，我们的目标是编写一个网络爬虫，帮你自动搜索飞往特定目的地，时间在一个弹性范围(在首选日期前后最多3天)内的航班价格。它会把搜索结果保存在一个...
整理的最全 python常见面试题（基本必考）① ②③④⑤⑥⑦⑧⑨⑩
2018-05-02 14:40

大蛇王的博客 2.迭代器和生成器的区别：答：（1）迭代器是一个更抽象的概念，任何对象，如果它的类有next方法和iter方法返回自己本身。对于string、list、dict、tuple等这类容器对象，使用for循环遍历是很方便的。在后台for语句...
2021-01-22 信息搜集更新
2021-01-22 16:24

净邪的博客目标段比较大的情况下，借助类似Masscan的工具批扫描对应IP段中所有开放了80、443、8080端口IP，然后逐个尝试ip访问，观察相应是否为目标站点。（8）历史的DNS平台 https://dnsdb.io/zh-cn/| ...
[Python人工智能] 十三.如何评价神经网络、loss曲线图绘制、图像分类案例的F值计算
2020-01-07 15:27

Eastmount的博客前一篇文章详细讲解了循环神经网络RNN和长短期记忆网络LSTM的原理知识，并采用TensorFlow实现手写数字识别的RNN分类案例。本文将分享如何评价神经网络，绘制训练过程中的loss曲线，并结合图像分类案例讲解精确率、...
没有解决我的问题, 去提问

悬赏问题

¥100 速求！商品购买力最优化问题（用遗传算法求解，给出python代码）
¥15 虚拟机检测，可以是封装好的DLL，可付费
¥15 kafka无法正常启动（只启动了一瞬间会然后挂了）
¥30 使用matlab将观测点聚合成多条目标轨迹
¥15 Workbench中材料库无法更新，如何解决？
¥20 如何推断此服务器配置
¥15 关于github的项目怎么在pycharm上面运行
¥15 内存地址视频流转RTMP
¥100 有偿，谁有移远的EC200S固件和最新的Qflsh工具。
¥15 有没有整苹果智能分拣线上图像数据

采用java爬虫或phantomjs一部分百度网盘访问不了

2条回答 默认 最新

悬赏问题

2条回答默认最新