2 weixin 38425228 weixin_38425228 于 2017.09.03 10:31 提问

php模拟登录网站,获取数据,

PHP 模拟登录网站,请大神求教 ?
比如模拟登陆百度, 该怎么做呢,

3个回答

liubo_10184653
liubo_10184653   2017.09.12 15:58
已采纳
    $cookie = 'BDORZ=B490B5EBF6F3CD402E515D22BCDA1598;';
    $cookie .= 'PSINO=2;';
    $cookie .= 'H_PS_PSSID=1461_21100_20930;';
    $cookie .= 'MCITY=-131%3A;';
    $cookie .= 'BIDUPSID=80AC6EA669AE16286E6BD37C4E7F784C;';
    $cookie .= 'PSTM=1493796031;';
    $cookie .= 'BAIDUID=127D8DCA6C31091ED3AB45E8AD4685E5:FG=1;';

    $cookie .= 'PANPSC=10135121516028446209:M3/m2/8VCaAihLW7pKbkIrHQG6qeixv0Ueq9Dt6sx0ml9A8l9xoA6xrLuQGf8Rv4MMKOMtLkW73o+m+Nb7gNpUFOHaZbYIbmD

+VKNxoaW+DXG9GmBZpeFSoXuRAkm6oPj/F8UySlqbgjba2MupZagLTZ6IPbKwEqK1jqgN6tzwnA7ohSXIR1cjm7g7CLsfI4RPoS1ZAzLYpJLOsdih
+PVA==;';
$cookie .= 'Hm_lpvt_7a3960b6f067eb0085b7f96ff5e660b0=1505202249;';
$cookie .= 'Hm_lvt_7a3960b6f067eb0085b7f96ff5e660b0=1505202283;';
$cookie .= 'SCRC=427a5d06e18146bf705e89f4ba550546;';
$cookie .= 'STOKEN=efc2a3f0ff8377df415b8cbd7a0fd92b44c85efc96b50079e5ff3e1d1bf4cfa2;';
$cookie .= 'PANWEB=1;';

// $url = 'http://pan.baidu.com/s/1slCHt7Z';
$url = 'http://pan.baidu.com/share/init?shareid=418435232&uk=2083399743';
$ci = curl_init($url);
curl_setopt($ci, CURLOPT_COOKIE , $cookie);
curl_setopt($ci, CURLOPT_RETURNTRANSFER, TRUE);
$result = curl_exec($ci);
curl_close($ci);
echo $result;
exit;

            上面是曾经用过的curl获取百度网盘内容的代码,基本都是这个过程,主要百度做了很多防止爬取判断,需要设置很多的cookie,而且有时效限制。
qianyan0365
qianyan0365   2017.09.03 11:33

思路都一样! 用抓包工具抓下登陆某个网站的登陆包! 之后用 php去请求发送这个 请求就行了!

weixin_38425228
weixin_38425228 能否指点一下呢 教我一下呢 抓包需要哪些信息这个都不会
11 个月之前 回复
lost_chost
lost_chost   2017.09.07 17:40

curl模拟登陆,获取cookie

weixin_38425228
weixin_38425228 看了看API接口,也是做不来。。。。哎。。!!
11 个月之前 回复
Csdn user default icon
上传中...
上传图片
插入图片
准确详细的回答,更有利于被提问者采纳,从而获得C币。复制、灌水、广告等回答会被删除,是时候展现真正的技术了!
其他相关推荐
PHP+Curl远程模拟登录并获取数据
Curl在抓取网页要比file_get_contents()效率就要高些,支持多线程,并且curl提供了丰富的函数,你可以很方便的应用到webservice接口调用。
PHP用curl模拟登陆并采集后台数据
PHP用curl模拟登陆并采集后台数据步骤: 1、请求登陆,获取返回的保存身份信息的cookie,并存入指定cookie文件。见类login()方法 2、请求需身份验证的页面,带上cookie文件。见类getcontent()方法 PHP的CURL库中可以设置记录和读取cookie。有三个重点: 1、CURLOPT_COOKIE: 在http头中设置cookie的信息 如: curl_setopt($ch,CURL
【CURL】模拟登录网站并获取用户信息
模拟登录网站并获取用户信息前言这次来做的是通过代码的方式,模拟登录秒拍官网,获取登录用户的信息。前后端分离本文的标题是CURL,传统的网站是PHP代码直接渲染项目视图,通过表单提交到控制器直接进行数据操作。传统模拟登录的方式在页面上找到表单元素,直接进行模拟表单提交。近两年前端技术趋于完善,实现了前后端分离。分析页面元素秒拍官网地址 http://www.miaopai.com/通过审查元素以及源代
网络爬虫中的模拟登陆获取数据(实例教学1)
目录模拟登陆的原因 如何模拟登陆 实战demo模拟登陆的原因很多网站,我们是无法直接获得服务器返回的数据,需要输入用户名及密码才能看到数据。如我们登陆人人网时,网站网址http://www.renren.com/。如图所示,看到的是一个登陆的界面,必须输入用户名及密码才能看到返回的数据。 登陆后,看到的数据,便可以通过爬虫将网站的html,或者json数据抓下来,解析。 如何模拟登陆模拟登陆之前
PHP使用CURL实现对带有验证码的网站进行模拟登录的方法
/** * 模拟登录 *///初始化变量$cookie_file = "tmp.cookie"; $login_url = "http://xxx.com/logon.php";$verify_code_url = "http://xxx.com/verifyCode.php";  echo "正在获取COOKIE...\n";$curl = curl_init();$timeout = 5;cu...
PHP使用CURL对带有验证码的网站进行模拟登录
在网上查了一些别人写的模拟登录程序,好多都是通过服务程序apache什么的运行,获取到验证码之后显示在网页上,然后填上再POST出去,这样虽然看起来很友好,但是既然模拟登录,登录后所干的事情就不一定是短时间完成的,所以这就要受到php最大执行时间的限制,而且有些操作还有可能权限不足。我写了一个,思路就是获取到验证码之后把验证码存储为一个图片,然后程序休眠20秒,在20秒之后由用户手动查看图片,并把
网络爬虫模拟登陆获取数据并解析实战(二)
目录分析要获取的数据 程序的结构 构建封装数据的model 模拟登陆程序并解析数据 结果展示分析要获取的数据下面继续实战,写一个模拟登陆获取汽车之家,用户信息的程序。如果大家对模拟登陆获取数据不太了解,建议看完http://blog.csdn.net/qy20115549/article/details/52249232,我写的这篇含有抓包获取人人网数据的案例程序,研究透之后,再来看这个要轻松很多。
PHP通过CURL模拟登录并获取数据
/*通过CURL模拟登录并获取数据 一些网站需要权限认证,必须登录网站后,才能有效地抓取网页并采集内容, 这就需要curl来设置cookie完成模拟登录网页,php的curl在抓取网页内容方 面效率是比较高的,而且支持多线程,而file_get_contents()效率就要稍低 些。模拟登录的代码如下所示: */ function login_post($url, $cookie, $
记一次C#的web模拟登录抓取
模拟登录的文章有很多,代码也有很多,但是缺少详细的关于如何抓取登录时的请求内容,以及我在模拟登录过程中出现的一些问题。 实现步骤; 使用抓包工具(这里使用360浏览器自带的工具)抓取登录动作时我们向服务法送的请求的内容使用httpwebrequest模拟请求,然后获取应答内容,保存cookie;使用保存的cookie发起需要获取页面的请求获取页面内容。 以艺龙旅行网为例子: 首先打
php curl模拟登录discuz并模拟发帖的实现方法
php curl好用,这个没得说,jquery中文网以前提供的文章多是curl模拟登陆或伪造IP的,比如下面这几篇: php中通过curl smtp发送邮件的例子 有关php的curl_setopt函数相关应用及介绍 PHP中用CURL伪造IP来源的方法 php使用curl伪造IP来源的代码 php模拟登录qq邮箱(curl命令详解) curl命令模拟表单上传文件 今天,为大家介