suyie007 2016-06-21 07:47 采纳率: 0%
浏览 1732

关于通过php curl 模拟登陆联通光猫192.168.1.1地址抓取页面数据的问题

1.联通光猫华为的。
2.看了下192.168.1.1登陆页面的源代码,都是用js去处理的,大概先是判断是否用浏览器访问,然后是生成随机码,生成cookie,然后判断用户是否存在之类。
3.问题:对于判断是否浏览器访问,如果用curl 模拟登陆的话 ,可以实现这个功能吗?

相关截图:
图片说明
图片说明

如果我想抓取截图页面里的数据,能用curl 去实现吗?

求大神指点~多谢多谢~

登陆页的源代码文件地址:

http://test.muduche.com/lt/lt.html

看这个页面的源代码就可以

  • 写回答

3条回答 默认 最新

  • zhangsheng_1992 2016-06-21 08:49
    关注

    1.首先是可以模拟浏览器请求的

    2.你要抓的内容是登陆后才显示的 所以你需要用curl post一个表单去登录 先正常登录一下 看看他的url接口跟请求数据 登录成功后你能获取到他反给你的cookie

    3.后续再去请求你要抓的页面 记得在header中带上cookie 就不会被认为非法登录

    4.如果页面是js生存code异步加载的 那么你就要看看他的code生存规则 然后请求他js加载的那个接口

    评论

报告相同问题?

悬赏问题

  • ¥50 导入文件到网吧的电脑并且在重启之后不会被恢复
  • ¥15 (希望可以解决问题)ma和mb文件无法正常打开,打开后是空白,但是有正常内存占用,但可以在打开Maya应用程序后打开场景ma和mb格式。
  • ¥20 ML307A在使用AT命令连接EMQX平台的MQTT时被拒绝
  • ¥20 腾讯企业邮箱邮件可以恢复么
  • ¥15 有人知道怎么将自己的迁移策略布到edgecloudsim上使用吗?
  • ¥15 错误 LNK2001 无法解析的外部符号
  • ¥50 安装pyaudiokits失败
  • ¥15 计组这些题应该咋做呀
  • ¥60 更换迈创SOL6M4AE卡的时候,驱动要重新装才能使用,怎么解决?
  • ¥15 让node服务器有自动加载文件的功能