汤凯� 2019-04-19 20:44 采纳率: 0%
浏览 4151

网页源代码中没有网页信息如何爬取。

在帮老师爬取好专家网页时,
第一发现应该使用了和携程类似的ajax网页技术吧,小白不太了解,点击下一页时,url不改变。
第二网页源代码中没有网页信息如何爬取,网页中的专家姓名等信息在网页源代码中压根找不到
附上网址http://hzj.tech110.net/expert/expsearch.jspx?expcode=1&flag=2#

谢谢啦

  • 写回答

1条回答 默认 最新

  • threenewbee 2019-04-20 00:05
    关注

    是ajax方式异步提交的,抓包看了下

    POST到 http://hzj.tech110.net/expert/search_Search_searchByCondition.jspx
    参数

    condition.keyword=&condition.selectedType=0&condition.typeService=&condition.typeArea=&condition.typeAge=&condition.typeProtitle=&condition.typeEdu=&condition.typeOrg=&condition.typeOrder=0&condition.typeExpert=&condition.ifsigned=1&pageSize=12&currentNo=2
    

    condition.keyword:
    condition.selectedType:0
    condition.typeService:
    condition.typeArea:
    condition.typeAge:
    condition.typeProtitle:
    condition.typeEdu:
    condition.typeOrg:
    condition.typeOrder:0
    condition.typeExpert:
    condition.ifsigned:1
    pageSize:12 //每页12条
    currentNo:2 //第2页

    评论

报告相同问题?

悬赏问题

  • ¥15 执行 virtuoso 命令后,界面没有,cadence 启动不起来
  • ¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
  • ¥20 有关区间dp的问题求解
  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置
  • ¥15 有没有研究水声通信方面的帮我改俩matlab代码
  • ¥15 ubuntu子系统密码忘记
  • ¥15 保护模式-系统加载-段寄存器
  • ¥15 电脑桌面设定一个区域禁止鼠标操作
  • ¥15 求NPF226060磁芯的详细资料