qq_16535951 2015-12-30 08:18 采纳率: 0%
浏览 1586

httpclient 只能抽取第一页数据

    HttpClient client = HttpClients.createDefault();

    HttpGet get = new HttpGet("http://qichacha.com/search_hangye?industryCode=A&industryorder=0&p=1"); 

    HttpResponse response = client.execute(get);

    HttpEntity entity = response.getEntity();

    InputStream is=entity.getContent();

    String result=EntityUtils.toString(entity,"utf-8"); 
    // getHref(result);
     System.out.println(result);



    网址1:http://qichacha.com/search_hangye?industryCode=A&industryorder=0&p=1
    网址2:http://qichacha.com/search_hangye?industryCode=A&industryorder=0&p=2
    为什么输入两个网址抓取的数据一样?求哪位大神指教,谢谢!
  • 写回答

3条回答 默认 最新

  • 晓呆同学 2015-12-30 09:51
    关注

    这个不是你的问题,是http://qichacha.com 这个网站的问题,你没看到这个链接下不管是第几页,显示的数据都是一样的么。

    所以你抓出来的数据也是相同的。

    你直接在浏览器中查看一下。

    评论

报告相同问题?

悬赏问题

  • ¥20 求数据集和代码#有偿答复
  • ¥15 关于下拉菜单选项关联的问题
  • ¥20 java-OJ-健康体检
  • ¥15 rs485的上拉下拉,不会对a-b<-200mv有影响吗,就是接受时,对判断逻辑0有影响吗
  • ¥15 使用phpstudy在云服务器上搭建个人网站
  • ¥15 应该如何判断含间隙的曲柄摇杆机构,轴与轴承是否发生了碰撞?
  • ¥15 vue3+express部署到nginx
  • ¥20 搭建pt1000三线制高精度测温电路
  • ¥15 使用Jdk8自带的算法,和Jdk11自带的加密结果会一样吗,不一样的话有什么解决方案,Jdk不能升级的情况
  • ¥15 画两个图 python或R