Metro2033 2015-01-28 02:20 采纳率: 60%
浏览 2081
已采纳

Java HTTP Client 抓取网页,这个网页无论用什么编码都是乱码?

http://www.licai.com/xuetang/CiDian.aspx?dj=1&type=&page=1

       client.executeMethod(get);
            //
            String statusText = get.getStatusText();
            //System.out.println("Test.main():--->" + statusText);
            System.out.println("Test.main():--->" + new String(get.getResponseBodyAsString().getBytes("GB2312"), "UTF-8"));

            InputStream in = get.getResponseBodyAsStream();
            BufferedReader br = new BufferedReader(new InputStreamReader(in, charset));
            String tempbf;
            html = new StringBuffer(100);
            while ((tempbf = br.readLine()) != null) {

                html.append(tempbf + "\n");

            }

代码 大概就是这样的

  • 写回答

2条回答 默认 最新

  • 微wx笑 Java领域优质创作者 2015-02-04 10:16
    关注
            // 默认的client类。
            HttpClient client = new DefaultHttpClient();
            // 设置为get取连接的方式.
            HttpGet get = new HttpGet(url);
            // 得到返回的response.
            HttpResponse response = client.execute(get);
            // 得到返回的client里面的实体对象信息.
            HttpEntity entity = response.getEntity();
            if (entity != null) {
                System.out.println( entity.getContentEncoding());
                System.out.println( entity.getContentType());
                // 得到返回的主体内容.
                InputStream instream = entity.getContent();
                BufferedReader reader = new BufferedReader(new InputStreamReader(instream, encoding));
                System.out.println(reader.readLine());
                // EntityUtils 处理HttpEntity的工具类
                // System.out.println(EntityUtils.toString(entity));
            }
    
            // 关闭连接.
            client.getConnectionManager().shutdown();
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

悬赏问题

  • ¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
  • ¥30 截图中的mathematics程序转换成matlab
  • ¥15 动力学代码报错,维度不匹配
  • ¥15 Power query添加列问题
  • ¥50 Kubernetes&Fission&Eleasticsearch
  • ¥15 報錯:Person is not mapped,如何解決?
  • ¥15 c++头文件不能识别CDialog
  • ¥15 Excel发现不可读取的内容
  • ¥15 关于#stm32#的问题:CANOpen的PDO同步传输问题
  • ¥20 yolov5自定义Prune报错,如何解决?