wu83qing 2011-08-29 07:03
浏览 567
已采纳

请教HttpClient 读取内容乱码的问题

 

public static String getData() throws HttpException, IOException {
        HttpClient client = new HttpClient();
        GetMethod getMethod = new GetMethod("/Default.aspx?Page=MemDirsCompGroup&cGroupID=11&p=1");
        client.getHostConfiguration().setHost("www.iranrd.net", 80,"http");
        System.out.println("charset=>"+getMethod.getResponseCharSet());
        client.executeMethod(getMethod);
         try {
                InputStream in;
                in = getMethod.getResponseBodyAsStream();
                BufferedReader br = new BufferedReader(new InputStreamReader(in,"ISO-8859-1"));
                String tempbf;
                StringBuffer res= new StringBuffer(500);
                while ((tempbf = br.readLine()) != null) {
                 res.append(tempbf + "\n");
                }
                System.out.println("Response = "+res.toString());
                getMethod.releaseConnection();
               } catch (IOException e) {
                e.printStackTrace();
               
               }
                return null;
    }

 请教下大家,getMethod 方法Response对象返回的是ISO-8859-1字符编码 可是依然读取出来的数据为乱码,查看返回的数据里面

 有句  <meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

 引用:

      对于象xml或者html这样的文件,允许作者在页面中直接指定编码类型。
      比如在html中会有<meta http-equiv="Content-Type" content="text/html; charset=gb2312"/>这样的标签;
      或者在xml中会有<?xml version="1.0" encoding="gb2312"?>这样的标签,
      在这些情况下,可能与http头中返回的编码信息冲突,需要用户自己判断到底那种编码类型应该是真正的编码。
 出自:http://www.ibm.com/developerworks/cn/opensource/os-httpclient/#ibm-pcon

  请大家帮忙看看

  PS:读取的网站是伊朗的

 

 

 

展开全部

  • 写回答

5条回答 默认 最新

  • AngelAndAngel 2011-08-29 07:11
    关注

    1,你直接String html =get.getResponseBodyAsString();这样就可以得到html的String对象了,不需要用流来读取了
    2,
    然后你 html=encodeHtml(html);
    encodeHtml方法如下:
    [code="java"]public String encodeHtml(String html) {
    String mh=html;
    try {
    mh=new String(html.getBytes("iso-8859-1"));
    } catch (UnsupportedEncodingException e) {
    e.printStackTrace();
    }
    return mh;
    }[/code]
    3,我就是这样做的,不行的话,你就改动里面的iso-8859-1为utf-8等等。

    应该没问题的。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(4条)
编辑
预览

报告相同问题?

悬赏问题

  • ¥15 在更新角色衣服索引后,Sprite 并未正确显示更新的效果该如何去解决orz(标签-c#)
  • ¥15 VAE代码如何画混淆矩阵
  • ¥15 求遗传算法GAMS代码
  • ¥15 雄安新区高光谱数据集的下载网址打不开
  • ¥66 android运行时native和graphics内存详细信息获取
  • ¥100 求一个c#通过CH341读取数据的Demo,能够读取指定地址值的功能
  • ¥15 rk3566 Android11 USB摄像头 微信
  • ¥15 torch框架下的强化学习DQN训练奖励值浮动过低,希望指导如何调整
  • ¥35 西门子博图v16安装密钥提示CryptAcquireContext MS_DEF_PROV Error of containger opening
  • ¥15 mes系统扫码追溯功能
手机看
程序员都在用的中文IT技术交流社区

程序员都在用的中文IT技术交流社区

专业的中文 IT 技术社区,与千万技术人共成长

专业的中文 IT 技术社区,与千万技术人共成长

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

客服 返回
顶部