思梓
2016-01-21 01:46
采纳率: 100%
浏览 1.5k
已采纳

对getBytes()的一点疑问

我输入的程序是这样的

                byte d[]="你我他".getBytes();
                byte b[]="hahaha".getBytes();
          System.out.println("数组d的长度是(一个汉字占两个字节):"+d.length+"个字节");
          String s=new String(d,0,2);
          System.out.println(s);
          System.out.println(d.length); 

这是得到的结果

数组d的长度是(一个汉字占两个字节):9个字节
�
9

不太理解为什么一个汉字占两个字节,"你我他"的长度却是9
还有运行结果的第二行那个问号是啥意思啊?

  • 点赞
  • 写回答
  • 关注问题
  • 收藏
  • 邀请回答

5条回答 默认 最新

  • shufusheng 2016-01-21 02:26
    已采纳

    汉字使用gbk,utf-8的编码所占的字节长度不一样;第二行是乱码截取有问题。你可以参考下面
    byte[] t_iso = "你我他".getBytes("ISO8859-1");
    byte[] t_gbk = "你我他".getBytes("GBK");
    byte[] t_utf8 = "你我他".getBytes("utf-8");
    byte b[] = "hahaha".getBytes();
    System.out.println("数组d的长度是(一个汉字占两个字节):" + t_utf8.length + "个字节");

        String s = new String(t_utf8);
        System.out.println(s);
        System.out.println(t_iso.length);
        System.out.println(t_gbk.length);
        System.out.println(t_utf8.length);
    
    点赞 评论
  • 乐古 2016-01-21 02:01

    byte不识别中文的,你把字符型转换为字节型它会出现乱码,你可以把d打印出来试试

    点赞 评论
  • 把分全给哥 2016-01-21 02:03

    图片说明

    点赞 评论
  • xinmujin 2016-01-21 02:13

    编码方式不一样,GBK和UTF-8占的字节可能不一样

    点赞 评论
  • 毕小宝 2016-01-21 02:15

    首先,java对汉字的处理采用的是utf-8的编码格式,所以一个汉字是占据三个字节的;
    其次,你这里new String(d,0,2)得到的是中文乱码,说明你的工作空间的编码不是utf-8。我这里测试的结果是"你"。

    点赞 评论

相关推荐 更多相似问题