编码问题

大家好，请教个问题：

String s="abc你好";

byte[] by=s.getBytes();

输出by.length();

在系统默认编码为GBK是输出7；
在系统默认编码为utf-8时输出9；

我的疑问：
（1）"abc你好"保存为gbk源码时，"abc"各一个字节，"你好"各两个字节，共7个字节，而保存为utf-8源码时，"abc"各一个字节，"你好"各3个字节，共9字节，这些我都能理解。

      （2）但是源程序被编译成字节码后，s到了java程序中，都是以unicode编码标识的，每个字符是2个字节，s.getBytes()是怎样把s编成字节数组的呢，是针对的unicode编码呢，还是默认编码呢？如果是针对unicode，怎么会在不同默认编码下有不同结果呢？如果是针对默认编码，但程序执行的是字节码，源文件都被编译了，干嘛还针对默认编码呢？

唉，糊涂了！

请详细解释一下！最好是对编码过程有个介绍，谢谢！

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
weixin_42525443 2010-08-27 12:27
关注
java内部是使用char类型来处理字符串的，使用String.toCharArray() 返回的长度都是一样的

1.编译程序在读.java文件的时候会已一定的编码读取比方说GBK/UTF-8
类似String s=new String(byteArrayFromFile,"GBK") 对GBK文件,"abc你好"为7个byte
String s=new String(byteArrayFromFile,"UTF-8") 对UTF-8文件,"abc你好"为9个byte
不管哪种方式读进来，都是用char[]cs=s.toCharArray()表示,其长度都是5

2.编译后在写.class文件时内
byte[] bs=String.getBytes("UTF-8");//.class文件内部使用的是UTF-8的byte []保存字符串. "abc你好"为9个byte
outputStream.write(bs);

所以针对相同内容不同编码的文件，其编译之后的结果是一样的。

默认编码应该在进行String类操作的时候会用到
比方说从byte[] -> String 或者 String -> byte[]
最简单的列子就是从文件读取字符串,一定要指定编码，否则不同环境下的默认编码不同会导致结果不同.

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

Python字符串编码解码研究的心得体会及乱码问题解决方法
2025-12-26 08:42

尤其是在网络编程中，由于不同系统和应用之间的字符编码标准不统一，字符串编码解码不当常常导致乱码问题。为了解决这一问题，研究者们通常会采用一些编码解码策略。字符串编码是将字符串中的字符转换为可以存储和...
python查询mysql中文乱码问题
2020-09-10 11:56

Python查询MySQL时遇到的中文乱码问题是一个常见的编程困扰，特别是在使用Python 2.7版本时更为突出。本文将深入探讨这个问题的成因，并提供一套详细的解决方案。首先，我们需要了解问题的根本原因。当Python与...
Netty进制转换乱码问题
2020-07-20 14:12

不同的编码方式会导致相同的字符表示为不同的字节序列，如果在发送端和接收端使用了不同的编码方式，就会出现乱码问题。 2. **Netty中的 ByteBuf**：Netty的ByteBuf提供了多种方法来读写字节，但并未涉及字符编码。...
Python爬虫基于lxml解决数据编码乱码问题
2020-12-17 07:25

在Python爬虫开发中，经常会遇到数据编码乱码的问题，特别是在处理HTML或XML文档时。lxml库作为Python的一个强大的解析库，不仅支持HTML和XML的解析，还提供了XPath这一强大的查询工具，使得数据提取变得更为高效。...
不同编码的页面表单数据乱码问题解决方法
2020-09-03 22:45

表单数据的乱码问题通常是由于页面编码与服务器或后台系统所期待的编码不一致导致的。本问题中，用户遇到了一种特殊的情况，即在一个使用UTF-8编码的页面上填写的表单数据在提交到使用GB2312编码的服务器后出现乱码...
Android Retrofit 中文乱码问题的解决办法
2020-08-29 01:24

Android Retrofit 中文乱码问题是一种常见的问题，在使用 Retrofit 进行网络请求时，中文字符可能会被编码成乱码，从而导致数据传输错误。解决这个问题需要从多方面入手，包括修改请求方式、参数类型、编码格式等。...
hadoop中文乱码问题
2019-08-09 01:30

解决Hadoop中文乱码问题的关键在于识别和匹配数据的正确编码，并在Hadoop组件和工具中设置相应的编码选项。在实际操作中，可能需要结合日志信息和源码调试来定位问题。同时，建立良好的编码规范，统一数据的编码格式...
Jmeter5.5上传文件中文乱码问题解决包
2022-12-06 11:08

解决Jmeter5.5、Jmeter5.5、Jmeter5.5上传文件中文乱码问题和录制脚本中文乱码问题，其他版本请勿使用！使用时替换原本的lib\ext目录下的ApacheJMeter_http.jar文件并重启，上传文件时，需要勾选“对POST使用...
Tomcat 控制台乱码问题及 IDEA 编码设置 UTF-8 方法
2025-10-07 18:59

- idea编码设置UTF-8：在Intelij IDEA中设置编码格式为UTF-8以解决字符编码不一致导致的乱码问题。详细知识点：1. Tomcat日志编码与IDEA显示编码的区别： - Tomcat日志编码是指Tomcat服务器生成的日志文件所使用的...
网页语言编码及asp乱码问题解决方案
2020-10-30 20:03

### 网页语言编码及ASP乱码问题解决方案 #### 一、乱码问题概述在进行多语言网站开发的过程中，经常会遇到字符编码不统一导致的乱码问题。特别是当原有的系统只支持一种语言（如中文）时，扩展到其他语言（如日语...
中文乱码问题常见的解决方案
2025-12-18 17:43

此外，对于处理中文乱码问题，还需要注意不要将中文直接存储在ASCII编码的文本文件中，因为这会导致无法识别和处理中文字符。在使用文本编辑器或IDE时，应选择支持UTF-8编码的工具，并在保存文件时明确指定使用UTF-8...
乱码问题的解决
2015-12-16 21:56

"乱码问题的解决" 在 Web 开发中，乱码问题是常见的...乱码问题的解决需要从多方面入手，包括设置页面编码、服务器编码、客户端编码、数据库编码和超链接的 url 编码等。只有通过统一编码，才能避免乱码问题的出现。
windows cmd修改编码注册文件，解决使用aapt获取apk信息的乱码问题
2022-09-08 12:24

总的来说，解决CMD中aapt获取apk信息时的乱码问题，关键在于调整CMD的字符编码设置，使其支持UTF-8。通过修改注册表，我们可以实现这一目标，从而避免因为编码不匹配导致的显示异常。在日常开发和使用命令行工具时，...
解决Ubuntu和Windows的文件乱码问题
2020-07-22 04:50

综上所述，解决Ubuntu与Windows在文件处理时出现的乱码问题主要包括转换文件编码和使用特定的工具来处理。iconv命令用于内容编码转换，而convmv是处理文件名编码转换的利器。对于zip和rar压缩文件，可以分别使用7-...
IDEA控制台出现中文乱码问题解决
2025-06-30 22:26

在使用 IntelliJ IDEA 开发 Java 项目时，控制台中文乱码是开发者常遇到的问题，这多因编码设置不一致导致。解决此问题，首先需确保项目编码设置正确。在 IDEA 中，通过“File”->“Settings”->“Editor”->“File ...
jquery向.ashx文件post中文乱码问题的解决方法
2020-10-28 15:29

综上所述，解决jquery向.ashx文件post中文乱码问题的核心在于确保前端发送的数据编码与服务器端接收和处理数据的编码一致。具体操作时，开发者应当检查并测试所有相关的配置和编码方式，确保它们匹配无误。此外，还...
confluence---乱码问题.docx
2020-07-10 17:12

2. **统一编码设置**：确保整个系统使用统一的字符编码标准，例如UTF-8，避免因不同组件使用不同编码而引起的乱码问题。 #### 六、总结综上所述，解决Confluence中的乱码问题主要包括以下几个方面：安装必要的...
php 读取文件乱码问题
2020-10-29 08:50

在PHP编程中，读取文件时遇到乱码问题通常是由于编码不匹配导致的。这个问题在PHP 5中尤其常见，因为该版本开始，默认的流读取函数如`file_get_contents()`假设文件内容是UTF-8编码。而在PHP 4中，这种假设可能不太...
servlet 解决乱码问题
2020-09-03 19:59

在处理中文字符时，Servlet可能出现乱码问题，主要是由于字符编码不一致导致的。以下分别介绍GET和POST方式下解决乱码问题的方法。 1. POST方式乱码问题解决：当使用POST方式提交数据时，请求体（request body）...
JavaScript 乱码问题
2020-10-29 19:35

JavaScript乱码问题是指在使用JavaScript进行网页开发时，出现的文字显示错误现象，导致网页内容无法正确显示原有字符，而是出现了乱码。这种情况常见于不同的字符编码之间转换不当或不统一所导致的。在JavaScript...
没有解决我的问题, 去提问

编码问题

2条回答 默认 最新

2条回答默认最新