java String.getBytes统计超过1024byte的字节时出错

linux下的eclipse 64,neon版本，JDK1.8

在做socket通讯解析数据包时出现的，写了个小程序做测试

 package jiang;

import java.io.UnsupportedEncodingException;
import java.util.Scanner;

public class Test {
    public static void main(String[] args){
        Scanner scanner = new Scanner(System.in);
        while(scanner.hasNextLine()){
            String str = scanner.nextLine();
            //byte[] strByte = str.getBytes();
            byte[] strByte = null;
            try {
                strByte = str.getBytes("UTF-8");
            } catch (UnsupportedEncodingException e) {
                // TODO Auto-generated catch block
                e.printStackTrace();
            }
            Integer len = strByte.length;
            System.out.println("长度为"+len);
        }
        scanner.close();

    }
}

输入字符串:

大叔大婶大所多我我后变动爱上导师带时候对暗示对啊会死盾和啊速度和爱随后对按时段是和段数打碎的话丢失的打碎的打死段把低俗覆盖苏打手我彼此啊速度还是带速度还是大慧寺等你哦爱上带回到第三到的海外度搜啊擦搜不到大叔大婶多你发哦到大神你撒打算导师带时候对暗示对啊会死盾和啊速度和爱随后对按时段是和段数打碎的话丢失的打碎的打死段把低俗覆盖苏打手我彼此啊速度还是带速度还是大慧寺等你哦爱上带回到第三到的海外度搜啊擦搜不到大叔大婶多你发哦到大神你撒打算导师带时候对暗示对啊会死盾和啊速度和爱随后对按时段是和段数打碎的话丢失的打碎的打死段把低俗覆盖苏打手我彼此啊速度还是带速度还是大慧寺等你哦爱上带回到第三到的海外度搜啊擦搜不到大叔大婶多你发哦到大神你撒打算到静安寺坡大声道大叔大婶多大叔大婶大叔大叔dddddd

输出结果：长度为1029

输入字符串:

大叔大婶大所多我我后变动爱上导师带时候对暗示对啊会死盾和啊速度和爱随后对按时段是和段数打碎的话丢失的打碎的打死段把低俗覆盖苏打手我彼此啊速度还是带速度还是大慧寺等你哦爱上带回到第三到的海外度搜啊擦搜不到大叔大婶多你发哦到大神你撒打算导师带时候对暗示对啊会死盾和啊速度和爱随后对按时段是和段数打碎的话丢失的打碎的打死段把低俗覆盖苏打手我彼此啊速度还是带速度还是大慧寺等你哦爱上带回到第三到的海外度搜啊擦搜不到大叔大婶多你发哦到大神你撒打算导师带时候对暗示对啊会死盾和啊速度和爱随后对按时段是和段数打碎的话丢失的打碎的打死段把低俗覆盖苏打手我彼此啊速度还是带速度还是大慧寺等你哦爱上带回到第三到的海外度搜啊擦搜不到大叔大婶多你发哦到大神你撒打算到静安寺坡大声道大叔大婶多大叔大婶大叔大叔的ddd

输出结果:长度为1035

输入字符串:

大叔大婶大所多我我后变动爱上导师带时候对暗示对啊会死盾和啊速度和爱随后对按时段是和段数打碎的话丢失的打碎的打死段把低俗覆盖苏打手我彼此啊速度还是带速度还是大慧寺等你哦爱上带回到第三到的海外度搜啊擦搜不到大叔大婶多你发哦到大神你撒打算导师带时候对暗示对啊会死盾和啊速度和爱随后对按时段是和段数打碎的话丢失的打碎的打死段把低俗覆盖苏打手我彼此啊速度还是带速度还是大慧寺等你哦爱上带回到第三到的海外度搜啊擦搜不到大叔大婶多你发哦到大神你撒打算导师带时候对暗示对啊会死盾和啊速度和爱随后对按时段是和段数打碎的话丢失的打碎的打死段把低俗覆盖苏打手我彼此啊速度还是带速度还是大慧寺等你哦爱上带回到第三到的海外度搜啊擦搜不到大叔大婶多你发哦到大神你撒打算到静安寺坡大声道大叔大婶多大叔大婶大叔大叔的的

输出结果:长度为1035

输入字符串:

的的

输出结果:长度为6

输入字符串:

的ddd

输出结果:长度为6

输入字符串:

dddddd

输出结果:长度为6

按照正常的情况，一个中文在utf-8下是３个字节，英文字母是１的字节，但是前两条测试，我将**ddd**替换为**的**，字节差了６个，这个情况是在超过1024字节才会出现

请教一下可能出现了什么问题？已经调了大概一天了，才定位到这个问题

展开全部

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2016-12-03 07:40
关注
设置下socket缓冲区大小 http://blog.csdn.net/fastthinking/article/details/10930193

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报
编辑

预览
轻敲空格完成输入
显示为

卡片

标题

链接
评论

按下Enter换行，Ctrl+Enter发表内容

编辑

预览

报告相同问题？

关注问题

RSA加密字节改变，String与byte转出问题
2015-08-13 00:01

回答 2 已采纳字符串变成字符数组，是否为正确。你需要看看加密需要的数据，跟你输入的字符串类型如何转换
关于java英文，中文所占大小的问题 java
2022-01-25 06:57

回答 1 已采纳 "人"转换成byte显示长度为3，是因为你用的UTF-8编码，在这个编码里，所有的字符字节长度都是3，当然包括英文字符。你可以看看转换出来的3个byte的数值大小，中文要明显大于英文。这也就是有些教材
Java简易服务器中文乱码 java 服务器
2022-10-07 13:47

回答 3 已采纳你这个问题的原因是访问的时候浏览器自动进行了url编码。只需要在获取参数的地方进行解码就可以了。
关于Java里面的String.getBytes()方法
2020-08-04 12:49

鸭梨的药丸哥的博客 Java里面的String类型的编码方式是根据你项目字符串的编码方式有关，如果你使用的是GBK编码方式，那么你通过string里面的getBytes()方式获取的字符的字节是2。如果使用的是UTF-8编码的方式，那么一个字符getBytes()...
跪求如何解决java中由getInputStream()方法带来的Socket is closed问题？ eclipse java
2019-08-28 08:27

回答 2 已采纳 out的关闭会导致socket的关闭。 java.net.SocketOutputStream#close
用php写出下面java的代码，不知道php有没有对字节的压缩？ java php
2018-01-03 00:01

回答 2 已采纳 PHP是不会对字节进行压缩的
对getBytes()的一点疑问
2016-01-20 17:46

回答 5 已采纳汉字使用gbk，utf-8的编码所占的字节长度不一样；第二行是乱码截取有问题。你可以参考下面 byte[] t_iso = "你我他".getBytes("ISO8859-1"); by
java getbytes utf8_(透彻)java String.getBytes()编码问题
2021-02-12 16:58

weixin_39902184的博客 String.getBytes()的问题String 的getBytes()方法是得到一个字串的字节数组，这是众所周知的。但特别要注意的是，本方法将返回该操作系统默认的编码格式的字节数组。如果你在使用这个方法时不考虑到这一点，你会...
上位机和APP建立通信时遇到的问题 android-studio java
2022-07-09 01:37

回答 1 已采纳你这里接收数据的地方不是一直在跑如果不能保持通信，那么长连接可能过段时间会断开。不要从while跳出来，一直接收就可以
java模拟TCP通信--实现客户端上传文件到服务器端 java 有问必答
2021-08-26 01:57

回答 4 已采纳看下你的代码，说明文件内容没有正常写入到服务器中。
java中的字节数组问题？
2016-05-17 23:14

回答 2 已采纳 "doload"是一个长度为6的字符串，然后你又调用了getBytes()，这个方法的作用是将当前的字符串转换为byte数组，这个转换后的数组长度为6，并且你将这个数组重新赋值给了test1对象，
Java中的String类getBytes()方法详解与实例
2023-07-27 17:38

星际编程喵的博客在本文中，我们学习了Java String类的getBytes()方法，它允许将字符串转换为字节数组，并且可以指定字符编码方式。通过实例和代码演示了使用平台默认字符编码和指定UTF-8、ISO-8859-1字符编码的情况。getBytes()方法...
服务器乱码专栏问题一：String.getBytes()获取值乱码
2021-08-23 18:36

Gentleman灬rose的博客本文建议阅读时长:15mins 前记：最近笔者工作比较繁忙，导致本来应该有很多... 回归正题：先说一下今天的出错场景，业务在前端传递String对象到后台，后台在将获取String对象将其转化为byte数组，存入数据库的一个...
记java之String.getBytes()遇到的字符编码的坑
2018-09-04 02:20

Amio_的博客大致意思是String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组，也就是说在不同的操作系统返回的不一样，参考链接： https://www.cnblogs.com/jiayouxiage/p/6120604.html 问题修正 ...
String.getBytes()& JAVA编码转换的详细过程
2018-09-05 02:52

tyyh08的博客在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不通OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的...
Java中的String的getBytes()方法
2020-05-30 11:28

zengjyxxz的博客在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同的OS下，返回的东西不一样。 String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的...
有关String.getBytes()的具体解释
2020-04-01 20:54

du jie的博客在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不通OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte...
(透彻)java String.getBytes()编码问题
2012-03-21 19:04

yang3wei的博客 String的getBytes()方法是得到一个字串的字节数组，这是众所周知的。但特别要注意的是，本方法将返回该操作系统默认的编码格式的字节数组。如果你在使用这个方法时不考虑到这一点，你会发现在一个平台上运行良好的...
String.getBytes()
2018-06-26 07:52

lip86的博客在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组...
String.length()和String.getBytes().length的用法讲解
2019-04-08 10:35

南丘xf的博客新来的一同事（Java开发），需要完成这样一个功能：组装8位xml长度（不足8位补空格）+8位交易标识符+xml报文，通过socket发到特色服务器（该服务器是C语言），该服务器接收到该xml报文以后，根据传送过去的长度解析...
没有解决我的问题, 去提问

悬赏问题

¥15 关于#c##的问题：treenode反序列化后获取不到上一节点和下一节点，Fullpath和Handle报错
¥15 一部手机能否同时用不同的app进入不同的直播间？
¥15 没输出运行不了什么问题
¥20 输入import torch显示Intel MKL FATAL ERROR，系统驱动1%，: Cannot load mkl_intel_thread.dll.
¥15 点云密度大则包围盒小
¥15 nginx使用nfs进行服务器的数据共享
¥15 C#i编程中so-ir-192编码的字符集转码UTF8问题
¥15 51嵌入式入门按键小项目
¥30 海外项目，如何降低Google Map接口费用？
¥15 fluentmeshing

java String.getBytes统计超过1024byte的字节时出错

1条回答 默认 最新

悬赏问题

1条回答默认最新