moon19961996 2019-07-31 22:55 采纳率: 66.7%
浏览 570
已采纳

关于多字节和unicode字符节的区别

在网上看到一段代码

void CdemoDlg::OnBnClickedButton1()
{
    // TODO: 在此添加控件通知处理程序代码

    CString strinput;

    GetDlgItemText(IDC_EDIT1, strinput);


    int nlen = strinput.GetLength();


    int ncount = 0;
    for (int i = 0; i < nlen; i++)
    {
        if ((BYTE)strinput[i] > 0x7f)
        {
            ++i;
        }
        ncount++;
    }


    CString stroutput;
    stroutput.Format(_T("字符串长度:%d,字符个数:%d"),nlen, ncount);

    SetDlgItemText(IDC_STATIC_OUTPUT,stroutput);

}

其中for循环是为了在使用多字节的时候,正确识别两个汉字算一个字符,在多字节中,一个汉字算两个字符,for循环是判断两个字符中是否有大于127?请详细讲解一下,为什么这么判断

  • 写回答

4条回答

  • threenewbee 2019-08-01 19:06
    关注
    unicode和双字节最大的区别在于,双字节的情况下,相同的编码,代表2个英文还是一个汉字,或者一个日文,或者一个台湾中文,或者什么,这个是无法确定的。
    而unicode是唯一的编码。
    如果你去看ascii码表,你会发现,0~127是基本区,128~255是扩展区,扩展区包含了很多特殊符号和屏幕显示用的框线、色块等。不知道你是否用过turbo c 2.0这种软件,它界面上的菜单的那些框线,就是用扩展区的字符表示的。
    一般情况下,为了让中文和英文混合显示,我们的做法是,中文汉字的区码用>127的字符开头,这样<127是英文,>127是中文,相安无事。
    但是遇到西文软件,就乱套了。你尝试在windows的窗口里面打开turbo c,并且启用中文支持,就会发现好好的界面上出现了很多乱码,就是这个原因。
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(3条)

报告相同问题?

悬赏问题

  • ¥15 Arcgis相交分析无法绘制一个或多个图形
  • ¥15 seatunnel-web使用SQL组件时候后台报错,无法找到表格
  • ¥15 fpga自动售货机数码管(相关搜索:数字时钟)
  • ¥15 用前端向数据库插入数据,通过debug发现数据能走到后端,但是放行之后就会提示错误
  • ¥30 3天&7天&&15天&销量如何统计同一行
  • ¥30 帮我写一段可以读取LD2450数据并计算距离的Arduino代码
  • ¥15 飞机曲面部件如机翼,壁板等具体的孔位模型
  • ¥15 vs2019中数据导出问题
  • ¥20 云服务Linux系统TCP-MSS值修改?
  • ¥20 关于#单片机#的问题:项目:使用模拟iic与ov2640通讯环境:F407问题:读取的ID号总是0xff,自己调了调发现在读从机数据时,SDA线上并未有信号变化(语言-c语言)