moon19961996 2019-07-31 22:55 采纳率: 66.7%
浏览 571
已采纳

关于多字节和unicode字符节的区别

在网上看到一段代码

void CdemoDlg::OnBnClickedButton1()
{
    // TODO: 在此添加控件通知处理程序代码

    CString strinput;

    GetDlgItemText(IDC_EDIT1, strinput);


    int nlen = strinput.GetLength();


    int ncount = 0;
    for (int i = 0; i < nlen; i++)
    {
        if ((BYTE)strinput[i] > 0x7f)
        {
            ++i;
        }
        ncount++;
    }


    CString stroutput;
    stroutput.Format(_T("字符串长度:%d,字符个数:%d"),nlen, ncount);

    SetDlgItemText(IDC_STATIC_OUTPUT,stroutput);

}

其中for循环是为了在使用多字节的时候,正确识别两个汉字算一个字符,在多字节中,一个汉字算两个字符,for循环是判断两个字符中是否有大于127?请详细讲解一下,为什么这么判断

  • 写回答

4条回答 默认 最新

  • threenewbee 2019-08-01 19:06
    关注
    unicode和双字节最大的区别在于,双字节的情况下,相同的编码,代表2个英文还是一个汉字,或者一个日文,或者一个台湾中文,或者什么,这个是无法确定的。
    而unicode是唯一的编码。
    如果你去看ascii码表,你会发现,0~127是基本区,128~255是扩展区,扩展区包含了很多特殊符号和屏幕显示用的框线、色块等。不知道你是否用过turbo c 2.0这种软件,它界面上的菜单的那些框线,就是用扩展区的字符表示的。
    一般情况下,为了让中文和英文混合显示,我们的做法是,中文汉字的区码用>127的字符开头,这样<127是英文,>127是中文,相安无事。
    但是遇到西文软件,就乱套了。你尝试在windows的窗口里面打开turbo c,并且启用中文支持,就会发现好好的界面上出现了很多乱码,就是这个原因。
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(3条)

报告相同问题?

悬赏问题

  • ¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
  • ¥20 有关区间dp的问题求解
  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置
  • ¥15 有没有研究水声通信方面的帮我改俩matlab代码
  • ¥15 对于相关问题的求解与代码
  • ¥15 ubuntu子系统密码忘记
  • ¥15 信号傅里叶变换在matlab上遇到的小问题请求帮助
  • ¥15 保护模式-系统加载-段寄存器
  • ¥15 电脑桌面设定一个区域禁止鼠标操作