Moefish 2015-06-05 06:56 采纳率: 100%
浏览 2362
已采纳

关于C语言中的字符串输入输出

出于好奇测试了一下,声明的时候:
char ch[5];
scanf("%s",ch);
printf("%s,%d",ch,sizeof ch);

如果输入超过5个字母,字母都还是会全部显示出来的,而ch的大小还是5BYTE。这printf到底是什么黑科技?顺便问一下%s是怎么支持Unicode的?好像汉字啦,Ctrl+字符这一类奇奇怪怪的好像也都可以输出诶,怎么做到的?
好像getchar()也能正常识别汉字并储存的样子……

  • 写回答

3条回答 默认 最新

  • 知常曰明 2015-06-05 07:13
    关注

    1.关于超过5个字节的问题。你的这样做法,数组实际已经跨过界了。问题是会表现出来的。例如,你在这个ch[5]后面另外定义一个int,先给这个int赋好值,你会发现scanf之后那个int的值变了.如果后面是没有数据的话,有可能会引起段错误..
    2.有C/C++有tchar.h,可以完全支持unicode.根据你的控制台/终端的编码方式,ASCII0-31的控制字符,ASCII128-255的字符,也可能有对应的可显示字符的。甚至在一定情况下也可以把GBK的两半拼起来显示为一个汉字。但是如果存在编码转换,例如输入的时候是UTF-8,输出GBK就一定要处理过才行。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
  • Tiger_Zhao 2015-06-05 07:15
    关注

    这不是黑科技,而是ch之后的不属于ch的内存也被非法使用了。
    你可以用下面的代码测试一下长度超过5的情况。

        char ch0[100];
        char ch[5];
        char ch2[100];
        scanf("%s",ch);
        printf("%s",ch0);
        printf("%s",ch);
        printf("%s",ch2);
    
    评论
  • Eleven 2015-06-05 07:20
    关注

    这种数组溢出的问题会导致后面的数据被覆盖,有时候会出错,有时候又不会出错,看当时的运行时环境。

    评论
查看更多回答(2条)

报告相同问题?

悬赏问题

  • ¥15 PCL注册的选点等函数如何取消注册
  • ¥15 问一下各位,为什么我用蓝牙直接发送模拟输入的数据,接收端显示乱码呢,米思齐软件上usb串口显示正常的字符串呢?
  • ¥15 Python爬虫程序
  • ¥15 crypto 这种的应该怎么找flag?
  • ¥15 设计一个时序电路,使其状态按2421(B)循环,并能自启动
  • ¥15 代码已写好,求帮我指出错误,有偿!
  • ¥15 matlab+波形匹配算法
  • ¥15 转录组分析做聚类树图时癌旁组被分到了癌组
  • ¥15 大一Python字典
  • ¥15 multisim电路设计(相关搜索:设计报告)