c语言文件读取汉字及汉字编码的问题

先贴程序
#define _CRT_SECURE_NO_WARNINGS

#include

using namespace std;
int main(void)
{
char ch;
FILE *f;
int i = 0;
int count = 0;
f = fopen("test.txt", "r+");
while ((ch = getc(f)) != EOF)

{

fseek(f, i, SEEK_SET);

putc(~ch, f);

i++;
fseek(f, i, SEEK_SET);

count++;
}
fclose(f);
printf("文件操作已经完成\n");
printf("共处理%d个字节\n", count);
printf("按任意键结束程序\n");
getchar();
return 0;
}

该程序实现的就是对文件内的字符进行取反，就是简单的加密，再取反一次就变回原样了，也就是解密
在对汉字进行操作的时候，我进行了一些字的实验，目前仅发现了一个王字，在取反后取反回去不能变成王字，我加了查看字符格式的代码，发现王这个字在进行第一次字符操作时候，被分解为三个字节！！！然后再操作，就变成了四个！进行一次加一次，但是其他的汉字目前没发现错误，不知道是怎么回事，难道王字的编码就是三个字节吗？
求大家解答一下，我是新人没有一个c币。。。如果以后我得到了，就追加给你，谢谢啦

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
知常曰明 2015-04-23 03:22
关注
简单来说，是汉字编码的问题。在Windows里，我们生成的txt文件最有可能是是GBK编码的。它的特点是每个汉字2个字节。没有例外。但是也有可能是Unicode用UTF-8来编码的，对于用Utf-8来编码的话，每个汉字就用3个字节来表示。另外，对文本文件文本，有可能会带上编码前缀,那样的话直接读取会多读到几个字节（其实就是前缀）

以王字为例

如果是GBK（或者GB2312），表示为CD F5

如果以UTF-8，表示为E7 8E 8B

如果是以Unicode表示，不带前缀为8B 73，带前缀为FF FE 8B 73
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

C语言文件读取中文乱码问题解析与解决方案
2025-05-29 20:48

Admeee、的博客在使用C语言进行文件操作时，尤其是读取包含中文字符的文件时，经常会遇到乱码问题。这主要是由于字符编码不一致导致的。本文将深入解析C语言文件读取中文乱码的成因，详细探讨不同操作系统和编译器环境下的乱码问题...
C语言文件读写读汉字,读取汉字库中的汉字
2021-05-25 01:52

Yasuraoka Mugi的博客该楼层疑似违规已被系统折叠隐藏此楼查看此楼一般在屏幕上显示汉字的时候需要汉字系统的支持，但需要自己显示汉字的时候，就需要自己读汉字字库文件，把字符点阵读出来，再用绘图的办法显示到屏幕上，本文是读UCDOS...
【C语言】文本文件读取中文汉字出现乱码问题的解决方法
2022-12-16 00:34

Fitz&的博客文本文件对中文的读取输出出现乱码问题的解决方法
C语言中汉字读写操作的实现
2025-08-12 21:58

汉字的编码方式多样，其中一种常见编码是用两个字符位来表示一个汉字。在C语言编程中，可以通过字符数组来存储汉字字符串。使用scanf函数时，可以用%s格式符来读取整个字符串，同样地，用printf函数输出字符串时，也...
用C语言读取汉字库文件，找出汉字信息的示例！
2019-03-12 21:31

总的来说，用C语言读取汉字库文件是一项涉及文件I/O、二进制数据解析和内存管理的复杂任务。理解和处理.FON文件需要深入理解文件格式，同时遵循良好的编程实践以避免潜在的问题，如内存泄漏和错误处理。在实际项目中...
c语言识别文件中的汉字,读取汉字库中的汉字
2021-05-23 08:30

不喝酒的阿蓝的博客该楼层疑似违规已被系统折叠隐藏此楼查看此楼一般在屏幕上显示汉字的时候需要汉字系统的支持，但需要自己显示汉字的时候，就需要自己读汉字字库文件，把字符点阵读出来，再用绘图的办法显示到屏幕上，本文是读UCDOS...
C语言报错——读取TXT文件汉字乱码
2022-12-15 01:34

碳水小王子的博客 C语言读取文件报错
C语言读取txt文件中的汉字乱码解决问题
2022-03-28 12:34

蜡笔007的博客出现此问题的主要原因是txt默认的编码方式是UTF-8,而在Windows的cmd界面下的编码一般都是GBK 解决办法： 1.打开txt文件，选择文件，选择另存为,将编码改为ANSI(ANSI是本机默认编码，即Windows的cmd界面下的编码) ...
C语言汉字编码
2020-10-13 20:44

Valieo的博客 C语言汉字编码 一个汉字占用两个字节，单独读取一个字节的ASCII码为负数因而可以通过判断ASCII码的正负来确定是否为汉字，如果为汉字，则需要每次操作两个字节将汉字与英文字符分开 #include<stdio.h> #...
c语言如何读取一个中文字符,读取汉字库中的汉字
2021-05-17 05:21

林小枫的博客该楼层疑似违规已被系统折叠隐藏此楼查看此楼一般在屏幕上显示汉字的时候需要汉字系统的支持，但需要自己显示汉字的时候，就需要自己读汉字字库文件，把字符点阵读出来，再用绘图的办法显示到屏幕上，本文是读UCDOS...
没有解决我的问题, 去提问

c语言文件读取汉字及汉字编码的问题

3条回答 默认 最新

3条回答默认最新