c语言文件读取汉字及汉字编码的问题

先贴程序
#define _CRT_SECURE_NO_WARNINGS

#include

using namespace std;
int main(void)
{
char ch;
FILE *f;
int i = 0;
int count = 0;
f = fopen("test.txt", "r+");
while ((ch = getc(f)) != EOF)

{

fseek(f, i, SEEK_SET);

putc(~ch, f);

i++;
fseek(f, i, SEEK_SET);

count++;
}
fclose(f);
printf("文件操作已经完成\n");
printf("共处理%d个字节\n", count);
printf("按任意键结束程序\n");
getchar();
return 0;
}

该程序实现的就是对文件内的字符进行取反，就是简单的加密，再取反一次就变回原样了，也就是解密
在对汉字进行操作的时候，我进行了一些字的实验，目前仅发现了一个王字，在取反后取反回去不能变成王字，我加了查看字符格式的代码，发现王这个字在进行第一次字符操作时候，被分解为三个字节！！！然后再操作，就变成了四个！进行一次加一次，但是其他的汉字目前没发现错误，不知道是怎么回事，难道王字的编码就是三个字节吗？
求大家解答一下，我是新人没有一个c币。。。如果以后我得到了，就追加给你，谢谢啦

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
知常曰明 2015-04-23 03:22
关注
简单来说，是汉字编码的问题。在Windows里，我们生成的txt文件最有可能是是GBK编码的。它的特点是每个汉字2个字节。没有例外。但是也有可能是Unicode用UTF-8来编码的，对于用Utf-8来编码的话，每个汉字就用3个字节来表示。另外，对文本文件文本，有可能会带上编码前缀,那样的话直接读取会多读到几个字节（其实就是前缀）

以王字为例

如果是GBK（或者GB2312），表示为CD F5

如果以UTF-8，表示为E7 8E 8B

如果是以Unicode表示，不带前缀为8B 73，带前缀为FF FE 8B 73
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

c语言文件读取汉字及汉字编码的问题
2015-04-23 02:54

回答 3 已采纳 * 简单来说，是汉字编码的问题。在Windows里，我们生成的txt文件最有可能是是GBK编码的。它的特点是每个汉字2个字节。没有例外。但是也有可能是Unicode用UTF-8来编码的，对于用Utf-
C语言文件读取问题如何解决 c语言
2022-05-18 16:52

回答 3 已采纳如果用标准函数，那就用fopen函数打开文件路径，获得FILE *类型的文件流。还可以调用系统函数，例如linux就是调用open函数打开文件路径，获得文件描述符。然后操作文件流或者文件描述符获得文件
C语言读取TXT文件并统计各个汉字出现的次数？ c语言
2020-12-17 18:58

回答 2 已采纳 getc(fp)是一个字节一个字节的读取而一个汉字是由两个字节组合成的（根据不同的编码也可能是3或4个字节组合一个汉字）。你连续用putchar(c)一个字节一个字节的输出，到显示时就会把相邻的两
【C语言】文本文件读取中文汉字出现乱码问题的解决方法
2022-12-16 00:34

Fitz&的博客文本文件对中文的读取输出出现乱码问题的解决方法
c语言 文件读取与数据排序 c语言
2022-07-04 13:45

回答 1 已采纳下面是我理解的一个思路，供参考：1、先定义一个学生结构，含有三个结构成员：学号，英语分数，数学分数，语文分数，总分。2、然后用fscanf函数从score.txt读取100个学生的学号，分数信息到学生
C语言关于文件中汉字的读取与写入 c++ c语言
2023-02-01 21:13

回答 3 已采纳以打开文件然后另存为，再把文件编码改成ANSL，就不会出现乱码了。
如何用C语言将汉字转为utf8编码 c语言 linux ubuntu
2020-12-07 12:00

回答 5 已采纳不同平台下不一样，比较复杂。不过有一个较为通用的东西叫做ICU库，多数平台支持这个东西。
C语言文件读写读汉字,读取汉字库中的汉字
2021-05-25 01:52

Yasuraoka Mugi的博客该楼层疑似违规已被系统折叠隐藏此楼查看此楼一般在屏幕上显示汉字的时候需要汉字系统的支持，但需要自己显示汉字的时候，就需要自己读汉字字库文件，把字符点阵读出来，再用绘图的办法显示到屏幕上，本文是读UCDOS...
C语言文件操作读取有关问题 c语言
2022-12-23 20:08

回答 3 已采纳 #include <stdio.h> int main() { FILE* pf; char name[32]; scanf("输入文件路径： %s \n", &name[0]
vs2022 c语言 Unicode 读写文件的问题 c语言
2023-02-27 16:13

回答 1 已采纳因为在 Windows 平台下，unicode 使用的是 utf16 编码，一个字符占用两个字节。你要用 unicode 编码读取文件内容的话，那么你应该使用 wchar_t 类型的缓冲区来存储读取到
C语言读取txt文件中的汉字乱码解决问题
2022-03-28 12:34

蜡笔007的博客出现此问题的主要原因是txt默认的编码方式是UTF-8,而在Windows的cmd界面下的编码一般都是GBK 解决办法： 1.打开txt文件，选择文件，选择另存为,将编码改为ANSI(ANSI是本机默认编码，即Windows的cmd界面下的编码) ...
C语言报错——读取TXT文件汉字乱码
2022-12-15 01:34

碳水小王子的博客 C语言读取文件报错
c语言识别文件中的汉字,读取汉字库中的汉字
2021-05-23 08:30

不喝酒的阿蓝的博客该楼层疑似违规已被系统折叠隐藏此楼查看此楼一般在屏幕上显示汉字的时候需要汉字系统的支持，但需要自己显示汉字的时候，就需要自己读汉字字库文件，把字符点阵读出来，再用绘图的办法显示到屏幕上，本文是读UCDOS...
c语言如何读取一个中文字符,读取汉字库中的汉字
2021-05-17 05:21

林小枫的博客该楼层疑似违规已被系统折叠隐藏此楼查看此楼一般在屏幕上显示汉字的时候需要汉字系统的支持，但需要自己显示汉字的时候，就需要自己读汉字字库文件，把字符点阵读出来，再用绘图的办法显示到屏幕上，本文是读UCDOS...
没有解决我的问题, 去提问

悬赏问题

¥15 我想咨询一下路面纹理三维点云数据处理的一些问题，上传的坐标文件里是怎么对无序点进行编号的，以及xy坐标在处理的时候是进行整体模型分片处理的吗
¥15 CSAPPattacklab
¥15 一直显示正在等待HID—ISP
¥15 Python turtle 画图
¥15 关于大棚监测的pcb板设计
¥15 stm32开发clion时遇到的编译问题
¥15 lna设计源简并电感型共源放大器
¥15 如何用Labview在myRIO上做LCD显示？(语言-开发语言)
¥15 Vue3地图和异步函数使用
¥15 C++ yoloV5改写遇到的问题

c语言文件读取汉字及汉字编码的问题

3条回答 默认 最新

悬赏问题

3条回答默认最新