C#i编程中so-ir-192编码的字符集转码UTF8问题

我用C#编程，Ddataset.Get(DicomTag.InstitutionName, "0");是iso-ir-192编码的字符集，而变量patientInfo.InstitutionName需要是UTF8存入mysql数据库，以下代码能将双数汉字的字符串正确转换出来，但是奇数汉字转换出来后，最后一个字符是乱码。比如：张三，能正确显示，但张三丰则显示为"张三？"，如何破？

string InstitutionNameIsoIr192 = Ddataset.Get<string>(DicomTag.InstitutionName, "0").Replace("\0", "");
byte[] isoIr192Bytes1 = Encoding.GetEncoding("GB2312").GetBytes(InstitutionNameIsoIr192);
string InstitutionNameUtf8 = Encoding.UTF8.GetString(isoIr192Bytes1);
patientInfo.InstitutionName = InstitutionNameUtf8.Replace("\0", "");

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

26条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
*拯 2024-11-20 20:15
关注
引用文心一言大模型

问题出在你对编码转换的处理上。ISO-IR-192（通常等同于GB2312）和UTF-8之间的转换需要正确处理字符的边界和可能的填充字符。在你的代码中，存在一些问题，尤其是当你试图将GB2312编码的字符串直接转换为UTF-8时，没有考虑到字符串可能因为不正确的字符边界或编码而损坏。

以下是一些步骤和建议，帮助你正确地从ISO-IR-192（GB2312）转换到UTF-8：

确保GB2312字符串正确：

你的原始字符串InstitutionNameIsoIr192是从DICOM数据中获取的，并且已经去除了\0字符。这是正确的第一步。

使用正确的编码转换：

当你从GB2312转换到UTF-8时，应该直接从字节数组转换，而不是先将GB2312编码的字符串转换为字节数组。这是因为字符串在.NET中是以UTF-16编码的，这可能导致在转换过程中数据丢失或损坏。

处理可能的字符截断：

当你从DICOM数据读取字符串时，需要确保读取的长度是正确的。如果字符串被截断（例如，在双字节字符的中间被截断），那么转换后的字符串可能会显示乱码。

下面是一个改进后的代码示例：

// 假设 Ddataset.Get<byte[]>(DicomTag.InstitutionName, "0") 返回的是GB2312编码的字节数组 byte[] isoIr192Bytes = Ddataset.Get<byte[]>(DicomTag.InstitutionName, "0"); // 使用正确的编码从字节数组直接转换为UTF-8字符串 string institutionNameUtf8 = Encoding.UTF8.GetString(Encoding.GetEncoding("GB2312").GetBytes(isoIr192Bytes)); // 清理可能的空字符或其他非打印字符 institutionNameUtf8 = institutionNameUtf8.Replace("\0", "").Trim(); // 赋值给 patientInfo.InstitutionName patientInfo.InstitutionName = institutionNameUtf8;

注意：

在这个例子中，我假设Ddataset.Get<byte[]>(DicomTag.InstitutionName, "0")可以直接返回GB2312编码的字节数组。如果DICOM库不支持直接返回字节数组，你可能需要先将字符串转换为字节数组，但要确保在转换前字符串没有因为错误的编码解释而损坏。
使用Trim()可以去除字符串开头和结尾的任何空白字符，包括可能的\0字符（尽管你已经用Replace("\0", "")处理过了）。

如果上述方法仍然不能解决问题，建议检查DICOM数据的来源和完整性，确保在数据读取和转换过程中没有发生数据损坏。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(25条)

报告相同问题？

关注问题

Xapian构建索引说明
2017-09-15 17:51

weixin_34218890的博客 Xapian的官方网站是http://www.xapian.org，这是一个非常优秀的开源搜索引擎项目，搜索引擎其实只是一个通俗的说法，正式的说法其实是IR（Information Retrieval）系统。Xapian的License是GPL，这意...
数据乱码（之.net加密）
2012-07-20 09:10

cqrw65623的博客程序加密，输入数据库的时候一定要指定服务器数据库的字符集相同，不让转码会出现问题。本人仅仅记录了解决问题的方法与思路。如有错误请您指正，因为我不是开发所以研究的不够深入见谅！ ...
利用Xapian构建自己的搜索引擎
2013-11-11 11:58

weixin_34183910的博客一、简介Xapian与开源 Xapian的官方网站是，这是一个非常优秀的开源搜刮引擎项目，搜刮引擎着实只是一个普通的说法，正式的说法着实是IR（Information Retrieval）体系。Xapian的License是GPL，这意味着允许应用者...
Linux 声音编程教程（九）
2024-08-02 20:28

绝不原创的飞龙的博客 TiMidity 的命令行参数必须作为硬编码参数包含在应用中。一个简单的方法是:CtlMode有一个字段trace_playing，将它设置为 1 可以打开跟踪。将文本事件作为歌词事件需要更深入地挖掘 TiMidity，但只需要(在初始化库后...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 11月21日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 11月21日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月19日

C#i编程中so-ir-192编码的字符集转码UTF8问题

26条回答 默认 最新

问题事件

26条回答默认最新