2 xiaotoly xiaotoly 于 2017.09.05 20:48 提问

SQL SERVEY 2005表的字符数据最后一个字节乱码(汉字乱码),显示为问号:?(0x3F) 20C

问题:
系统:GBK字符集, 数据库:SQL SERVEY 2005
定义的表数据举例:
CREATE TABLE [dbo].EXAMPLE_TEST
(
EXAMPLE_PAR varchar (32) COLLATE Chinese_PRC_BIN NOT NULL,
其它字段
)
后台写入表数据超过32字节,程序会强制截取前32位字节送给EXAMPLE_PAR字段,如果前面有英文等单个字节则最后一个汉字将会截位,但是EXAMPLE_PAR显示的内容有时正确有时错误如下(出现错误概率万分之几甚至更小,有的服务器都没出现,数据量都是百万以上):
青海长云暗雪山-孤城遥望玉门关正?
青海长云暗雪山-孤城遥望玉门关信
青海长云暗雪山a孤城遥望玉门关正?
青海长云暗雪山a孤城遥望玉门关信

个人推断:刚开始以为前端传入的,后来发现有的表只有后台才写入也会出现这样的问题,就是拼接字符串写入数据库这一个步骤,程序没有其它错误,就是会出现上面截位汉字的情况,但是存入数据库结果又不一致,要有问题肯定都有,同样的情况有时写入数据库有问号有时没有,所以认为数据库默认编码处理有问题,但是又找不到原因。
  希望遇到过此类问题或知道原因的大神指点一二...

3个回答

caozhy
caozhy   Ds   Rxr 2017.09.06 09:29

用nvarchar,而且不要32,要大一些

xiaotoly
xiaotoly 回复caozhy: 恩 ,压力测试最后一个汉字被截位,自己的环境一直不出现,客户的出现概率也是很小几乎重现不了。
2 个月之前 回复
caozhy
caozhy 回复xiaotoly: 因为gb编码利用扩展ascii最高位1,并且不常用的特性,将0x7F以上的字符作为汉字编码。一旦遇到0x7F以上的符号,就会产生混乱,程序不知道应该将它和后面一个字节理解为一个汉字,还是两个英文字符。
2 个月之前 回复
xiaotoly
xiaotoly 不能改表结构,整体设计都是varchar,现在是要找出汉字截位后存储到数据库为什么乱码。
2 个月之前 回复
wjj_GHMING
wjj_GHMING   2017.09.06 23:11

nvarchar(max)试试

qq_40090700
qq_40090700   2017.09.06 10:57

是不是长度不够,你可以换成nvarchar(n),长度你可以试一下长一点看看

xiaotoly
xiaotoly 现在不是改表结构或长度的问题 ,是找数据截位后汉字高字节GBK(高位:0x81-0xFE)存到数据库为什么随机乱码,如果最后一个字节都是问号0x3F还好说,关键是有的截位有有的没有,现在找出现这种问题的原因。已经知道汉子低字节被截掉,压力测试上百万笔汉字截位还是不出现。
2 个月之前 回复
Csdn user default icon
上传中...
上传图片
插入图片