现在有文本,按字节定长文件,gbk或者UTF8或者unicode编码都有可能包含敏感信息需要变形,变形规则如下,如果是中文和数字及字母,按已经定义好的对照表替换,如果是外文,则奇数位不变,偶数位统一换成字母A。本想按字节截取字段后转为string,然后逐个字符判断ascii码是否落在中文和英文字母及数字的区间判断。但又想既然都已经read 到byte了,转为字符又转ascii 似乎太绕了,但不同字符占的字节不同,直接根据byte怎么判断当前的byte 是属于中文还是外文呢还是英文和数字呢
2条回答 默认 最新
悬赏问题
- ¥40 复杂的限制性的商函数处理
- ¥15 程序不包含适用于入口点的静态Main方法
- ¥15 素材场景中光线烘焙后灯光失效
- ¥15 请教一下各位,为什么我这个没有实现模拟点击
- ¥15 执行 virtuoso 命令后,界面没有,cadence 启动不起来
- ¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
- ¥20 有关区间dp的问题求解
- ¥15 多电路系统共用电源的串扰问题
- ¥15 slam rangenet++配置
- ¥15 有没有研究水声通信方面的帮我改俩matlab代码