yang_2222 2015-05-15 08:25 采纳率: 50%
浏览 1628

mapreduce输出文件如何使用欧元符号€ ascii码(0x80) 作为字段分割符号

已重写了TextOutputFormat设置输出文件格式编码为GBK。

直接使用€符号作为分割符的话,在linux中使用od -c命令查看文件€符号会显示成252,而需求是要求为200。

之前没接触过字符编码这块。所以很疑惑。如果在sqlload导出数据使直接用0x80
作为分割符号,倒是能达到需要的效果。不知道各位大神有没有明白需求?

这是输出文件在windows中的显示效果
1€LX_100001€打电话€基本业务功能

在liunux中需要实现使用od -c file命令查看文件会让€符号显示成 200
hadoop@xxxxxx:~$ head test1.dat |od -c
0000000 1 200 L X _ 1 0 0 0 0 1 200 264 362 265 347
0000020 273 260 200 273 371 261 276 322 265 316 361 271 246 304 334 \r
0000040 \n

  • 写回答

0条回答 默认 最新

    报告相同问题?

    悬赏问题

    • ¥15 执行 virtuoso 命令后,界面没有,cadence 启动不起来
    • ¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
    • ¥20 有关区间dp的问题求解
    • ¥15 多电路系统共用电源的串扰问题
    • ¥15 slam rangenet++配置
    • ¥15 有没有研究水声通信方面的帮我改俩matlab代码
    • ¥15 ubuntu子系统密码忘记
    • ¥15 保护模式-系统加载-段寄存器
    • ¥15 电脑桌面设定一个区域禁止鼠标操作
    • ¥15 求NPF226060磁芯的详细资料