IceStormSpirit 2014-09-18 09:38 采纳率: 0%
浏览 6065

如何指定hive的列分隔符?

默认hive的字段分隔符(field delimiter)可以通过row terminated或者重写InputFormat来改写,但是对于列分隔符这样做就不行,我是这么做的:
@Override
public boolean next(LongWritable key, Text value) throws IOException {
while (reader.next(key, text)) {

            String strReplace = text.toString().toLowerCase()
                    .replaceAll("\u0002", "\n");
            Text txtReplace = new Text();
            txtReplace.set(strReplace);
            value.set(txtReplace.getBytes(), 0, txtReplace.getLength());
            return true;
        }
        return false;
    }

重写inputformat放到hive的lib里不行,如果是这样改变字段分隔符是可以的,有没有办法指定列分隔符? 因为我文件里的数据都是通过'\u0002'来分割每行数据的,先谢谢各位大神了!

  • 写回答

1条回答 默认 最新

  • skyWalker_ONLY 2014-11-18 08:48
    关注

    我有一个不懂的地方问一下,字段分隔符和列分隔符有什么区别吗?

    评论

报告相同问题?

悬赏问题

  • ¥15 oracle集群安装出bug
  • ¥15 关于#python#的问题:自动化测试
  • ¥20 问题请教!vue项目关于Nginx配置nonce安全策略的问题
  • ¥15 教务系统账号被盗号如何追溯设备
  • ¥20 delta降尺度方法,未来数据怎么降尺度
  • ¥15 c# 使用NPOI快速将datatable数据导入excel中指定sheet,要求快速高效
  • ¥15 再不同版本的系统上,TCP传输速度不一致
  • ¥15 高德地图2.0 版本点聚合中Marker的位置无法实时更新,如何解决呢?
  • ¥15 DIFY API Endpoint 问题。
  • ¥20 sub地址DHCP问题