如何指定hive的列分隔符?

默认hive的字段分隔符(field delimiter)可以通过row terminated或者重写InputFormat来改写，但是对于列分隔符这样做就不行，我是这么做的：
@Override
public boolean next(LongWritable key, Text value) throws IOException {
while (reader.next(key, text)) {

            String strReplace = text.toString().toLowerCase()
                    .replaceAll("\u0002", "\n");
            Text txtReplace = new Text();
            txtReplace.set(strReplace);
            value.set(txtReplace.getBytes(), 0, txtReplace.getLength());
            return true;
        }
        return false;
    }

重写inputformat放到hive的lib里不行，如果是这样改变字段分隔符是可以的，有没有办法指定列分隔符? 因为我文件里的数据都是通过'\u0002'来分割每行数据的，先谢谢各位大神了！

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
skyWalker_ONLY 2014-11-18 08:48
关注
我有一个不懂的地方问一下，字段分隔符和列分隔符有什么区别吗？

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

hive字段分隔符 \u0001 nosql sql
2020-12-07 17:17

回答 2 已采纳 ^A
Hive导入$$分隔符文件 hive 大数据数据仓库
2022-07-26 16:15

回答 1 已采纳不能用row format delimited fields terminated by，改用 ROW FORMAT SERDE 'org.apache.hadoop.hive.contrib.
如何优化hive动态分区写入速度？ hadoop hive 大数据
2022-05-21 17:53

回答 1 已采纳查询最后加上distribute by ORDERDATEsort by ORDERDATE distribute by按照指定的字段将数据划分到不同的输出reduce中，可以保证每个reduce处理
hive的列分隔符和行分隔符的使用
2020-10-25 22:33

大数据点滴的博客目录一、Hive中默认的分割符如下二、分隔符的指定与使用三、建好表之后更改字段分隔符 ...hive中在创建表时，一般会根据导入的数据格式来指定字段分隔符和列分隔符。一般导入的文本数据字段分隔...
Hbase 和 hive 有什么区别？hive 与 hbase 的底层存储是什么？hive 是产生的原因是什么？habase 是为了弥补 hadoop 的什么缺陷? hadoop hbase hive 有问必答
2021-11-06 11:30

回答 1 已采纳 大数据之hadoop / hive / hbase 的区别是什么？有什么应用场景？_RunFromHere的博客-CSDN博客文章目录1
关于#大数据#的问题，如何解决？ hive java 大数据
2023-02-21 09:58

回答 2 已采纳你去看一下这个job的日志报的什么错误
大数据hive分区表导入数据的问题 hive 大数据
2018-01-07 12:34

回答 5 已采纳 http://blog.csdn.net/fjssharpsword/article/details/64919412
【大数据Hive】hive 多字段分隔符使用详解
2024-03-03 13:12

逆风飞翔的小叔的博客 hive 多字段分隔符使用详解
hive指定规则排序的问题 hive sql
2022-04-27 09:06

回答 2 已采纳给题主一个思路，在子查询中新增一个字段，数语历英分别为1、2、3、4，学生科目按分数排序，同时如果成绩相同，按照新增字段的数字大小排序，这样就可以解决题主需求了。
关于mysql中的数据导入hive的一些问题 ? centos linux mysql sql 数据挖掘
2019-09-06 23:57

回答 1 已采纳 https://www.cnblogs.com/xuyou551/p/7998846.html
hive怎么拼接单引号 hive sql 大数据
2022-08-02 12:01

回答 7 已采纳不能用拼接，拼接之后用不了in，in是判断左边的字段是否在右边内容(集合)中，拼接的是一个字符串整体，不是集合。 SELECT sku_key,warehouse_key,SUM(quantity)
大数据Hive多字节分隔符
2021-09-19 17:04

赵广陆的博客目录1 应用场景1.1 Hive中的分隔符1.2 特殊数据2.2 需求3 解决方案一：替换分隔符3.1 方案概述3.2 程序开发3.3 重新建表加载数据3.4 查看结果3.5 总结4 解决方案二：RegexSerDe正则加载4.1 方案概述4.2 ...
hive数据表array类型列导入数据为空 hive 有问必答
2022-02-26 20:05

回答 3 已采纳你好，我是有问必答小助手，非常抱歉，本次您提出的有问必答问题，技术专家团超时未为您做出解答本次提问扣除的有问必答次数，将会以问答VIP体验卡（1次有问必答机会、商城购买实体图书享受95折优惠）的形式为
hive创建分区表指定分隔符_[Hive_3] Hive 建表指定分隔符
2020-12-21 12:46

weixin_39712705的博客 0. 说明Hive 建表示例及指定分隔符1. Hive 建表 Demo在 Hive 中输入以下命令创建表 user2create table users2 (id int, name string, age int) row format delimited fields terminated by '\t';插入数据insert into...
hive创建table时指定分隔符
2019-05-23 17:38

深海少女心的博客由于hive由java编写，所以row format delimited fields terminated by 后也可以使用java的方式输入特殊字符，比如用...比如hive创建表格的默认分隔符为SOH字符，ASCII码中的序号为1，所以可以用’\001’表示。数据...
没有解决我的问题, 去提问

悬赏问题

¥60 版本过低apk如何修改可以兼容新的安卓系统
¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
¥50 有数据，怎么建立模型求影响全要素生产率的因素
¥50 有数据，怎么用matlab求全要素生产率
¥15 TI的insta-spin例程
¥15 完成下列问题完成下列问题
¥15 C#算法问题, 不知道怎么处理这个数据的转换
¥15 YoloV5 第三方库的版本对照问题
¥15 请完成下列相关问题！
¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像，如何解决？

如何指定hive的列分隔符?

1条回答 默认 最新

悬赏问题

1条回答默认最新