Doris 建表 partition key分区设置

官网文档说如果Partition列有多个。分区列值会按照顺序依次比较，最终得到对应的分区。
partition列：date(DATE 类型) 和 id(INT 类型)

p201701_1000:    [(MIN_VALUE,  MIN_VALUE), ("2017-02-01", "1000")   )
p201702_2000:    [("2017-02-01", "1000"),  ("2017-03-01", "2000")   )
p201703_all:     [("2017-03-01", "2000"),  ("2017-04-01", MIN_VALUE))

2017-01-01, 200     --> p201701_1000
2017-01-01, 2000    --> p201701_1000   
2017-02-01, 100     --> p201701_1000
2017-02-01, 2000    --> p201702_2000
2017-02-15, 5000    --> p201702_2000
2017-03-01, 2000    --> p201703_all
2017-03-10, 1       --> p201703_all
2017-04-01, 1000    --> 无法导入
2017-05-01, 1000    --> 无法导入

上面说（2017-01-01, 2000）是在p201701_1000分区上。
那按照语句p201701_1000不是应该是date<=2017-0-01 and id<=1000吗？
2000比1000大，那这个分区列加上id(INT 类型) 就没意义啊，只用到date(DATE 类型)。加上id列，对数据的划分更迷惑了。
如果两个条件不是and，那(2017-05-01, 1000）无法导入说明也不是 or 。
搞不懂。

2023-03-28更新
我的问题是为什么不干脆只按照date列分区？上面例子我想到唯一实际有用就是过滤了id为空的数据。
(官网有说NULL 值放在最小值的分区中，是不是只看首列？)
例子中的多列分区的目的是什么？有实际场景应用吗？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
xia0xin 2023-03-28 00:05
关注
根据您提供的信息，可以理解为分区列的作用是对数据进行划分和排序。对于多个分区列的情况，按照分区列的顺序依次比较，最终得到对应的分区。

在您提供的例子中，如果一个数据行的date列小于或等于"2017-02-01"，而且id列小于或等于"1000"，那么该数据行将被划分到p201701_1000分区中。如果date列小于或等于"2017-03-01"，而且id列小于或等于"2000"，那么该数据行将被划分到p201702_2000分区中。如果一个数据行的date列小于或等于"2017-04-01"，但是id列大于"2000"，那么该数据行将被划分到p201703_all分区中。

因此，您提供的例子中，对于(2017-01-01, 2000)，确实是被划分到了p201701_1000分区中。而对于(2017-05-01, 1000)，由于无法满足任何一个分区的条件，因此无法导入。

总之，分区列的作用是对数据进行划分和排序，多个分区列的情况下，按照分区列的顺序依次比较，最终得到对应的分区。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

大数据，spark ，doris mysql spark 大数据
2023-01-17 22:05

回答 2 已采纳这是一个连接Doris服务器失败的错误，具体原因可能是Doris服务器无法连接或网络故障导致的。
Doris新增字段再插入问题 java 数据库
2022-11-08 10:17

回答 3 已采纳官方有说明，改表是异步操作，会立即返回，你不能马上就插入的
请教：通过httpclient方式向doris导入数据出错“no valid Basic authorization”是怎么回事？大数据有问必答
2021-08-10 17:35

回答 4 已采纳老哥，我这边已经解决啦，重定向的时候默认是把密码丢了，你得检测重定向把账户密码放进去
Apache Doris的动态分区dynamic_partition
2022-01-10 15:20

Bulut0907的博客所以Apache Doris启动了一个后台进程，默认每隔1小时(由fe.conf的dynamic_partition_check_interval_seconds参数设置)根据当前的日期时间来添加分区和删除分区 2. 创建动态分区表表创建于2021-11-05 22:30:00，星期...
doris-0.14.7部署集群BE一直启动失败百度云
2021-06-08 18:14

回答 1 已采纳已经解决了，是端口冲突，webserver_port 换一个就可以了。啊啊啊啊菜鸟看不懂日志信息啊啊，不知道是这个端口冲突。
FlinkSQL平台化，前端化管理 flink java 大数据
2023-02-01 10:55

回答 4 已采纳题主的思路完全正确可行，因为我就是这么做的。也是一开始觉得不是很正规，但确实能解决实际的业务问题，要相信自己。梳理一下BaseJar：丢到linux服务器上，用来解析Flink SQL语句MySQ
hive用select*from查看不到表数据 centos hadoop hive
2022-03-17 20:47

回答 1 已采纳参考一下这篇文章 hive表删除分区后，重新插入，查询不到数据问题_雾岛与鲸的博客-CSDN博客_hive 重新分区 1、选择一张分区表（本
doris建表语法笔记，v1.2.2，from官方文档
2023-03-27 14:34

用户洋仔的博客【代码】doris建表语法笔记，v1.2.2，from官方文档。
flink消费kafka数据延迟 flink postgresql scala 有问必答
2022-01-28 09:47

回答 1 已采纳那最后写入到库了吗，如果写不进去，上游kafka肯定会延迟越来越大的，可以在sink里多打印下错误，或者设置写入超时时间，问题应该在写入
hive数据表array类型列导入数据为空 hive 有问必答
2022-02-26 20:05

回答 3 已采纳你好，我是有问必答小助手，非常抱歉，本次您提出的有问必答问题，技术专家团超时未为您做出解答本次提问扣除的有问必答次数，将会以问答VIP体验卡（1次有问必答机会、商城购买实体图书享受95折优惠）的形式为
DB Navigator - Script execution error idea intellij-idea mysql
2022-08-10 20:35

回答 1 已采纳显然这个操作是调用本地MySQL客户端执行命令，然而你本地并没有装MySQL的客户端所以报错了。换数据库连接工具试试，navicat或者dbeaver
Doris系列之建表操作
2022-08-12 17:12

陈万君Allen的博客 Doris系列之建表操作
出现1064, 怎么解决，什么原因？ mysql python
2021-07-31 14:28

回答 1 已采纳是sql读法错误，执行语句中是drop table 而不是dorp table,改一下即可
Doris 建表
2021-07-09 14:49

蔡大远的博客 Doris建表这是AGGREGATE 模型的建表案列。如果是其他模型，只要改AGGREGATE KEY这一行，改掉REPLACE ，MAX，MIN，SUM，HLL_UNION)等。注意：在Doris中，unique约束与Mysql，Oracle,Hive等数据库不同，不是写在字段...
Doris建表注意事项，实时数仓的同学记得收藏
2022-08-08 17:45

王知无(import_bigdata)的博客全网最全大数据面试提升手册！基本概念Row & Column一张表包括行（Row）和列（Column）。Row 即用户的一行数据。Column 用于描述一行数据中不同的字段。Column 可以分为两大类：Key 和 Value。从业务角度看，Key...
Apache Doris数据分区Partition、数据分桶(distributed by)
2021-12-13 14:27

Bulut0907的博客目录1. 数据分区和分桶的关系2. 数据分区2.1 range分区 1. 数据分区和分桶的关系先分区，再分桶。一个表不指定分区，默认...不论什么字段数据类型，建表时写分区值，都必须加引号 2.1 range分区 mysql> mysql
【大数据 - Doris 实践】数据表的基本使用（一）：基本概念、创建表
2023-10-16 23:46

G皮T的博客在 Doris 的存储引擎中，用户数据首先被划分成若干个分区（Partition），划分的规则通常是按照用户指定的分区列进行范围划分，比如按时间划分。而在每个分区内，数据被进一步的按照 Hash 的方式分桶，分桶的规则是要...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 3月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 3月27日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月27日

悬赏问题

¥15 c语言怎么用printf（“\b \b”）与getch（）实现黑框里写入与删除？
¥20 怎么用dlib库的算法识别小麦病虫害
¥15 华为ensp模拟器中S5700交换机在配置过程中老是反复重启
¥15 java写代码遇到问题，求帮助
¥15 uniapp uview http 如何实现统一的请求异常信息提示？
¥15 有了解d3和topogram.js库的吗？有偿请教
¥100 任意维数的K均值聚类
¥15 stamps做sbas-insar，时序沉降图怎么画
¥15 买了个传感器，根据商家发的代码和步骤使用但是代码报错了不会改，有没有人可以看看
¥15 关于#Java#的问题，如何解决？

Doris 建表 partition key分区设置

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新