如何使用presto对hive分区表进行insert和delete

由于公司需要构建实时数仓，所以需要对经由debezium采集的mysql和oracle数据库的数据变更记录写入到hive数仓中，并及时反馈给业务系统使用，hive的查询使用的是presto，实时数据处理任务采用flink，环境配置具体如下：
hadoop 2 10 0
hive 2 3 6
flink 1 13 1
presto 0 260
现有一张hive分区表，单个分区的数据量为10万，由于presto不支持update操作，所以如果要进行update操作，需要用presto查询出该分区的原数据，写入临时表，然后删除并重建该分区，将修改后的数据和原数据拼装后，重新写入新分区，在这过程中发现使用presto执行insert select单次插入数据1000条就需要12秒多，不能满足实时数据查询的需要

请问如何实现对hive分区表的实时更新呢？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
有问必答小助手 2021-09-14 10:01
关注
你好，我是有问必答小助手，非常抱歉，本次您提出的有问必答问题，技术专家团超时未为您做出解答

本次提问扣除的有问必答次数，将会以问答VIP体验卡（1次有问必答机会、商城购买实体图书享受95折优惠）的形式为您补发到账户。

因为有问必答VIP体验卡有效期仅有1天，您在需要使用的时候【私信】联系我，我会为您补发。

解决
无用 1
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

大数据框架中的hadoop和hive spark presto tez是什么关系 hadoop hive spark
2022-12-24 10:29

回答 1 已采纳 Hadoop是一个分布式计算框架，可以在大数据集上运行分布式应用程序。它由许多组件组成，包括HDFS（分布式文件系统）和MapReduce（分布式计算引擎）。Hive是一个基于Hadoop的数据仓库系
急】hive，insert从parquet表插入到textfile(cvs)表时，字段内容为NULL hadoop hive java
2018-05-31 01:35

回答 2 已采纳先确认下 A表和B表的定义。 show create table A; show create table B; 看下两个表的定义是否完全一致，另外看下 insert 语句是否按照表的各个字段
在datagrip中连接presto查询表格怎么，发生错误 hive 大数据
2023-01-13 22:12

回答 1 已采纳望采纳！！！点击回答右侧采纳即可！！！在连接Presto数据库时，如果遇到错误，可能是因为以下原因：连接信息错误，例如IP地址、端口号、用户名、密码等配置错误。 Presto服务器没有开启，或者服
Presto/Trino的Hive Connector的使用(内部表、外部表、分区表)
2022-03-16 22:30

Bulut0907的博客 Hive连接器不使用Hive的运行环境，而是使用Hive Metastore服务获取元数据，再使用HDFS客户端直接从HDFS上读写数据。所以不能将SQL查询下推到Hive 配置hive.properties connector.name=hive-hadoop2 hive.metastore....
presto解析json错误，如何解决？ json sql
2022-04-26 10:28

回答 2 已采纳 select json_extract_scalar(name1,'$["zh-CN"]') as name_cn from tab1; json串可以这样进行查询
substring方法无效了 java 有问必答
2021-09-21 22:36

回答 2 已采纳 substring语句有问题吧，v的内容为空才会运行到这里呢？ values = values.substring(0,values.length()-1);
证件号脱敏，长度不固定需要将后四位的前三位进行隐藏 html5 javascript 前端
2022-01-21 17:20

回答 2 已采纳可以的，如果你的证件只有数字的话，正则表达可以这样写 var str="123456789874061216" var newStr=str.replace(/(\d*)\d{3}(\d{1})/,
Presto【实践 01】Presto查询性能优化（数据存储+SQL优化+无缝替换Hive表+注意事项）及9个实践问题分享
2022-06-19 09:09

シ風箏的博客 Presto【实践 01】Presto查询性能优化（数据存储+SQL优化+无缝替换Hive表+注意事项）及9个实践问题分享
当cURL正常工作时，从Go代码中使用API时出现401错误 http
2018-11-18 14:58

回答 2 已采纳 Need check api hostname at golang and curl again. Thanks! The error is because, the documentation
用python爬虫无法导出数据 json python 爬虫
2023-03-01 20:22

回答 3 已采纳回答不易，望采纳！这一行代码报错了应该是连页面内容都没有爬下来，后边更别谈格式化处理了。检查一下你的 cookie 是不是过期了吧
如何实现数据表选择过滤器 html jquery php
2015-01-21 17:51

回答 1 已采纳 You don't need to have anything special in your jquery Just include the tfoot in your table <
「Hudi系列」Apache Hudi入门指南 | SparkSQL+Hive+Presto集成
2022-02-28 17:02

王知无(import_bigdata)的博客点击上方蓝色字体，选择“设为星标”回复"面试"获取更多惊喜Hi，我是王知无，一个大数据领域的原创作者。放心关注我，获取更多行业的一手消息。一、各种整合hive集成hudi方法：将hudi...
springboot + hbase + mysql + es 多数据源项目demo spring 有问必答
2021-04-20 16:23

回答 3 已采纳 datasource: master: #数据源1 # driver-class-name: com.mysql.jdbc.Driver #
Presto (三) --------- Presto 优化
2022-11-06 17:01

在森林中麋了鹿的博客 Presto 优化
SQL、MySQL、Hive&Presto的使用区别ing
2022-07-01 17:40

追求色彩的程序员的博客 SQL、MySQL与HiveSQL的使用区别ing
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 9月20日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月12日

悬赏问题

¥15 程序不包含适用于入口点的静态Main方法
¥15 素材场景中光线烘焙后灯光失效
¥15 请教一下各位，为什么我这个没有实现模拟点击
¥15 执行 virtuoso 命令后，界面没有，cadence 启动不起来
¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
¥20 有关区间dp的问题求解
¥15 多电路系统共用电源的串扰问题
¥15 slam rangenet++配置
¥15 有没有研究水声通信方面的帮我改俩matlab代码
¥15 ubuntu子系统密码忘记

如何使用presto对hive分区表进行insert和delete

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新