Cloudera Impala & Facebook Presto & Hive

Hive将SQL语言映射为MapReduce进而实现查询，但往往相应较慢，在实时性上有欠缺。而Cloudera公司的Impala和Facebook提出的Presto同样支持SQL语言，但都没有使用MapReduce框架，查询的实时性很好。
我想请问一下Impala和Presto工作的具体原理是什么？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
你知我知皆知 2024-08-01 19:55
关注
以下回答参考 皆我百晓生、券券喵儿 等免费微信小程序相关内容作答，并由本人整理回复。

Cloudera Impala和Facebook Presto都是基于Apache Hadoop生态系统中的MapReduce技术开发的，但是它们的工作原理有所不同。

Cloudera Impala：Impala是Cloudera公司推出的一个高性能、可扩展的数据分析工具，它使用内存进行数据处理，而不是传统的磁盘I/O操作。Impala使用了自定义的SQL解析器来执行SQL语句，并且可以实时地从内存中读取结果。Impala的主要优点在于它的性能和易用性，它可以快速响应用户查询请求，而且不需要频繁的磁盘IO操作。

Facebook Presto：Presto是Facebook开源的一种分布式计算引擎，它主要使用内存来进行数据处理，而不是传统的磁盘I/O操作。Presto使用了自定义的SQL解析器来执行SQL语句，并且可以实时地从内存中读取结果。Presto的主要优点在于它的性能和灵活性，它可以在不同的硬件平台上运行，并且可以处理大规模的数据集。

总的来说，Cloudera Impala和Facebook Presto都采用了内存计算的方式，但是它们在工作原理上有所区别。Impala使用了自定义的SQL解析器，而Presto则使用了自定义的SQL解析器。此外，Impala还可以直接访问HDFS文件系统，而Presto只能通过网络连接到外部存储设备。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

如何比较Hive，Spark，Impala和Presto？
2020-10-28 20:59

zxfBdd的博客 Spark，Hive，Impala和Presto是基于SQL的引擎，Impala由Cloudera开发和交付。在选择这些数据库来管理数据库时，许多Hadoop用户会感到困惑。Presto是一个开放源代码的分布式SQL查询引擎，旨在运行甚至PB级的SQL查询，...
实时查询引擎 - Cloudera Impala 介绍与应用
2016-11-28 15:30

CQ阿甘的博客 Impala是我使用最多，也是...相较于之前介绍的HAWQ, Presto 以及 Drill 等，已经可以找到很多它的相关资料。它同样是基于Hadoop的以SQL语言接口，并提供实时的，高并发的查询MPP类查询引擎。那Impala到底有什么优势呢？
是选impala还是presto_Kylin、druid、presto、impala四种即席查询对比
2020-12-24 12:32

用户7397237569的博客三、impala 1、定义：Cloudera公司推出，提供对HDFS、Hbase数据的高性能、低延迟的交互式SQL查询功能。基于Hive，使用内存计算，兼顾数据仓库、具有实时、批处理、多并发等优点。 2、架构Impala架构从上图可以看出...
Impala 和 Presto 概述及JDBC
2019-06-17 05:38

Yore Yuen的博客本文主要概述了Impala和Presto，其中Impala介绍了架构和数据类型，以及相关资料文档，最后使用Maven项目编写Impala JDBC，使用Scala语言编写代码，如果需要可以自行更改为Java代码。Presto部分同样概述了Presto和...
Hive、Spark SQL、Impala比较
2019-11-04 15:38

阿龙先生啊的博客 Hive、Spark SQL、Impala比较 Spark SQL简介 Hive、Spark SQL、Impala比较（1）功能（2）架构（3）场景 Hive、SparkSQL、Impala性能对比 Hive、Spark SQL、Impala比较 Hive、Spark SQL和Impala三种...
OLAP(三)：Impala介绍、 (和hive/spark对比)、COMPUTE STATS
2021-02-08 14:59

四月天03的博客一、Impala概述 Impala是用于处理存储在Hadoop集群中的大量数据的MPP（大规模并行处理）SQL查询...Impala的优点：Impala数据查询效率比Hive快几倍甚至数十倍 Impala通过使用标准组件（如HDFS，HBase.................
presto 和 trino 是不是取代了 impala大数据
2025-08-24 11:28

hxsln11的博客特性 | Impala | Presto/Trino | 胜出方 |数据源支持| 主要面向 Hadoop/云存储 |极其广泛的联邦查询 |社区活跃度| 由 Cloudera 主导，活跃度低 |非常活跃的开源社区 |云原生与K8s| 支持较差，与Hadoop绑定深 |原生...
Hadoop databases: Hive, Impala, Spark, Presto For ORACLE DBAs
2017-04-06 18:47

### Hadoop 数据库系统：Hive、Impala、Spark、Presto 对 Oracle DBA 的意义 #### 一、引言随着大数据时代的到来，数据处理的需求与日俱增，传统的关系型数据库如Oracle面临着前所未有的挑战。为了解决海量数据的...
hive、impala、prestoDB 优缺点对比
2018-11-26 16:29

小强的进阶之路的博客 hive 优点缺点被广泛应用，经受时间的考验既然是基于Mapreduce，也拥有MapReduce所有缺点，包含昂贵的Shuffle操作和磁盘IO操作运行在Mapreduce框架之上 hive仍然不支持多个reduce操作group by和order...
python使用spark sql查询impala_如何比较Hive，Spark，Impala和Presto？
2020-12-18 04:31

weixin_39783360的博客 Spark，Hive，Impala和Presto是基于SQL的引擎，Impala由Cloudera开发和交付。在选择这些数据库来管理数据库时，许多Hadoop用户会感到困惑。Presto是一个开放源代码的分布式SQL查询引擎，旨在运行甚至PB级的SQL查询，...
没有解决我的问题, 去提问

Cloudera Impala & Facebook Presto & Hive

1条回答 默认 最新

1条回答默认最新