Spark Streaming读取kafka数据解析后写入ES，处理效率太低太慢

环境：

Kafka 0.10+（不影响）
Spark 2.4.0 + Yarn
ES 6.5.4

问题：
从Kafka读取获取消息，然后进行简单过滤清晰操作后，将消息写入到ES中，发现处理效率很低，
Kafka有三个partition

maxRatePerPartition=2000
batchInterval=1s
//这种情况下刚刚好，就是处理延迟在1s左右浮动，不会出现任务堆积的情况
//此时处理配置
//num_executor=3
//executor_core=8

然后将读数据的maxRatePerPartition增大到10000乃至20000，发现处理速度始终没有变化
期间将num_executor设置为8，executor_core设置为8，还是没啥用

还增加了设置：

    conf.set("spark.streaming,concurrentJobs","20")
    conf.set("spark.local.wait","100ms")

还是没啥变化，大佬们，到底要咋调啊

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
蔡能教授，网站特聘专家 2019-10-28 23:09
关注
https://blog.csdn.net/xianpanjia4616/article/details/81432869

解决
无用 1
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

java读写德卡数据_Spark Streaming 读取Kafka数据写入ES
2021-03-13 07:11

爱情教练晋美的博客简介：目前项目中已有多个渠道到Kafka的数据处理，本文主要记录通过Spark Streaming 读取Kafka中的数据，写入到Elasticsearch，达到一个实时(严格来说，是近实时，刷新时间间隔可以自定义)数据刷新的效果。...
Sparkstreaming读取kafka数据写入hive和es
2020-03-22 14:42

天涯到处跑的博客一、主要流程 demo的主要流程如下图：二、流程步骤 1.数据采集
SparkStreaming消费Kafka数据，实时批量插入ElasticSearch，Java版本
2022-07-04 16:08

wunanliu的博客 SparkStreaming消费Kafka数据，实时批量插入ElasticSearch，Java版本
SparkStreaming消费Kafka，数据实时写入Hbase集群，Java版本
2022-07-03 20:34

wunanliu的博客 SparkStreaming消费Kafka，数据实时写入Hbase集群，Java代码
Spark Streaming 读取Kafka数据写入ES
2018-07-16 11:15

weixin_30617797的博客简介：目前项目中已有多个渠道到Kafka的数据处理，本文主要记录通过Spark Streaming 读取Kafka中的数据，写入到Elasticsearch，达到一个实时（严格来说，是近实时，刷新时间间隔可以自定义）数据刷新的效果。...
Debezium:Spark Structured Streaming将Kafka的数据写入ElasticSearch
2018-12-28 19:27

TracyGao01的博客前言： 1、数据流 Mysql -> Debezium -&...ElasticSearch 2、Mysql -> Debezium -> Kafka 参考 https://blog.csdn.net/u012551524/article/details/84258565 3、ES／Spar...
使用spark从kafka读取数据写入ES
2022-01-10 13:23

theminer的博客简略学习elasticsearch - 简书并增加mapping字段timestamp PUT /danmaku/_mapping { "properties": { "timestamp": { "type": "date", "index": false } } } 1.添加maven依赖 <dependency> ...
spark streaming读kafka写elasticsearch
2020-03-10 23:41

极伪的博客 spark streaming作为当下依然火热的流计算引擎，对于kafka和elasticsearch都有很好的api支持，以下是笔者在实际生产环境中的一个案例。首先说一下几个重点： kafka消费offset使用mysql保存，一开始使用了...
Sparkstreaming 消费Kafka写入Elasticsearch
2020-01-10 16:40

米兰昆德拉的幽默的博客 1. 版本说明 jdk 1.8 spark 2.3 elasticsearch 7.4 scala 2.11 Kafka 0.10 2. pom 依赖 <dependency> <groupId>org.apache.kafka</groupId> ...
scala编写，以spark stream方式监听消费kafka的topic，同步写入elasticsearch
2023-11-06 23:06

在这个项目中，我们使用Scala编程语言，结合Spark Streaming来监听和消费Kafka的特定主题，然后将处理后的数据实时写入Elasticsearch进行存储和检索。首先，Scala是一种静态类型的函数式编程语言，它在Java虚拟机...
没有解决我的问题, 去提问

Spark Streaming读取kafka数据解析后写入ES，处理效率太低太慢

1条回答 默认 最新

1条回答默认最新