Spark Streaming读取kafka数据解析后写入ES，处理效率太低太慢

环境：

Kafka 0.10+（不影响）
Spark 2.4.0 + Yarn
ES 6.5.4

问题：
从Kafka读取获取消息，然后进行简单过滤清晰操作后，将消息写入到ES中，发现处理效率很低，
Kafka有三个partition

maxRatePerPartition=2000
batchInterval=1s
//这种情况下刚刚好，就是处理延迟在1s左右浮动，不会出现任务堆积的情况
//此时处理配置
//num_executor=3
//executor_core=8

然后将读数据的maxRatePerPartition增大到10000乃至20000，发现处理速度始终没有变化
期间将num_executor设置为8，executor_core设置为8，还是没啥用

还增加了设置：

    conf.set("spark.streaming,concurrentJobs","20")
    conf.set("spark.local.wait","100ms")

还是没啥变化，大佬们，到底要咋调啊

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
蔡能教授，网站特聘专家 2019-10-28 23:09
关注
https://blog.csdn.net/xianpanjia4616/article/details/81432869

解决
无用 1
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

java 后台查询数据使用spark Streaming处理 java spark
2017-08-04 10:06

回答 1 已采纳 http://blog.csdn.net/svmachine/article/details/52200761
这个kafka在Sparkstreaming生产者出问题 kafka spark
2023-01-23 19:40

回答 2 已采纳看起来你好像少这个jar ： kafka-clients，查找一下项目里引用了没有另外就是需要你check一下你代码里是否使用了 StringDeserializer 代替了 StringSer
以flume为数据源的spark streaming flume spark
2022-11-08 20:23

回答 1 已采纳看下是不是还有报错classNotFoundException.应该是你导入包的时候补全少了AvroSourceProtocol相关包或者是版本依赖错了.首先看下这个类是那个jar里面的，然后再分
java读写德卡数据_Spark Streaming 读取Kafka数据写入ES
2021-03-13 07:11

爱情教练晋美的博客简介：目前项目中已有多个渠道到Kafka的数据处理，本文主要记录通过Spark Streaming 读取Kafka中的数据，写入到Elasticsearch，达到一个实时(严格来说，是近实时，刷新时间间隔可以自定义)数据刷新的效果。...
用flinkcdc读取mysql数据,写入postgresql数据库,程序运行一段时间后挂了 flink
2022-11-11 14:34

回答 1 已采纳我觉得你可能日志定位错了，看逻辑应该只有去重算子有状态会造成CK超时状态过大崩溃重启，重启之后逻辑就类似你这个日志
在spark streaming中实时更新mllib的ALS算法的模型遇到的问题！ mllib spark
2015-06-15 09:01

回答 1 已采纳问题已解决。。。 allData 加上cache之后异常可以解决了，这是为什么呢？其中又出现了一个错误： ![图片说明](https://img-ask.csdn.net/upload/20
关于#spark#的问题：SparkStreaming中用到了SparkSession，会话完成之后需要关闭的位置 spark 有问必答
2021-10-25 15:00

回答 2 已采纳你好，我是有问必答小助手，非常抱歉，本次您提出的有问必答问题，技术专家团超时未为您做出解答本次提问扣除的有问必答次数，将会以问答VIP体验卡（1次有问必答机会、商城购买实体图书享受95折优惠）的形式为
SparkStreaming消费Kafka数据，实时批量插入ElasticSearch，Java版本
2022-07-04 16:08

wunanliu的博客 SparkStreaming消费Kafka数据，实时批量插入ElasticSearch，Java版本
Java编写flatMap参数问题 java spark
2022-07-05 21:33

回答 2 已采纳看着像是强制类型转换。去掉的话，错误信息是不是与类型有关
java解析Excel,The supplied file was empty java
2018-07-10 09:52

回答 1 已采纳你确认你的文件是excel格式的么？不要以为excel能打开，并且拥有xls/xlsx后缀的文件都是excel格式的，一些程序生成的根本就是文本格式、html、csv等等，也用了xls后缀。这些文
用UnityWebRequest加载streamingassets下的图片，打包后是红色感叹号 c# unity
2022-06-24 09:51

回答 3 已采纳在地址前加一个本地协议试试UnityWebRequest webRequest = UnityWebRequestTexture.GetTexture("file://"+pa); 双斜杠就行，不行就
Sparkstreaming读取kafka数据写入hive和es
2020-03-22 14:42

天涯到处跑的博客一、主要流程 demo的主要流程如下图：二、流程步骤 1.数据采集
flink写入StarRocks后, flink
2022-11-16 17:18

回答 1 已采纳你没发现你RowData的构造函数里面没赋值吗😓
Spark Streaming 读取Kafka数据写入ES
2018-07-16 11:15

weixin_30617797的博客简介：目前项目中已有多个渠道到Kafka的数据处理，本文主要记录通过Spark Streaming 读取Kafka中的数据，写入到Elasticsearch，达到一个实时（严格来说，是近实时，刷新时间间隔可以自定义）数据刷新的效果。...
SparkStreaming消费Kafka，数据实时写入Hbase集群，Java版本
2022-07-03 20:34

wunanliu的博客 SparkStreaming消费Kafka，数据实时写入Hbase集群，Java代码
没有解决我的问题, 去提问

悬赏问题

¥15 delta降尺度计算的一些细节，有偿
¥15 Arduino红外遥控代码有问题
¥15 数值计算离散正交多项式
¥30 数值计算均差系数编程
¥15 redis-full-check比较两个集群的数据出错
¥15 Matlab编程问题
¥15 训练的多模态特征融合模型准确度很低怎么办
¥15 kylin启动报错log4j类冲突
¥15 超声波模块测距控制点灯，灯的闪烁很不稳定，经过调试发现测的距离偏大
¥15 import arcpy出现importing _arcgisscripting 找不到相关程序