关于flume和kafka结合效率的问题

最近做了个测试。是flume+kafka的。是读取文件夹的。31M的文件读了很长时间。大概20分钟。不知道什么原因。哪位大神知道啊。指导下。
下面是flume的配置

#agent section producer.sources = s
producer.channels = c
producer.sinks = r

#source section
#producer.sources.s.type = seq
#producer.sources.s.channels = c
producer.sources.s.type =spooldir

producer.sources.s.spoolDir = /home/lb/data
producer.sources.s.channels = c

Each sink's type must be defined

producer.sinks.r.type = org.apache.flume.plugins.KafkaSink
producer.sinks.r.metadata.broker.list=127.0.0.1:9092
producer.sinks.r.partition.key=1
producer.sinks.r.partitioner.class=org.apache.flume.plugins.SinglePartition
producer.sinks.r.serializer.class=kafka.serializer.StringEncoder
producer.sinks.r.request.required.acks=0
producer.sinks.r.max.message.size=1000000
producer.sinks.r.producer.type=async
producer.sinks.r.custom.encoding=UTF-8
producer.sinks.r.custom.topic.name=lbTestToptic

#Specify the channel the sink should use
producer.sinks.r.channel = c

Each channel's type is defined.

producer.channels.c.type = memory
producer.channels.c.capacity = 100000
producer.channels.c.transactionCapacity = 10000

希望有知道原因的大神给个帮助啊。谢谢

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
郭俊JasonGuo 2015-06-08 14:04
关注
不仅仅要看文件的大小（31MB），还要看行数

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Flume和kafka连接的问题 flume 大数据
2018-07-21 14:46

回答 1 已采纳 https://blog.csdn.net/weixin_40137479/article/details/79214312
kafka集成flume flume kafka
2023-03-03 20:36

回答 1 已采纳 “Devil组”引证GPT后的撰写：可能有多种原因导致消费者没有消费到所有追加的内容。以下是一些可能的原因：日志追加速度太快，消费者无法跟上。如果日志追加速度非常快，而消费者无法及时消费所有消息，那
关于flume-ng输出文件名的问题 flume
2016-01-06 02:25

回答 1 已采纳 http://www.tuicool.com/articles/ZjuqMv
28-flume和kafka为什么要结合使用
2023-03-26 14:27

大数据捌圆的博客 28-flume和kafka为什么要结合使用
关于#flume#的问题，启动的时候一直卡在这里如何解决？ flume
2023-03-20 13:28

回答 1 已采纳正常就是阻塞这里的，你如果想要后台运行的话，要使用 nohup + 你的命令 1>$FLUME_HOME/logs/flume.log 2>&1 &
运行flume的agent，出现如下错误 flume kafka
2017-10-12 08:55

回答 1 已采纳 http://blog.csdn.net/silentwolfyh/article/details/51224098
启动flume脚本，在生成的日志文件中报错：Agent configuration for 'a1' has no configfilters flume hdfs kafka
2021-12-17 14:35

回答 1 已采纳启动命令的问题，试试这个：nohup /opt/module/flume/bin/flume-ng agent --conf /opt/module/flume/conf -f /opt/modul
Kafka09：【案例】Flume集成Kafka
2022-03-14 10:05

做一个有趣的人Zz的博客在实际工作中flume和kafka会深度结合使用 1：flume采集数据，将数据实时写入kafka 2：flume从kafka中消费数据，保存到hdfs，做数据备份下面我们就来看一个综合案例使用flume采集日志文件中产生的实时数据，写入到...
在win10启动kafka报错 kafka zookeeper
2022-05-15 21:27

回答 1 已采纳删除异常的主题“movie_real_topic”试试.\bin\kafka-topics --delete --topic movie_real_topic --zookeeper localhos
flume执行配置文件的时候显示权限不够 flume
2022-05-12 09:10

回答 1 已采纳进入目录bin/flume-ng赋权chmod +x flume-ng
flume配置了kakfaChannel后，启动报错！求大神帮忙 flume kafka
2016-11-24 07:02

回答 3 已采纳检查下你的Kafka，配置多个Kafka源以从同一主题读取，试一下。或者去http://blog.csdn.net/high2011/article/details/53282128上看下，不知道有没
Flume和Kafka结合实现日志采集
2020-08-18 22:58

鸿儒之观的博客 (2)结合Kafka的聚合模型(Kafka source) [1]解析采用Kafka Channel，省去了Sink，提高了效率。KafkaChannel数据存储在Kafka里面，所以数据是存储在磁盘中。注意在Flume1.7以前，Kafka Channel很少有人使用，因为...
flume采集目录下的文件报错 big data flume 大数据
2022-03-29 21:23

回答 1 已采纳可以尝试修改 flume下的conf/flume-env.sh文件：export JAVA_OPTS="-Xms512m -Xmx1024m -Dcom.sun.management.jmxremot
Flume对接Kafka详细过程
2021-01-04 15:38

杨哥学编程的博客一、为什么要集成Flume和Kafka 一般使用Flume+Kafka架构都是希望完成实时流式的日志处理，后面再连接上Storm/Spark Streaming等流式实时处理技术，从而完成日志实时解析的目标。如果Flume直接对接实时计算框架，当...
为什么要把Kafka和Flume结合使用
2019-12-06 16:32

数据践行者的博客一、概念剖析Flume+Kafka Flume 是一个分布式、可靠、和高可用的海量日志聚合的系统，支持在系统中定制各类数据发送方，通过监控整个文件目录或者某一个特定文件，用于收集数据；同时Flume也提供数据写到各种数据...
没有解决我的问题, 去提问

悬赏问题

¥60 版本过低apk如何修改可以兼容新的安卓系统
¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
¥50 有数据，怎么建立模型求影响全要素生产率的因素
¥50 有数据，怎么用matlab求全要素生产率
¥15 TI的insta-spin例程
¥15 完成下列问题完成下列问题
¥15 C#算法问题, 不知道怎么处理这个数据的转换
¥15 YoloV5 第三方库的版本对照问题
¥15 请完成下列相关问题！
¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像，如何解决？

关于flume和kafka结合效率的问题

Each sink's type must be defined

Each channel's type is defined.

1条回答 默认 最新

悬赏问题

1条回答默认最新