flume+kafka+hdfs 整合问题

本想搭建一个 flume+hdfs+kafka+storm+mysql 的日志实时分析和存储的系统，但是flume日志收集这块一直不通，查看flume的日志也没有报错，不知道该怎么解决了，求大家帮帮忙，贴出集群配置和配置文件如下：
共5台机器：node1~node5，其中node3~node5为日志收集的agent，node1~node2为flume的collector，最终存储两份，一份到kafka，一份到hdfs。
agent的配置文件如下：

#def
agent.sources = src_spooldir
agent.channels = file memory
agent.sinks = collector_avro1 collector_avro2

sources

agent.sources.src_spooldir.type = spooldir
agent.sources.src_spooldir.channels = file memory
agent.sources.src_spooldir.spoolDir = /data/flume/spoolDir
agent.sources.src_spooldir.selector.type = multiplexing
agent.sources.src_spooldir.fileHeader = true

channels

agent.channels.file.type = file
agent.channels.file.checkpointDir = /data/flume/checkpoint
agent.channels.file.dataDirs = /data/flume/data
agent.channels.memory.type = memory
agent.channels.memory.capacity = 10000
agent.channels.memory.transactionCapacity = 10000
agent.channels.memory.byteCapacityBufferPercentage = 20
agent.channels.memory.byteCapacity = 800000

sinks

agent.sinks.collector_avro1.type = avro
agent.sinks.collector_avro1.channel = file
agent.sinks.collector_avro1.hostname = node1
agent.sinks.collector_avro1.port = 45456
agent.sinks.collector_avro2.type = avro
agent.sinks.collector_avro2.channel = memory
agent.sinks.collector_avro2.hostname = node2
agent.sinks.collector_avro2.port = 4545

collector端的配置文件如下：

#def
agent.sources = src_avro
agent.channels = file memory
agent.sinks = hdfs kafka

sources

agent.sources.src_avro.type = avro
agent.sources.src_avro.channels = file memory
agent.sources.src_avro.bind = node1
agent.sources.src_avro.port = 45456
agent.sources.src_avro.selector.type = replicating

channels

sinks

agent.sinks.hdfs.type = hdfs
agent.sinks.hdfs.channel = file
agent.sinks.hdfs.hdfs.path = hdfs://node1/flume/events/%y-%m-%d/%H%M/%S
agent.sinks.hdfs.hdfs.filePrefix = log_%Y%m%d_%H
agent.sinks.hdfs.hdfs.fileSuffix = .txt
agent.sinks.hdfs.hdfs.useLocalTimeStamp = true
agent.sinks.hdfs.hdfs.writeFormat = Text
agent.sinks.hdfs.hdfs.rollCount = 0
agent.sinks.hdfs.hdfs.rollSize = 1024
agent.sinks.hdfs.hdfs.rollInterval = 0

agent.sinks.kafka.type = org.apache.flume.sink.kafka.KafkaSink
agent.sinks.kafka.channel = memory
agent.sinks.kafka.kafka.topic = test
agent.sinks.kafka.kafka.bootstrap.servers = node3:9092,node4:9092,node5:9092
agent.sinks.kafka.kafka.flumeBatchSize = 20
agent.sinks.kafka.kafka.producer.acks = 1
agent.sinks.kafka.kafka.producer.linger.ms = 1
agent.sinks.kafka.kafka.producer.compression.type = snappy

最终 hdfs和kafka都没有接收到数据。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
devmiao 2018-05-12 12:56
关注
https://blog.csdn.net/m0_37739193/article/details/72638443

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Flume和kafka连接的问题 flume 大数据
2018-07-21 14:46

回答 1 已采纳 https://blog.csdn.net/weixin_40137479/article/details/79214312
kafka集成flume flume kafka
2023-03-03 20:36

回答 1 已采纳 “Devil组”引证GPT后的撰写：可能有多种原因导致消费者没有消费到所有追加的内容。以下是一些可能的原因：日志追加速度太快，消费者无法跟上。如果日志追加速度非常快，而消费者无法及时消费所有消息，那
启动flume脚本，在生成的日志文件中报错：Agent configuration for 'a1' has no configfilters flume hdfs kafka
2021-12-17 14:35

回答 1 已采纳启动命令的问题，试试这个：nohup /opt/module/flume/bin/flume-ng agent --conf /opt/module/flume/conf -f /opt/modul
lamp安装配置及flume+Kafka+Storm+HDFS实时系统搭分享
2015-05-19 15:37

lnmp(linux+nginx+mysql+php)安装配置及分布式系统大数据处理hadoop集群中的flume+Kafka+Storm+HDFS等实时系统搭分享
flume采集目录下的文件报错 big data flume 大数据
2022-03-29 21:23

回答 1 已采纳可以尝试修改 flume下的conf/flume-env.sh文件：export JAVA_OPTS="-Xms512m -Xmx1024m -Dcom.sun.management.jmxremot
Flume接收来自AvroSource信息 flume 大数据
2023-03-24 23:50

回答 1 已采纳根据您提供的信息，我们可以初步分析出可能出现错误的步骤：1. AvroSource的配置是否正确，包括IP地址、端口号等信息是否正确设置；2. Flume的配置是否正确，包括source、channe
MySQL-flume -hdfs SLF4J: Defaulting to no-operation (NOP) logger implementation flume
2022-03-22 22:51

回答 2 已采纳应该是没有导入相关依赖
flume-ng+Kafka+Storm+HDFS实时系统组合
2021-01-30 05:07

4.flume+kafka如何整合？5.使用什么脚本可以查看flume有没有往Kafka传输数据做软件开发的都知道模块化思想，这样设计的原因有两方面：一方面是可以模块化，功能划分更加清晰，从“数据采集--数据接入--流失计算--...
运行flume的agent，出现如下错误 flume kafka
2017-10-12 08:55

回答 1 已采纳 http://blog.csdn.net/silentwolfyh/article/details/51224098
在win10启动kafka报错 kafka zookeeper
2022-05-15 21:27

回答 1 已采纳删除异常的主题“movie_real_topic”试试.\bin\kafka-topics --delete --topic movie_real_topic --zookeeper localhos
关于#flume#的问题，启动的时候一直卡在这里如何解决？ flume
2023-03-20 13:28

回答 1 已采纳正常就是阻塞这里的，你如果想要后台运行的话，要使用 nohup + 你的命令 1>$FLUME_HOME/logs/flume.log 2>&1 &
大数据——Flume+Kafka+Flume整合模式
2021-07-30 22:40

Vicky_Tang的博客创建kafka主题 #启动kafka服务 kafka-server-start.sh /opt/software/kafka280cala212/conf/kraft/server.properites #创建主题 #topic主题名test01 #partitions分区数1 #replication-factor备份数量1 kafka-...
flume执行配置文件的时候显示权限不够 flume
2022-05-12 09:10

回答 1 已采纳进入目录bin/flume-ng赋权chmod +x flume-ng
flume+kafka+hdfs收集用户行为数据
2021-09-27 16:59

全能打工人的博客目标：通过flume获取kafka实时数据并转存储到hdfs。一. 安装部署Hadoop并启动Hadoop，具体步骤见：Windows10 安装Hadoop3.3.0_xieedeni的博客-CSDN博客 Windows10安装Hive3.1.2_xieedeni的博客-CSDN博客说明：...
Flume+Kafka+HDFS综合运用
2021-05-06 22:28

皓洲的博客 Flume+Kafka+HDFS综合运用实验内容如下图所示：在某一实际应用中，有一个的数据源(可用Source类型为Exec Source或NetCat Source的Agent a1来用模拟），为方便后期数据分析，需要记录事件的产生IP、时间（格式：...
没有解决我的问题, 去提问

悬赏问题

¥15 kafka 分区副本增加会导致消息丢失或者不可用吗？
¥15 微信公众号自制会员卡没有收款渠道啊
¥15 stable diffusion
¥100 Jenkins自动化部署—悬赏100元
¥15 关于#python#的问题：求帮写python代码
¥20 MATLAB画图图形出现上下震荡的线条
¥15 关于#windows#的问题：怎么用WIN 11系统的电脑克隆WIN NT3.51-4.0系统的硬盘
¥15 perl MISA分析p3_in脚本出错
¥15 k8s部署jupyterlab，jupyterlab保存不了文件
¥15 ubuntu虚拟机打包apk错误

flume+kafka+hdfs 整合问题

sources

channels

sinks

sources

channels

sinks

1条回答 默认 最新

悬赏问题

1条回答默认最新