flume增量采集动态日志

请教一个flume增量采集日志问题，谢谢。

遇到一个应用，它生成的日志形式比较特殊，每天产生一个带日期的前缀，并根据文件容量扩展带序号的后缀。

例如2019年11月18日会首先生成20191118.log001，然后当日志文件写满20MB后，会生成20191118.log002，每个文件最大容量20MB，依次类推增加后缀的数字。

我们想用flume实时追加采集日志，如果source里定义：
a1.sources.r1.type = exec
a1.sources.r1.command = tail -f /tmp/20191118.log001
则可以实时收取，但只能取到一个日志文件，该文件写满20MB后，生成20191118.log2，flume就采集不到了。

如果使用:
a1.sources.r1.type = spooldir
a1.sources.r1.spoolDir = /tmp
a1.sources.r1.includePattern = S2019*.*
则可以采集所有文件，但只能将文件采集一次，无法做到实时增量采集。

请教对于这样的日志，如何使用flume采集增量日志，谢谢。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
蓝之刃 2019-12-03 10:45
关注
taildir source

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

flume采集目录下的文件报错 big data flume 大数据
2022-03-29 21:23

回答 1 已采纳可以尝试修改 flume下的conf/flume-env.sh文件：export JAVA_OPTS="-Xms512m -Xmx1024m -Dcom.sun.management.jmxremot
启动flume采集任务时报错（4141端口） flume
2021-08-21 18:13

回答 1 已采纳检查一下sources配置文件
kafka集成flume flume kafka
2023-03-03 20:36

回答 1 已采纳 “Devil组”引证GPT后的撰写：可能有多种原因导致消费者没有消费到所有追加的内容。以下是一些可能的原因：日志追加速度太快，消费者无法跟上。如果日志追加速度非常快，而消费者无法及时消费所有消息，那
flume采集mysql日志_Flume实时采集MySQL增量数据
2021-03-22 09:40

英甜慧子的博客在网上了解了一种方案，使用Flume第三方Source插件“flume-ng-sql-source”，可以实时增量采集MySQL数据flume-ng-sql-source的GitHub地址：https://github.com/keedio/flume-ng-sql-source02-环境信息1.基础环境信息...
启动flume脚本，在生成的日志文件中报错：Agent configuration for 'a1' has no configfilters flume hdfs kafka
2021-12-17 14:35

回答 1 已采纳启动命令的问题，试试这个：nohup /opt/module/flume/bin/flume-ng agent --conf /opt/module/flume/conf -f /opt/modul
flume执行配置文件的时候显示权限不够 flume
2022-05-12 09:10

回答 1 已采纳进入目录bin/flume-ng赋权chmod +x flume-ng
flume日志收集，拒绝链接什么问题呀！！！！！！！！！！ flume
2017-12-21 12:11

回答 1 已采纳同学看样子你的agent没有启动成功或者防火墙挡住了，可先排查agent是否正常启动，其次检查日志或者确认端口已经被正确监听。上述没有问题确认下是否网络问题或防火墙问题。祝好运。
flume mysql 增量_flume增量采集数据
2021-01-19 22:28

weixin_39607423的博客对于flume的增量抽取，首先想到的就是常用的那几种方法，监控日志，触发器，版本号，时间戳等等，虽然可以实现，但都对数据源有了一定限制，假如客户的系统内部表没有那些东西，这就是一件很难搞的事了，毕竟对方...
Flume接收来自AvroSource信息 flume 大数据
2023-03-24 23:50

回答 1 已采纳根据您提供的信息，我们可以初步分析出可能出现错误的步骤：1. AvroSource的配置是否正确，包括IP地址、端口号等信息是否正确设置；2. Flume的配置是否正确，包括source、channe
以flume为数据源的spark streaming flume spark
2022-11-08 20:23

回答 1 已采纳看下是不是还有报错classNotFoundException.应该是你导入包的时候补全少了AvroSourceProtocol相关包或者是版本依赖错了.首先看下这个类是那个jar里面的，然后再分
flume-ng: 没有那个文件或目录这是怎么回事 flume hadoop
2022-12-07 19:45

回答 1 已采纳 1、关闭flume修改conf目录下的flume-env.sh.template：mv flume-env.sh.template flume-env.sh编辑flume-env.sh：vim flu
Flume分布式日志采集
2022-08-01 10:18

敲代码的彭于晏的博客 Flume构建在日志流之上一个简单灵活的架构。它具有可靠的可靠性机制和许多故障转移和恢复机制，具有强大的容错性。使用Flume这套架构实现对日志流数据的实时在线分析。Flume支持在日志系统中定制各类数据发送方，...
关于#flume#的问题，启动的时候一直卡在这里如何解决？ flume
2023-03-20 13:28

回答 1 已采纳正常就是阻塞这里的，你如果想要后台运行的话，要使用 nohup + 你的命令 1>$FLUME_HOME/logs/flume.log 2>&1 &
flume日志采集
2020-02-06 21:40

策马出凉州的博客 flume.apache.org flume概念解析 Flume是一种分布式的，能够有效地收集，聚合和移动大量日志数据的工具。flume有着可靠的故障转移和恢复机制，具有强大的容错性...Ageng是最小的日志收集单元，所谓flume的日志采集是...
Flume采集日志增量式的写进Cratedb
2021-05-26 14:42

林van的博客 Flume采集日志写进Cratedb 场景：公司中的日志存放与本地文件中，查看日志需要按关键字去查找，没办法多条件查询（如要按日期和查找出错误日志）。实现： 1、安装flume，修改jdk环境配置。 2、安装cratedb。 3、...
没有解决我的问题, 去提问

悬赏问题

¥15 在若依框架下实现人脸识别
¥15 网络科学导论，网络控制
¥100 安卓tv程序连接SQLSERVER2008问题
¥15 利用Sentinel-2和Landsat8做一个水库的长时序NDVI的对比，为什么Snetinel-2计算的结果最小值特别小，而Lansat8就很平均
¥15 metadata提取的PDF元数据，如何转换为一个Excel
¥15 关于arduino编程toCharArray()函数的使用
¥100 vc++混合CEF采用CLR方式编译报错
¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误，如何解决？
¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
¥15 c#逐行读取txt文本，但是每一行里面数据之间空格数量不同

flume增量采集动态日志

1条回答 默认 最新

悬赏问题

1条回答默认最新