同田贯葛队 2021-09-27 17:25 采纳率: 0%
浏览 29

怯问KETTLE只想从某文件夹取其中最新的那个文件,该如何操作呢?

文件名格式:
test20210921150000.txt
test20210921153000.txt
test20210921160000.txt
test20210921163000.txt

如上,从文件夹里的命名规范如上的这四个文件里,我只想取最新的test20210921163000.txt
kettle能不能实现呢?

  • 写回答

1条回答 默认 最新

  • IT阿沈 2021-09-27 17:45
    关注

    ETL工具的设计大部分都是泛型的,会提供功能,但具体的特殊场景需要自己做一些处理,关于这个问题,可以做如下的处理:

    1. 优先考虑shell提前处理文件
    2. shell 中对文件列表中的信息进行处理,其中,通过 ls -lt 获取指定文件夹中的文件列表信息,通过awk获取第一行中的文件名,然后将其cp 或mv 到临时文件夹中
    3. 通过kettle抽取临时文件夹中的文件,然后将这个文件mv回去原来的文件夹或者删除
    评论

报告相同问题?

问题事件

  • 创建了问题 9月27日

悬赏问题

  • ¥15 为什么使用javacv转封装rtsp为rtmp时出现如下问题:[h264 @ 000000004faf7500]no frame?
  • ¥15 乘性高斯噪声在深度学习网络中的应用
  • ¥15 运筹学排序问题中的在线排序
  • ¥15 关于docker部署flink集成hadoop的yarn,请教个问题 flink启动yarn-session.sh连不上hadoop,这个整了好几天一直不行,求帮忙看一下怎么解决
  • ¥30 求一段fortran代码用IVF编译运行的结果
  • ¥15 深度学习根据CNN网络模型,搭建BP模型并训练MNIST数据集
  • ¥15 C++ 头文件/宏冲突问题解决
  • ¥15 用comsol模拟大气湍流通过底部加热(温度不同)的腔体
  • ¥50 安卓adb backup备份子用户应用数据失败
  • ¥20 有人能用聚类分析帮我分析一下文本内容嘛