你好按钮啊 2023-02-01 10:55 采纳率: 40%

已结题

FlinkSQL平台化，前端化管理

FlinkSql的前端化，平台化思路。

想搞一个平台。后端采用Java。实现类似于FlinkSQLClient的功能，即往后台Flink发送一连串的FlinkSQL命令，后台Flink可以直接执行并提交对应的任务。该平台也可以同步管理Flink已有任务。

FlinkSQL命令包含设置参数的命令，DQL，DML，DDL等等。如下所示。

-- 设置参数的语句
set execution.checkpointing.intervat = 10000;
set execution.checkpointingtimout = 10000;

--  DDL建表语句
CREATE TABLE doris_test_sink (
   id INT,
   name varchar(255),
   sex varchar(255)
) 
WITH (
  'connector' = 'doris',
  'fenodes' = 'srvbd59.net.cn:8030',
  'table.identifier' = 'cdc_test.user_info',
  'sink.batch.size' = '2',
  'sink.batch.interval'='1',
  'username' = 'root',
  'password' = '123456'
)

-- DML语句
insert into  ....

我的思路

1：上面的思路就是提前packet一个BaseJar,放到Linux上。
2：BaseJar中要执行的SQL语句是通过JDBC从数据库中拉取。通过for循环执行。
3：要执行的SQL语句是先通过编辑器编辑，然后存储在数据库中。
4：通过Java代码操作Linux，拼接flink run命令，并且在命令中拼接--SqlKey，通过ParameterTool.fromArgs获取作为键拉取要执行的SQL。
5：按照以上的思路，所有的任务都是基于一个BaseJar包运行的多个任务。
6：以上思路经初步验证是可行的。

该思路中的问题。

tableEnv.executeSql("sql语句")不能执行设置参数的语句，如下：

tableEnv.executeSql("set execution.checkpointing.intervat = 10000;")

但设置属性的参数不能通过tableEnv.executeSql(）执行。会报下面的错误。

 Exception in thread "main" org.apache.flink.table.api.TableException: 
Unsupported SQL query! executeSql() only accepts a single SQL statement of type
 CREATE TABLE, DROP TABLE, ALTER TABLE, CREATE DATABASE, DROP DATABASE, ALTER DATABASE, CREATE FUNCTION, 
DROP FUNCTION, ALTER FUNCTION, CREATE CATALOG, DROP CATALOG, USE CATALOG, USE [CATALOG.]DATABASE, 
SHOW CATALOGS, SHOW DATABASES, SHOW TABLES, SHOW [USER] FUNCTIONS, SHOW PARTITIONSCREATE VIEW, 
DROP VIEW, SHOW VIEWS, INSERT, DESCRIBE, LOAD MODULE, UNLOAD MODULE, USE MODULES, SHOW [FULL] MODULES.

关于上面的问题，初步考虑可以通过Java代码解析字符串，然后直接拼接成Configuration。然后再构建环境。

Configuration configuration = new Configuration();
// 设置底层 key-value 选项
configuration.setString("table.exec.mini-batch.enabled", "true");
configuration.setString("table.exec.mini-batch.allow-latency", "5 s");
configuration.setString("table.exec.mini-batch.size", "5000");
EnvironmentSettings settings = EnvironmentSettings.newInstance()
        .inStreamingMode().withConfiguration(configuration).build();
TableEnvironment tEnv = TableEnvironment.create(settings);

类比其他的开源框架。

可以参考下一个开源框架Dinky，如果可以看源码的话。个人想寻求代码思路。

总结

我就是思考了一下FlinkSQL平台化的初步思路，但我这个思路总觉得不太正规。想知道Flink有没有提供这样一个API。给它要执行的SQL，他可以自动启动一个任务。或者觉得有其他更好的思路可以探讨一下。

最后

有没有平台化开发的相关经验的人员，后续我的工作要涉及到平台开发。希望可以提供指导。当然，如果提供实质帮助。我也可以有偿。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
白夜鸦羽 2023-02-02 19:13
关注
题主的思路完全正确可行，因为我就是这么做的。也是一开始觉得不是很正规，但确实能解决实际的业务问题，要相信自己。

梳理一下
BaseJar：丢到linux服务器上，用来解析Flink SQL语句
MySQL：存储要执行的Flink SQL语句
Platform：调用BaseJar，传入参数task_id，告诉BaseJar要读取MySQL里的哪一条Flink SQL进行解析，并生成一个Flink SQL任务。

这里有3个细节
1.BaseJar的入口类的Main函数，支持传入参数，这个参数就可以定为task_id
2.建议重新设计MySQL表，既然一行MySQL数据存储一个Flink SQL任务，那么至少要有三个字段
data_source：Flink SQL源表，指定从哪里接入数据，一般是Kafka
data_sink：Flink SQL落地表，指定任务结果写到哪里,一般是Kafka
task_sql：Flink SQL逻辑代码
这样一行MySQL数据就能生成一个完整的Flink SQL任务，且可以根据task_id来获取到这个任务配置解析
3.拼接flink run命令调用BaseJar，但属于本地命令执行，要依赖本地环境，更好的办法是远程提交Flink任务。但远程提交Flink任务现在没有现成的代码，需要自己去撸Flink源码。

回到问题本身：tableEnv.executeSql("sql语句")不能执行设置参数的语句。
当然不能，因为Flink流任务在一开始必须是确定的，但我们可以通过向Main方法传参task_id，来实现一个BaseJar读取不同的Flink SQL语句，生成不同的Flink SQL任务。本身已经想到了用MySQL存Flink SQL，就不要再用Configuration了。

补充：
现在已经有很多这样的开源平台了，如果觉得自己造轮子麻烦，可以直接用开源的。
StreamPark：刚刚被Apache收纳为大数据平台孵化项目，https://github.com/apache/incubator-streampark
Ververica Platform：Flink官方提供的Flink SQL执行平台，还行吧勉强用英文不友好，https://www.ververica.com/getting-started

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

FlinkSQL平台化，前端化管理 flink java 大数据
2023-02-01 10:55

回答 4 已采纳题主的思路完全正确可行，因为我就是这么做的。也是一开始觉得不是很正规，但确实能解决实际的业务问题，要相信自己。梳理一下BaseJar：丢到linux服务器上，用来解析Flink SQL语句MySQ
Linux平台，对应用GUI界面如何做自动化测试？自动化
2023-01-03 15:08

回答 2 已采纳在 Linux 平台上进行 GUI 自动化测试有很多工具可供选择。下面列出一些常用的工具和框架： 1、xdotool：这是一个命令行工具，可以模拟鼠标和键盘的输入。它可以通过窗口名称或窗口 ID 来控
SQLserver 2019可否跨平台 sqlserver
2022-04-01 15:29

回答 2 已采纳官方安装文档 Linux 上的 SQL Server 的安装指南 - SQL Server | Microsoft Docs 安装、更新和卸
网易游戏 Flink SQL 平台化实践
2022-07-18 21:30

Apache Flink的博客网易游戏 Flink SQL 发展历程基于模板 jar 的 StreamflySQL v1 基于 SQL Gateway 的 StreamflySQL v2 未来工作点击查看直播回放 & 演讲PDF 一、网易游戏 Flink SQL 发展历程网易游戏实时计算平台叫做 ...
oj平台python标准化输入 python
2022-05-12 20:57

回答 4 已采纳代码如下： import sys print("请输入需要输入的行数n:") n = int(sys.stdin.readline().replace("\n","")) total = 0 pr
日期格式化拼题啊平台题目 c++ c语言
2021-09-18 11:44

回答 4 已采纳 #include <stdio.h> int main() { char mm[3],dd[3],yyyy[5]; scanf("%2[0-9]-%2[0-9]-%4[0
hadoop大数据平台搭建–集群部署hadoop平台 linux
2021-08-22 22:43

回答 3 已采纳服务器性能不够，或者是配置文件没配置对。
Flink SQL管理平台flink-streaming-platform-web安装搭建
2022-12-01 18:31

大数据技术派的博客最近看到有人在用flink sql的页面管理平台，大致看了下，尝试安装使用，比原生的flink sql界面确实好用多了，我们看下原生的，通过bin/sql-client.sh命令进入那个黑框，一只松鼠，对，就是那个界面。。。。这个工具...
信息管理与信息系统专业方向其他大数据
2023-03-03 22:09

回答 3 已采纳我是算法工程师，个人推荐你：大数据技术方向（有Python，大数据平台技术，商业数据分析，数据仓库与数据挖掘）这个方向。1.先做数据分析数据挖掘相关知识学习，大三多去参加点数学建模比赛，给简历丰富一下
想做一个消息管理平台，如何实现？ java 前端框架有问必答架构
2021-08-22 21:54

回答 4 已采纳 https://www.layui.com/layim/
大数据初学者应该买那些类型的书 sql 数据库架构
2022-09-01 21:56

回答 2 已采纳 大数据是很宽泛的概念，得看自己的应用场景，处理数据的方式很多，所以没人愿意回答，想入门的话先从数据库系统开始比较好，如果数据库没问题了再找相关书籍，《大数据技术与应用基础》这本书感觉还可以，个人观点，
Dlink ？一款交互式FlinkSQL开发平台
2021-12-20 14:05

明月清风，良宵美酒的博客 Dlink ？一款交互式FlinkSQL开发平台
持久化工具ibatis的问题
2014-01-14 11:43

回答 4 已采纳看了楼主的问题，有几点感慨： [color=blue]① 感觉楼主纯粹就是为分层而分层，根本没有理解为什么要分层！ ② IBatis就是一个持久层的工具，不知道为什么你还要让它自动生成业务
联通 Flink 实时计算平台化运维实践
2023-07-13 20:00

Apache Flink的博客联通数科实时计算团队负责人、Apache StreamPark Committer 穆纯进在 Flink Forward Asia 2022 平台建设专场的分享。
剑指大数据——Flink学习精要（Java版）
2023-03-16 09:32

小术晓术的博客本书基于Flink的稳定版本1.13，从Flink数据处理思想开始讲解，带领读者深入理解...另外，本书还对实际开发中常用的Flink SQL、CEP等高层级API进行了细致的讲解，以电商网站中的实际应用为场景，提供了大量的代码实现。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 2月15日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 2月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月1日

悬赏问题

¥20 机器学习能否像多层线性模型一样处理嵌套数据
¥20 西门子S7-Graph,S7-300，梯形图
¥50 用易语言http 访问不了网页
¥50 safari浏览器fetch提交数据后数据丢失问题
¥15 matlab不知道怎么改，求解答！！
¥15 永磁直线电机的电流环pi调不出来
¥15 用stata实现聚类的代码
¥15 请问paddlehub能支持移动端开发吗？在Android studio上该如何部署？
¥20 docker里部署springboot项目，访问不到扬声器
¥15 netty整合springboot之后自动重连失效