lightgbm json模型结果能否迭代解析转成sql，求教！

基本测试程序如下

import lightgbm as lgb
from sklearn.metrics import mean_squared_error
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
import pandas as pd
import numpy as np
from sklearn import tree
from sklearn import metrics

# 加载数据
iris = load_iris()
# 加载数据
iris = load_iris()
feature_names = ['sepal_length', 'sepal_width', 'petal_length', 'petal_width']
data = pd.DataFrame(iris.data, columns=feature_names)

data['target'] = iris.target

# 划分训练集和测试集

X_train, X_test, y_train, y_test = train_test_split(
                   data[feature_names], data['target'], test_size=0.2, random_state=42)

print("Train data length:", len(X_train))
print("Test data length:", len(X_test))

# 转换为Dataset数据格式
lgb_train = lgb.Dataset(X_train, y_train)
lgb_eval = lgb.Dataset(X_test, y_test, reference=lgb_train)

# 参数
params = {
    'task': 'train',
    'boosting_type': 'gbdt',  # 设置提升类型
    'objective': 'regression',  # 目标函数
    'metric': {'l2', 'auc'},  # 评估函数
    'num_leaves': 31,  # 叶子节点数
    'learning_rate': 0.05,  # 学习速率
    'feature_fraction': 0.9,  # 建树的特征选择比例
    'bagging_fraction': 0.8,  # 建树的样本采样比例
    'bagging_freq': 5,  # k 意味着每 k 次迭代执行bagging
    'verbose': 1  # <0 显示致命的, =0 显示错误 (警告), >0 显示信息
}

# 模型训练
gbm = lgb.train(params, lgb_train, num_boost_round=2, valid_sets=lgb_eval)

lgbm_json = gbm.dump_model()
lgbm_json

模型lgbm_jsom如下，想请教如何把下面模型结果通过json迭代解析成sql

{'name': 'tree',
 'version': 'v3',
 'num_class': 1,
 'num_tree_per_iteration': 1,
 'label_index': 0,
 'max_feature_idx': 3,
 'objective': 'regression',
 'average_output': False,
 'feature_names': ['sepal_length',
  'sepal_width',
  'petal_length',
  'petal_width'],
 'monotone_constraints': [],
 'feature_infos': {'sepal_length': {'min_value': 4.3,
   'max_value': 7.7,
   'values': []},
  'sepal_width': {'min_value': 2, 'max_value': 4.4, 'values': []},
  'petal_length': {'min_value': 1, 'max_value': 6.7, 'values': []},
  'petal_width': {'min_value': 0.1, 'max_value': 2.5, 'values': []}},
 'tree_info': [{'tree_index': 0,
   'num_leaves': 3,
   'num_cat': 0,
   'shrinkage': 1,
   'tree_structure': {'split_index': 0,
    'split_feature': 2,
    'split_gain': 49.12009811401367,
    'threshold': 3.1500000000000004,
    'decision_type': '<=',
    'default_left': True,
    'missing_type': 'None',
    'internal_value': 0.991667,
    'internal_weight': 0,
    'internal_count': 99,
    'left_child': {'leaf_index': 0,
     'leaf_value': 0.9434722218364995,
     'leaf_weight': 36,
     'leaf_count': 36},
    'right_child': {'split_index': 1,
     'split_feature': 2,
     'split_gain': 12.203200340270996,
     'threshold': 4.750000000000001,
     'decision_type': '<=',
     'default_left': True,
     'missing_type': 'None',
     'internal_value': 1.01669,
     'internal_weight': 63,
     'internal_count': 63,
     'left_child': {'leaf_index': 1,
      'leaf_value': 0.9920833333550643,
      'leaf_weight': 28,
      'leaf_count': 28},
     'right_child': {'leaf_index': 2,
      'leaf_value': 1.03636904726958,
      'leaf_weight': 35,
      'leaf_count': 35}}}}],
 'feature_importances': {'petal_length': 2},
 'pandas_categorical': []}

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
蔡能教授，网站特聘专家 2020-09-11 06:54
关注
https://blog.csdn.net/jason160918/article/details/80973448

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

java解析json复杂数据的第四种思路
2024-01-16 11:42

爱码少年 00fly.online的博客接前篇java解析json复杂数据的两种思路java解析json复杂数据的第三种思路我们已经有了解析json数据的几种思路，下面介绍的方法是最少依赖情况下的字符串解析, 流程如图:fill:#333;color:#333;color:#333;fill:none;...
jdbc多表关联查询，多表查询返回结果集处理方法。
2019-07-10 10:19

albort呀的博客不知什么原因原作者在csdn把这篇博客删了来源见百度文库 ... ...该功能常见于两表或者多表关联查询中使用，返回的查询结果是多个（或两个）表中的字段信息，无法使用单个模型来存储时使用，使用...
仓颉之错误传播链，你得学它！
2025-10-29 17:55

喵手的博客最后以FastAPI三服务链路为例，展示了如何在实际开发中实现错误传播追踪，包括结构化错误模型的共享库设计和根因错误的制造与包装。全文旨在帮助开发者将错误传播从黑箱变为可观测、可治理的系统问题。
Chroma 深度剖析：构建下一代 AI 应用的基石
2025-03-11 14:56

喵手的博客 Chroma 是一个开源的向量数据库，用于高效地存储和检索大规模的向量数据。它特别适合处理机器学习、自然语言处理（NLP...无论是在自然语言处理、推荐系统还是计算机视觉中，Chroma 都能提供快速且高效的向量查询服务。
推荐！国外程序员整理的 PHP 资源大全
2016-02-01 00:00

ztguang的博客：语义版本的解析和比较库 NameSpacer -转化下划线到命名空间的库 Patch Installer -使用Composer安装补丁的库 Composer Checker -校验Composer配置的工具 ...
2021 Java面试真题集锦
2021-12-26 22:18

Gavin___Zhang的博客 93 16、CHAR 能不能存中文？ 93 17、谈谈你对泛型的理解？ 93 18、JAVA 程序是怎样运行的？ 94 19、GC ROOT 有哪些? 94 20、栈帧的大小什么时候确定？ 94 21、静态 FILED 声明和构造器哪个先执行？ 95 22、线程创建...
入职第一天，看了公司代码，牛马沉默了...
2024-08-23 07:34

程序员的成长之路的博客打开代码发现问题不断读取配置文件居然读取两个配置文件，一个读一点，不清楚为什么不能一个配置文件进行配置一边获取WEB-INF下的配置文件，一边用外部配置文件进行覆盖，有人可能会问既然覆盖，那可以全在外部...
Python全栈面试题
2019-09-22 03:59

agg7911的博客不吹不擂，你想要的Python面试都在这里了【315+道题】写在前面近日恰逢学生毕业季，课程后期大家“期待+苦逼”的时刻莫过于每天早上内容回顾和面试题问答部分【临近毕业每天课前用40-...
Django Model层字段类型详解
2017-03-16 18:35

刘一痕的博客默认值不能是一个可变对象（模型实例，列表，集合等），作为到同一个实例的参考，该对象将用作所有新的模型实例中的默认值。相反，在一个可调用的对象中封装所需的默认值。例如，如果你有一个自定义JSONField，并...
我了解的软件测试基本概念
2020-04-19 00:21

wtg4452的博客题目汇总共293道题目录 ...3.画出软件测试的V模型图。 10 4.您所熟悉的测试用例设计方法都有哪些？请分别以具体的例子来说明这些方法在测试用例设计工作中的应用。 10 5.请以您以往的实际工作为例...
没有解决我的问题, 去提问

lightgbm json模型结果能否迭代解析转成sql，求教！

2条回答 默认 最新

2条回答默认最新