我利用上述代码进行顺序向前选择时，显示出的评价指标都很完美

# 分离特征和目标变量
y = '23h结果'
X= [x for x in data.columns if x not in [y, '23h结果']]
# 初始化测试集
X_test = data[X].sample(frac=0.2, random_state=42)
y_test = data[y].loc[X_test.index]

# 初始化评价指标列表
mae_list = []
mse_list = []
rmse_list = []
r2_list = []

# 初始化选中特征列表
selected_features = []

for i in range(len(X)):
    mae_min = float('inf')
    mse_min = float('inf')
    rmse_min = float('inf')
    r2_max = float('-inf')
    best_feature = None

    for feature in X:
        # 若特征已经被选中则跳过
        if feature in selected_features:
            continue

        # 加入待选特征
        cur_features = selected_features + [feature]

        # 划分训练集和验证集
        X_train = data[cur_features].dropna()
        y_train = data[y].loc[X_train.index]

        # 构建模型
        model = lgb.LGBMRegressor(random_state=42)
        model.fit(X_train, y_train)

        # 评估模型
        y_pred = model.predict(X_test[cur_features])
        mae = mean_absolute_error(y_test, y_pred)
        mse = mean_squared_error(y_test, y_pred)
        rmse = mean_squared_error(y_test, y_pred, squared=False)
        r2 = r2_score(y_test, y_pred)

        # 记录最佳特征
        if mae < mae_min:
            mae_min = mae
            best_feature = feature
        if mse < mse_min:
            mse_min = mse
        if rmse < rmse_min:
            rmse_min = rmse
        if r2 > r2_max:
            r2_max = r2

    # 记录评价指标
    mae_list.append(mae_min)
    mse_list.append(mse_min)
    rmse_list.append(rmse_min)
    r2_list.append(r2_max)

    # 记录选中特征
    selected_features.append(best_feature)

    # 输出评价指标
    print(f'Round {i + 1}:')
    print(f'Selected Feature: {best_feature}')
    print(f'MAE: {mae_min:.4f}')
    print(f'MSE: {mse_min:.4f}')
    print(f'RMSE: {rmse_min:.4f}')
    print(f'R2: {r2_max:.4f}\n')

我利用上述代码进行顺序向前选择时，为什么我无论用什么数据，显示出的评价指标都很完美，是哪里出现问题了呢？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
妖王辣妹儿 2023-08-31 09:05
关注
可能数据集较小或者本身挺好

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

这一年，这些书：2022年读书笔记
2022-12-31 17:50

Heartsuit的博客 Note: 以下 `markdown` 格式文本由 `json2md` 自动转换生成，可参考[JSON转Markdown：我把阅读数据从MongoDB中导出转换为.md了](https://blog.csdn.net/u013810234/article/details/113360229)了解具体的转换过程。...
一文掌握Prompt：万能框架+优化技巧+常用指标
2024-07-30 08:45

腾讯云开发者的博客目录1 写在前面2 Prompt 万能框架3框架的细化4 在框架上增加更多信息（RAG）5 让大模型更好的思考（CoT）6附加技巧7优化方式及常用指标8 写在最后随着大模型在2023年横空出世，“Prompt 工程”应运而生，作为用好大...
Python机器学习：从入门到精通
2025-07-18 17:01

莲华君的博客当您翻开此书，您正踏入一场数据与智慧的修行。机器学习，并非冰冷的符码，而是机器模拟人类洞察...愿您合上书卷时，收获的不仅是驾驭数据的技能，更有一双洞悉复杂、化繁为简的“智慧之眼”。现在，让我们一同启程。
Python深度学习：从入门到精通
2025-07-21 15:39

莲华君的博客亲爱的读者，欢迎您翻开这本书。我们即将探索的，是深度学习的宇宙——一个由数据、算法与算力构筑的奇妙世界。它既是严谨的科学，也是创造的艺术，更是一条通往未来智慧的修行...来，随我一起，开启这趟非凡的旅程吧。
Python深度学习：从零基础到项目实战
2026-01-04 13:29

莲华君的博客亲爱的读者，欢迎您翻开这本书。我们即将探索的，是深度学习的宇宙——一个由数据、算法与算力构筑的奇妙世界。它既是严谨的科学，也是创造的艺术，更是一条通往未来智慧的修行...来，随我一起，开启这趟非凡的旅程吧。
数据结构与算法（复习向）
2025-12-17 09:44

MeyrlNotFound的博客存储结构：数据元素及其关系在计算机内存中的存储方式，分为顺序存储（如数组）、链式存储（如链表）、索引存储（如哈希表）、散列存储（如字典）。数据结构的核心价值在于 “适配场景”—— 没有绝对最优的结构，...
Python机器学习：从零基础到项目实战
2026-01-04 13:22

莲华君的博客当您翻开此书，您正踏入一场数据与智慧的修行。机器学习，并非冰冷的符码，而是机器模拟人类洞察...愿您合上书卷时，收获的不仅是驾驭数据的技能，更有一双洞悉复杂、化繁为简的“智慧之眼”。现在，让我们一同启程。
golang数据结构与算法学习笔记——基础篇
2023-07-23 17:36

Generalzy的博客从日常的排序和搜索，到复杂的数据压缩、图像处理，再到机器学习中的深度学习算法，算法无处不在。...另外，即便是同一个算法，用不同的语言实现，在不同的计算机上运行，所需要的运行时间都不尽相同。
51c大模型~合集137
2025-06-10 19:19

whaosoft-143的博客下图直观展示了这一现象：在数学推理基准测试 GSM8K（8-shot）上，当与同等规模的自回归模型 Qwen2.5-7B 对比时，两款最近发布的大型掩码扩散模型 Dream-v0-7B 和 LLaDA-8B，在不同的采样步数下，其性能和效率均落后...
BES2000-IK芯片技术详解与应用
2025-07-25 23:19

欧学东的博客 BES2000-IK芯片是专为高性能计算环境设计的处理器，采用了先进的架构设计，集成了多项尖端技术，旨在提供卓越的数据处理...IDE不仅提供代码编辑、编译、调试的集成工作流程，还能提高开发效率、促进代码质量的提升。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月31日

我利用上述代码进行顺序向前选择时，显示出的评价指标都很完美

3条回答 默认 最新

问题事件

3条回答默认最新