python 涉及循环的问题

Python问题，想实现这样一段代码，大家帮忙看看错误。

导入所需的库。
设置要处理的文件夹路径（dir_path）。
遍历文件夹中的所有Excel文件。
对每个Excel文件中的工作表执行以下操作：
a. 按照表的顺序读取Excel文件
b. 对数据进行预处理（排序、切分训练和测试集）（除最后一张表外的表前3/4为训练集，后1/4为测试集，最后一张表除最后一行外前3/4为训练集，后1/4为测试集）
c. 对第一个工作表（第一个文件）进行超参数调整，以选择最佳的XGBoost模型。
d. 依次对其他工作表应用已选定的XGBoost模型，读取到最后一个工作表时进行预测。
e. 评估模型性能（均方根误差、平均绝对误差和R²得分）。
f. 将结果输出到控制台。
画出特征重要性图。
当所有工作表处理完成后，打印"程序结束"。

代码如图所示

import os
import pandas as pd
import xgboost as xgb
from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score
from sklearn.model_selection import GridSearchCV
from xgboost import plot_importance
import matplotlib.pyplot as plt
import numpy as np
dir_path = 'F:/Test/Test/Test/Test/Test'
excel_files = [os.path.join(dp, f) for dp, dn, filenames in os.walk(dir_path) for f in filenames if f.endswith('.xlsx')]
for file in excel_files:
    xls = pd.ExcelFile(file)
    df_old = pd.DataFrame()
    for sheet_name in xls.sheet_names:
        df = pd.read_excel(xls, sheet_name=sheet_name)
        df = df.sort_values(by='日期')
        testing_cutoff = int(0.75 * len(df))
        train_df, test_df = df[:testing_cutoff], df[testing_cutoff:]

        if sheet_name == xls.sheet_names[0] and file == excel_files[0]:
            x_train, y_train = train_df.iloc[:, 6:21], train_df.iloc[:, 21]
            x_test, y_test = test_df.iloc[:, 6:21], test_df.iloc[:, 21]
            #超参数调整
            params = {
                'learning_rate': [0.01, 0.05, 0.1, 0.2, 0.3],
                'max_depth': [3, 4, 5, 6, 7],
                'n_estimators': [50, 100, 150, 200, 250],
                'gamma': [0, 0.01, 0.05, 0.1, 0.2],
            }
            # 创建XGB回归器实例
            xgb_model = xgb.XGBRegressor(objective='reg:squarederror')
            # 创建网格搜索实例
            grid_search = GridSearchCV(xgb_model, params, scoring='neg_mean_squared_error', cv=5)
            #使网格搜索适合训练数据
            grid_search.fit(x_train, y_train)
            # 从网格搜索中检索最佳模型
            xgb_model = grid_search.best_estimator_
        else:
            if sheet_name == xls.sheet_names[-1]:  # 检查这是否是当前Excel文件中的最后一张工作表
                x_train, y_train = df.iloc[:, 6:21], df.iloc[:, 21]  # 训练集
                x_p = df.iloc[-1, 6:21]  # 最后需要练习的数据为测试集
                x_test, y_test = df.iloc[:-1, 6:21], df.iloc[:-1, 21]  # 使用除最后一行以外的所有行作为测试集
            else:
                x_train, y_train = train_df.iloc[:, 6:21], train_df.iloc[:, 21]
                x_test, y_test = test_df.iloc[:, 6:21], test_df.iloc[:, 21]

            df = pd.concat([df_old, df], ignore_index=True)
            df = df.sort_values(by='日期')
            testing_cutoff = int(0.75 * len(df))
            train_df, test_df = df[:testing_cutoff], df[testing_cutoff:]
            x_train, y_train = train_df.iloc[:, 6:21], train_df.iloc[:, 21]
            x_test, y_test = test_df.iloc[:, 6:21], test_df.iloc[:, 21]
            xgb_model.fit(x_train, y_train)

        y_pred = xgb_model.predict(x_test)
        y_p = xgb_model.predict(np.array([x_p]))[0]
        mse = mean_squared_error(y_test, y_pred)
        mae = mean_absolute_error(y_test, y_pred)
        r2 = r2_score(y_test, y_pred)
        df_old = df.copy()
        if sheet_name == xls.sheet_names[-1]:  # 检查这是否是当前Excel文件中的最后一张工作表
            print(f"Final metrics for {sheet_name} in file {file}:")
            print(f"Final metrics: RMSE: {np.sqrt(mse):.5f}, MAE: {mae:.5f}, R^2: {r2:.5f}")
            print(f"预测收益率为: rp: {y_p:.5f}")
        else:
            pass
    plot_importance(xgb_model)
    plt.show()
print("程序结束")

报错的原因是x_p未命名，应该和循环赋值有关，我改了半天很能实现我想要的效果，希望大家能帮帮我

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
阳光宅男xxb 2023-05-31 08:38
关注
你的x_p这个变量是在内层第二个循环里面申明使用的，但是你再循环外面又想使用x_p，导致报错x_p未命名，如果你想使用x_p，那就需要在第二循环外面先申明x_p = []

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python编程解决问题 python 有问必答
2021-06-09 20:56

回答 2 已采纳 import random a=[] sum=0 max=0 min=1000 for i in range(20): a.append(random.randint(1,999))
利用for循环进行python编程 python
2021-11-23 18:45

回答 1 已采纳 for i in range(1,5): for j in range(0,4 - i): print(end =" "); for k in range(0,2*
python循环小数精度问题 python 机器学习
2022-07-07 02:07

回答 4 已采纳你可以把具体的题目贴一下，然后看看到底是个什么情况，为什么不能用decimal，因为16位以后除了decimal也没有其他好的办法去控制精确度了
少儿编程Python课件
2023-09-24 09:29

首先，01【认识Python.pptx】这部分，孩子们会了解到Python编程语言的起源、特点以及在实际中的应用。Python以其简洁易读的语法和强大的功能，成为初学者入门编程的理想选择。孩子们将学习如何安装Python环境，并...
Python编程语言中:f的含义 python 开发语言
2021-11-05 17:43

回答 3 已采纳 f-string采用 {content:format} 设置字符串格式，其中 content 是替换并填入字符串的内容，可以是变量、表达式或函数等，format 是格式描述符.具体函数可以参考看
python selenium 循环打开关闭网页问题 python selenium 有问必答
2021-04-06 22:52

回答 3 已采纳 import time from selenium import webdriver for i in range(5): wb = webdriver.Ie() #浏览器窗口关闭后要重新创
Python编程语言 list python 有问必答
2021-12-29 11:00

回答 2 已采纳 import random n=int(input()) list=[] for i in range(n): list.append(random.randint(1,200)) print
核桃编程python课程体系.docx
2023-06-13 21:12

核桃编程的Python课程体系是一套全面且层次分明的教育方案，旨在帮助初学者逐步掌握Python编程的核心技能，提升解决问题的能力。课程设计上注重实践与理论的结合，通过一系列专题课程，使学习者能够逐步深入理解...
python循环问题 python 有问必答
2022-03-11 16:07

回答 4 已采纳 n = 0 year = 1900 while year < 2022: if year % 4 == 0 and year % 100 != 0: print(n,
Python 中for循环如何不换行 python
2022-04-03 09:50

回答 2 已采纳 favorite_languages={ 'Mike':['Java',20], 'Tracy':['C++',21], 'Jack':['Python',19], } for name,lang
python while循环问题 python
2018-11-12 06:33

回答 4 已采纳死循环了，你i一下正，一下负，还加一怎么也不会超过100，你是想奇数减，偶数加的话直接s-=i，s+=i
python趣味编程100例（99个）
2023-09-28 11:27

Python是一种广泛使用的高级编程语言，以其易读性、简洁的语法和强大的功能而闻名。"Python趣味编程100例（99个）"是一个集合，包含了一系列精心设计的Python编程练习，旨在帮助初学者和有经验的程序员通过实践来...
Python大学编程问题(竖向输出) python
2022-05-23 20:37

回答 1 已采纳 a = int(input()) for i in str(a): b = [i]*9 print("\t\t".join(b))
高中信息技术Python语言编程教学实践.pdf
2023-06-14 12:20

Python因其简洁明了的语法特性，成为许多高中阶段的信息技术课程首选的编程语言。教学实践中，教师需要根据学生的知识背景和兴趣，制定有效的教学策略。首先，教学应遵循层次设计的原则。Python语言的基础部分包括...
高中信息技术Python语言编程教学实践.docx
2023-06-14 12:20

此外，Python生态圈的学习是其独特之处，涉及到利用丰富的第三方库进行高效编程。在高中阶段，通常会将编程基础作为必修课程，而生态圈相关的高级内容则作为选修，鼓励学生按照个人兴趣深入探索。 2. **内容分化** ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月31日

悬赏问题

¥15 CPU卡指令整合指令数据都在图片上
¥15 火车票关联12306问题
¥15 odoo17处理受托加工产品
¥15 如何用MATLAB编码图三的积分
¥15 圆孔衍射光强随孔径变化
¥15 MacBook pro m3max上用vscode运行c语言没有反应
¥15 ESP-PROG配置错误，ALL ONES
¥15 结构功能耦合指标计算
¥50 AI大模型精调（百度千帆、飞浆）
¥15 非科班怎么跑代码？如何导数据和调参

python 涉及循环的问题

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新