代码的运行有一点小问题


import pandas as pd
from sklearn.tree import DecisionTreeRegressor
from sklearn import preprocessing
from sklearn.metrics import mean_squared_error
from sklearn.model_selection import GridSearchCV
# 读取含有热误差数据的CSV文件
train_file = open('data8.csv', encoding='utf-8')
train_df = pd.read_csv(train_file)
train_file = open('date18.csv', encoding='utf-8')
train_df = pd.read_csv(train_file)
# 读取测试集的含有热误差数据的CSV文件
test_file = open('data.csv', encoding='utf-8')
test_df = pd.read_csv(test_file)
 
# 对训练集进行数据预处理
X_train = train_df.iloc[:, :-1]
Y_train = train_df.iloc[:, -1]
X_train_scaled = preprocessing.scale(X_train)
 
# 对测试集进行数据预处理
X_test = test_df.iloc[:, :-1]
Y_test = test_df.iloc[:, -1]
X_test_scaled = preprocessing.scale(X_test, with_mean=X_train_scaled.mean(axis=0)[0], with_std=X_train_scaled.mean(axis=0)[0])
X = pd.concat([test_df.iloc[:, :-1], train_df.iloc[:, :-1]], axis=1)
Y = pd.concat([test_df.iloc[:, -1], train_df.iloc[:, -1]], axis=1)
X_test.columns = X_train.columns

# 创建决策树模型
dt = DecisionTreeRegressor()
 
# 定义网格搜索参数
param_grid = {
    'max_depth': [1,2,3,4,5,6,7,8,9],
    'min_samples_split': [2, 4, 6],
    'min_samples_leaf': [1, 2, 3]
}
# 进行网格搜索优化
grid = GridSearchCV(dt, param_grid, cv=5, error_score='raise')
grid.fit(X, Y)
grid_search = GridSearchCV(DecisionTreeRegressor(), param_grid, cv=5)
grid_search.fit(X_train, Y_train)
best_model = grid_search.best_estimator_


# 输出最优参数和模型得分
print('Best Parameters:', grid.best_params_)

# 定义新的温度数据

# 输出预测结果
Y_pred = best_model.predict(X_test)
mse = mean_squared_error(Y_test, Y_pred)
print(f"MSE: {mse:.4f}")
print(Y_pred)
X_test = pd.concat([X_train, X_test], axis=0, ignore_index=True)

下面的问题怎么解决

alueError: Input X contains NaN.
DecisionTreeRegressor does not accept missing values encoded as NaN natively. For supervised learning, you might want to consider sklearn.ensemble.HistGradientBoostingClassifier and Regressor which accept missing values encoded as NaNs natively. Alternatively, it is possible to preprocess the data, for instance by using an imputer transformer in a pipeline or drop samples with missing values. See https://scikit-learn.org/stable/modules/impute.html You can find a list of all estimators that handle NaN values at the following page: https://scikit-learn.org/stable/modules/impute.html#estimators-that-handle-nan-values

展开全部

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
守时间的孤岛 2023-04-21 03:13
关注
该回答引用chatgpt:
该代码运行出现了ValueError: Input X contains NaN的错误，说明输入的X数据中存在NaN值，而DecisionTreeRegressor不支持包含NaN值的输入数据。解决方法有两种：

对数据进行预处理，填充或删除缺失值。
可以使用sklearn中的Imputer来填充缺失值。
可以使用dropna()方法来删除含有NaN值的行。
使用支持处理NaN值的模型，例如sklearn.ensemble.HistGradientBoostingClassifier和sklearn.ensemble.HistGradientBoostingRegressor。这些模型可以原生支持含有NaN值的输入数据

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报
编辑

预览
轻敲空格完成输入
显示为

卡片

标题

链接
评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

编辑

预览

报告相同问题？

关注问题

android代码的一点小问题 android
2016-04-26 01:48

回答 4 已采纳你的想法如果在mCurrentIndex小于4的时候是没有问题的，但是当mCurrentIndex=4的时候，你想的就有问题了，他这里用%是为了做一个循环，当达到最大后又从0开始了
C++语言编程最大子段和 c++
2018-04-17 22:49

回答 4 已采纳 ``` 也可以用DP #include #include int main() { int count; int a[100];
VB编程语言中关于new的用法问题
2016-03-31 02:36

回答 1 已采纳 VB6中新建类模块的对象，com对象，才需要用new，对于结构体或者简单类型，则不需要。和指针没有什么关系。
从 NASL 说开：低代码编程语言能饭否
2022-11-22 00:30

石臻臻的杂货铺的博客回头看Gartner的定义，也有LCAP（低代码平台）和CADP（无代码平台）之分，前者对开发完整性、应用独立性、逻辑完备性、可接入可集成等都有要求，所以说，NASL的实现使得轻舟低代码更符合这一理念。说到框架，大家...
有关matlab的一些基础编程问题 matlab 开发语言极限编程
2021-07-27 07:38

回答 1 已采纳你前面只有一个圆环，后面又出现10个圆环，表述十分混乱
编程问题 C C#语言最好能给出代码，求大神！
2016-03-18 18:49

回答 2 已采纳 // 1 ``` #include #include const int M=100005; bool prime[M]; void get_prime() {
Python编程语言中:f的含义 python 开发语言
2021-11-05 09:43

回答 3 已采纳 f-string采用 {content:format} 设置字符串格式，其中 content 是替换并填入字符串的内容，可以是变量、表达式或函数等，format 是格式描述符.具体函数可以参考看
2020 年最牛逼的 10 门编程语言
2020-08-20 06:21

沉默王二的博客先来个简要的概括： Java，服务器端最好的编程语言 C++，最通用的编程语言 C，迄今为止，最值得信任的编程语言 Python，AI（人工智能）、机器学习方向最佳的编程语言 JavaScript，客户端最常用的脚本语言 C#，微软...
C++语言编程子集和问题（回溯法解）注意用C++啊 c++
2018-05-01 07:55

回答 2 已采纳 ``` #include #include #include #include using namespace std; int n,c,a[10000],b
李峋爱心代码，这个问题怎么解决 python
2022-11-10 01:47

回答 2 已采纳大写Y改小写
为什么代码都可以运行了，还显示绿色，然后报错？ r语言有问必答
2022-02-24 02:31

回答 3 已采纳 python是解释性的语言你写个错误的语法，也能运行，并不像c语言那样有语法错误就拒绝给你编译至于为什么会显示绿色是因为你前面的引号用法错误导致后面的代码其实都在引号里，是字符串的一部分
多种编程语言运行速度排名-10亿次除7求余数为0的数量
2023-08-21 08:48

专注VB编程开发20年的博客比如10亿次加法，40种编程语言比较哪个快一点就是找个算法，比较不同编程语言速度相差多少比如10亿次加法，40种编程语言比较哪个快一点
Java编程思想21章的同步代码块问题 java
2018-05-04 15:37

回答 3 已采纳用lock实现同步是没有问题的，你第二个程序出问题是因为锁不同的原因。你第一个程序有两个锁，而你第二个程序有四个锁，getPair方法是同步方法。第一个例子中，程序执行了x++之后，如果发生了线程状态
2023十大最牛编程语言排行榜以及各语言的优缺点
2023-07-26 22:00

哈哥撩编程的博客我们掌握不了所有的编程语言，但我们掌握的语言越多，在未来的发展与可塑性上就越强，就越容易受到企业的青睐，如果是作为自由开发者的话，也就越会有客户和开发团队与我们合作。考虑到这一点，希望各位小伙伴能...
初学编程不知道怎么选？推荐学习的三种热门编程语言
2024-07-13 09:11

小尤笔记的博客在当今的社会需求下，市场上最常见、最受欢迎、最广泛应用的编程语言主要有三种：C语言、Java语言和Python语言。既然要做出选择，我们就需要明白这三种编程语言各自有何特点和区别。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 4月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 4月21日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月21日

代码的运行有一点小问题

3条回答 默认 最新

问题事件

3条回答默认最新