深度学习kaggle房价预测比赛代码询问

以下是我的代码，还没有写到预测部分只写到训练部分，请问显示代码没问题为何没有显示训练和拟合的结果和图像呢？


import matplotlib.pyplot as plt
import torch
import torch.nn as nn
import numpy as np
import  pandas as pd
import sys
import torchvision
import torchvision.transforms as transforms
sys.path.append("C:/Users/zyx20/Desktop/深度学习编程/pythonProject")
import d2lzh_pytorch as d2l

print(torch.__version__)
torch.set_default_tensor_type(torch.FloatTensor)

train_data=pd.read_csv("C:/Users/zyx20/Desktop/kaggle房价预测/train.csv")
test_data=pd.read_csv("C:/Users/zyx20/Desktop/kaggle房价预测/test.csv")

train_data.shape
test_data.shape

#将所有训练数据和测试数据的79个样本连结
all_features=pd.concat((train_data.iloc[:,1:-1],test_data.iloc[:,1:-1]))
#对连续数值的特征做标准化
numeric_features=all_features.dtypes[all_features.dtypes != 'object'].index
all_features[numeric_features]=all_features[numeric_features].apply(lambda x:(x-x.mean())/(x.std()))
all_features=all_features.fillna(0)

#将离散数值转成指示特征
all_features=pd.get_dummies(all_features,dummy_na=True)
all_features.shape

n_train=train_data.shape[0]
train_features=torch.tensor(all_features[:n_train].values,dtype=torch.float)
test_features=torch.tensor(all_features[n_train:].values,dtype=torch.float)
train_labels=torch.tensor(train_data.SalePrice.values,dtype=torch.float).view(-1,1)

#训练模型
loss=torch.nn.MSELoss()

def get_net(feature_num):
    net=nn.Linear(feature_num,1)
    for param in net.parameters():
        nn.init.normal_(param,mean=0,std=0.01)
    return net

#定义用来评价模型的对数均方根误差
def log_rmse(net,features,labels):
    with torch.no_grad():
        #将小于1的值设置为1，使得取对数时数值更稳定
        clipped_preds=torch.max(net(features),torch.tensor(1.0))
        rmse=torch.sqrt(2*loss(clipped_preds.log(),labels.log()).mean())
    return rmse.item()

def semilogy(x_vals,y_vals,x_label,y_label,x2_vals=None,y2_vals=None,legend=None,figsize=(3.5,2.5)):
    d2l.set_figsize(figsize)
    d2l.plt.xlabel(x_label)
    d2l.plt.ylabel(y_label)
    d2l.plt.semilogy(x_vals,y_vals)
    if x2_vals and y2_vals:
        d2l.plt.semilogy(x2_vals,y2_vals,linestyle=':')
        d2l.plt.legend(legend)

#定义训练函数
def train(net,train_features,train_labels,test_features,test_labels,num_epochs,learning_rate,weight_decay,batch_size):
    train_ls,test_ls=[],[]
    dataset=torch.utils.data.TensorDataset(train_features,train_labels)
    train_iter=torch.utils.data.DataLoader(dataset,batch_size,shuffle=True)
    optimizer=torch.optim.Adam(params=net.parameters(),lr=learning_rate,weight_decay=weight_decay)
    for epoch in range(num_epochs):
        for X,y in train_iter:
            l=loss(net(X.float()),y.float())
            optimizer.zero_grad()
            l.backward()
            optimizer.step()
        train_ls.append(log_rmse(net,train_features,train_labels))
        if test_labels is not None:
            test_ls.append(log_rmse(net,test_features,test_labels))
    return train_ls,test_ls

#K折交叉验证
def get_k_fold_data(k,i,X,y):
    assert k>1
    fold_size=X.shape[0]//k
    X_train,y_train=None,None
    for j in range(k):
        idx=slice(j * fold_size,(j + 1) * fold_size)
        X_part,y_part=X[idx,:],y[idx]
        if j==i:
            X_valid,y_valid=X_part,y_part
        elif X_train is None:
            X_train, y_train =X_part,y_part
        else:
            X_train=torch.cat((X_train,X_part),dim=0)
            y_train = torch.cat((y_train, y_part), dim=0)
    return X_train,y_train,X_valid,y_valid


#在K折交叉验证中我们训练K次并返回训练和验证的平均误差
def k_fold(k,X_train,y_train,num_epochs,learning_rate,weight_decay,batch_size):
    train_l_sum,valid_l_sum=0,0
    for i in range(k):
        data=get_k_fold_data(k,i,X_train,y_train)
        net=get_net(X_train.shape[1])
        train_ls,valid_ls=train(net,*data,num_epochs,learning_rate,weight_decay,batch_size)
        train_l_sum += train_ls[-1]
        valid_l_sum += valid_ls[-1]
        if i ==0:
            semilogy(range(1,num_epochs + 1),train_ls,'epochs','rmse',range(1,num_epochs + 1),valid_ls,['train','valid'])
        print('fold %d,train rmse %f,valid rmse %f' % (i,train_ls[-1],valid_ls[-1]))
    return train_l_sum/k,valid_l_sum/k

plt.show()

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 优质创作者: 编程框架技术领域 2024-02-07 18:32
关注
引自免费微信小程序：皆我百晓生

您提供的代码中包含了数据预处理、模型定义、损失函数计算、训练过程以及K折交叉验证的过程。然而，这段代码并没有执行任何训练和拟合操作，也没有显示训练结果和图像。

要查看训练和验证的损失变化图像，需要在k_fold函数之后调用训练函数，并且在每次训练迭代完成后，将训练和验证损失添加到train_ls和valid_ls列表中。然后，在训练结束后，调用semilogy函数绘制结果图像。

以下是修改后的代码段，包含实际训练过程：

# 设置超参数 num_epochs = 100 learning_rate = 0.001 weight_decay = 0.001 batch_size = 32 # 运行K折交叉验证并绘制结果 k = 5 train_l_avg, valid_l_avg = k_fold(k, train_features, train_labels, num_epochs, learning_rate, weight_decay, batch_size) # 显示图像（此处在K折交叉验证循环外部调用semilogy） plt.show()

请注意，由于你没有提供测试集标签test_labels，所以在train函数中针对测试集的部分不会有任何输出。如果想看到K折交叉验证后每个折的验证损失，你需要确保在k_fold函数内部调用semilogy来实时绘图。

此外，你的原始代码中还有一个问题：train函数中的if test_labels is not None:判断条件在当前环境下永远不会为真，因为在调用k_fold时并未传入test_labels。如果你想在K折交叉验证过程中观察测试集的表现，你需要在k_fold函数里调整逻辑，确保在每一轮折叠中都能使用未参与训练的数据进行验证预测。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Kaggle深度学习挑战赛——房价预测 (数据科学系列教程)
2023-09-02 12:21

光子AI的博客幸运的是，有了深度学习框架和高效的计算能力，机器学习模型已经可以在许多领域取得惊人的成果。在过去的几年里，很多数据科学家都参加或者尝试过Kaggle竞赛。这些竞赛涉及到不少不同类型的数据处理问题，比如图像...
深度学习 ＜实战Kaggle比赛：预测房价＞代码分析跟李沐学AI
2023-02-28 17:02

Rondox的博客 4.10. 实战Kaggle比赛：预测房价 — 动手学深度学习 2.0.0 documentation 若有错误请指出一.数据处理部分 1.下载部分没啥好说的 import hashlib import os import tarfile import zipfile import requests #@save...
内含kaggle数据集house price predict数据集的房价预测代码
2024-06-14 12:15

2. **FCN房价预测**：全连接神经网络是一种深度学习模型，常用于图像处理，但在本案例中被应用于回归问题。FCN通过多层权重矩阵学习特征表示，然后预测连续的房价值。`FCNtrain.py`可能是训练FCN模型的脚本。 3. **...
动手学深度学习---实战Kaggle比赛：预测房价
2024-12-12 13:15

向云端UP的博客本文介绍了如何通过实战Kaggle比赛来预测房价，主要步骤包括数据预处理、特征工程、模型选择与训练以及模型评估。首先，对数据进行清洗与缺失值处理，提取并转换数值和类别特征。然后，使用PyTorch构建多层感知机...
Kaggle-House-Price竞赛完整代码，已成功
2021-12-24 22:43

而深度学习模型则能处理复杂的非线性，但训练时间较长且容易过拟合。模型训练过程中，我们需要将数据集划分为训练集、验证集和测试集。训练集用于训练模型，验证集用于调整模型参数（调参），测试集则在模型选定后...
基于PyTorch深度学习框架构建的融合卷积神经网络与长短期记忆网络并集成注意力机制的多特征时间序列预测模型项目_该项目利用Kaggle房价预测数据集通过PyTorch实现CNN.zip
2026-02-20 19:21

在本项目中，所使用的Kaggle房价预测数据集提供了丰富多维的特征，包括但不限于房屋位置、建造年代、房屋面积等，这些特征都可能影响房价。通过将CNN与LSTM融合，并加入注意力机制，模型能够更有效地从这些多维特征...
动手学DP | 实战 Kaggle 比赛：房价预测
2023-11-24 14:35

好好学习的小陈的博客动手学深度学习第一部分结束，记录一下编程逻辑及存在问题。Kaggle链接根据给出的特征，预测对应的房价，特征包括房子类型、临街宽度、各层的面积等等，有整数、离散值、浮点数，存在缺失值。 1 观察数据 1.1 ...
新手打kaggle需要什么基础，需要掌握语言到什么程度?
2025-07-15 11:16

AI规划师-南木的博客我们的教学实践表明，Python是Kaggle最友好的语言，其核心库的掌握程度直接决定项目效率。以下从基础能力、语言要求、实战路径三个维度展开，结合我们的教学经验给出可落地的解决方案。，学员可快速掌握这些核心能力...
沐神动手学深度学习-kaggle比赛：房价预测
2024-10-09 16:13

梦姐的编程日志的博客运行沐神的房价预测代码时出现的错误
零基础小白30天入门Kaggle比赛指南！
2025-08-09 14:13

AI规划师-南木的博客 Kaggle对新手的价值，不是拿奖金，而是提供一个“真实的数据科学练兵场”——在这里，你能遇到实际工作中会碰到的问题（缺失值、数据泄露、过拟合），能看到别人是怎么解决的，这种“在实践中学习”的效率，比看10本...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月7日

深度学习kaggle房价预测比赛代码询问

4条回答 默认 最新

问题事件

4条回答默认最新