使用XGboost在回归任务中沙宣特征出现“标签必须是正数”的错误


import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import seaborn as sns
from sklearn.svm import SVR
from sklearn.preprocessing import scale
from sklearn.neural_network import MLPRegressor
from sklearn.ensemble import RandomForestRegressor
from sklearn.model_selection import train_test_split
from sklearn.feature_selection import SelectKBest, f_regression
from sklearn.linear_model import LinearRegression, Ridge, Lasso
from sklearn.feature_selection import chi2, f_classif, mutual_info_classif
import xgboost as xgb
from xgboost import plot_importance
from sklearn.datasets import load_boston

# 设置输出结果不带省略号
pd.set_option('display.max_colwidth', 1000)
pd.set_option('display.max_columns', 1000)
pd.set_option('display.width', 1000)
np.set_printoptions(threshold=10000)
np.set_printoptions(threshold=10000)

# 加载数据
train_csv = pd.read_csv('train.csv')
test_csv = pd.read_csv('test.csv')
sample_submission_csv = pd.read_csv('sample_submission.csv')
# print(train_csv.head(5))

# 预处理数据
print(train_csv.shape, '\n', test_csv.shape, '\n', sample_submission_csv.shape, '\n')
print(train_csv.isnull().sum(), '\n', test_csv.isnull().sum(), '\n', sample_submission_csv.isnull().sum(), '\n')
print(train_csv.dtypes)
print(train_csv['loss'].value_counts())
# print(train_csv.describe())
'''plt.figure(figsize=(12, 10))
ax = sns.heatmap(train_csv.corr())
fig = plt.figure(figsize=(30, 25))
ax = fig.gca()
train_csv.hist(ax=ax)
plt.show()'''

# 初步选取特征
train_csv_feature = train_csv.drop('id', axis=1)
test_csv_feature = test_csv.drop('id', axis=1)
# print(train_csv_feature.head(5))

# 划分训练集和测试集
train_data = train_csv_feature.drop('loss', axis=1)
test_data = train_csv_feature.iloc[:, train_csv_feature.columns == 'loss']
X_train, X_test, y_train, y_test = train_test_split(train_data, test_data, test_size=0.2)
X_train = np.array(X_train)
X_test = np.array(X_test)
y_train = np.array(y_train)
y_test = np.array(y_test)
print(X_train.shape, '\n', X_test.shape, '\n', y_train.shape, '\n', y_test.shape)
print(y_train)


model = xgb.XGBRegressor(max_depth=5, learning_rate=0.1, n_estimators=160, silent=True, objective='reg:gamma')
model.fit(X_train, y_train)

# 对测试集进行预测
ans = model.predict(X_test)

# 显示重要特征
plot_importance(model)
plt.show()

数据：

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-kaily 2021-08-06 09:54
关注
你可以看一下你的label里面有没有缺失值
试一下将缺失值赋值为0：y_train[np.isnan(y_train)] = 0，看看还报错吗？

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

简说目前市面上最流行的“AI Agentic”
2024-09-08 11:05

水中飞月的博客 AI Agentic是未来，业界认为AI Agentic是AI应用落地的核心技术框架。一切AI类应用都应该围绕Agentic Workflow开发。那么什么是AI Agentic呢？什么又是Agentic Workflow。此文以丰富的知识、案例，同时以接地气的白话...
李彦宏百度世界最新演讲：智能体是AI应用的最主流形态，即将迎来爆发点
2024-11-12 18:04

财经三剑客的博客 “过去24个月，AI行业发生的最大变化是什么？是大模型基本消除了幻觉。”
专题资料（2021-2022年）41 沙宣品牌全国推广活动 ——宝洁沙宣品牌管理案例.doc
2021-10-07 20:22

【沙宣品牌全国推广活动——宝洁沙宣品牌管理案例】是宝洁(中国)有限公司与爱德曼国际公关(中国)有限公司合作的一次大型品牌推广活动，旨在将沙宣品牌推向全国市场。该活动的核心在于通过发型展示会、媒体宣传和与各...
沙宣产品年度促销计划.doc
2021-09-26 12:25

在2001年，沙宣品牌推出了全新的深层洁净洗发露产品，为了确保这一新产品的市场成功，林普整合营销传播机构为沙宣设计了一份全面的年度促销计划。这份计划的核心目标是提高沙宣深层洁净洗发露的市场知名度，增加销售...
CNNIC报告：文心一言登顶中国生成式AI使用率榜首占比达11.5%
2024-12-03 15:47

技术领导力的博客如智慧交通领域，贵阳市公安交通管理局选取观山湖核心区域的31个重要交通节点落地智能信控，...在生成式人工智能产品应用上，CNNIC报告显示，对话类产品因其广泛的适用性而受到了最多用户的青睐，占据了62%的市场份额。
eas软标签_商品防盗系统EAS软标签使用操作规范
2020-12-21 13:44

weixin_39867559的博客一、培训前的准备工作：1、准备相应的培训资料(预计商场参加培训人员的数量)2、准备商品防盗系统EAS标签样品：软标签10张；奶粉绑带一条；酒瓶绑带一条；小圆硬标一个(15762A)；简易绑带一条；3、商场方面配合：提供...
中英文商标的命名与翻译-论文.docx
2025-10-13 23:56

从中西方文化差异的角度出发，通过对中英文商标实例的分析，本文概述了商标词的来源、特征及其翻译原则，介绍了几种常用的商标翻译方法，并就其中存在的一些问题进行了探讨。希望本文的研究能为商标翻译工作提供一定...
宝洁沙宣产品市场推广策略分析.doc
2021-09-21 11:19

【宝洁沙宣产品市场推广策略...综合以上分析，宝洁沙宣的市场推广策略需兼顾品牌建设、产品教育、消费者心理引导和销售促进等多个方面，以确保新产品能够在激烈的市场竞争中脱颖而出，实现销售目标和品牌忠诚度的提升。
宝洁商战沙宣营销策划案.doc
2021-12-17 09:05

【宝洁商战沙宣营销策划案】一、市场状况分析洗护发用品行业是个人护理产品领域的重要组成部分，目前正处于快速发展阶段。随着消费者对生活质量的要求提高，对头发护理的关注度也日益增加。行业现状分析表明，...
宝洁沙宣产品年度促销计划
2020-12-12 08:43

在IT行业中，尤其是在市场营销领域，年度促销计划是企业规划销售策略和提高品牌影响力的重要环节。宝洁沙宣作为全球知名的日化品牌，其年度促销计划无疑具有极高的学习和参考价值。下面，我们将深入探讨宝洁沙宣产品...
沙宣深层洁净洗发露上市年度促销计划.doc
2021-10-12 20:02

在洗发水市场竞争激烈的环境中，沙宣品牌计划推出新产品——深层洁净洗发露。该计划由林普整合营销传播机构于2001年制定，旨在应对市场挑战并抓住新机遇。市场背景分析： 1. 各大品牌竞相推出独特卖点（USP），以...
专题资料（2021-2022年）宝洁沙宣品牌管理案例.doc
2021-10-08 05:01

宝洁公司作为全球著名的日用品和快消品生产者，在中国市场上的表现尤为引人注目，尤其是其对旗下品牌沙宣的管理案例，更是品牌管理领域的经典。本案例发生在1998年，宝洁决定将沙宣品牌推向中国全国市场，通过一系列...
沙宣深层洁净洗发露上市策划实施方案书.doc
2021-10-21 15:31

在2001年的洗发水市场，中高档次的竞争尤为激烈。各大品牌通过推出独特的卖点（USP）来稳固各自占据的细分市场，同时通过扩展产品线或增强产品功能以巩固既有地位。挖掘新的USP成为各品牌寻求市场细分和争取新消费者...
专题资料（2021-2022年）089宝洁沙宣品牌全国推广活动.doc
2021-10-08 03:21

【宝洁沙宣品牌全国推广活动】是宝洁(中国)有限公司在1998年进行的一项重要市场拓展策略，旨在将沙宣品牌推向全国，树立其在美发护发领域的专家形象。此次活动由宝洁公司与爱德曼国际公关（中国）有限公司合作策划和...
专题资料（2021-2022年）宝洁沙宣产品年度促销计划.doc
2021-10-08 05:01

【知识点详解】 1. **市场背景与竞争态势**： ...以上分析涵盖了市场分析、品牌策略、目标群体定位以及产品推广策略等多个方面，旨在通过有效的市场营销手段，推动沙宣深层洁净洗发露在竞争激烈的市场中获得成功。
2021-2022收藏的精品资料2021-2022年宝洁沙宣产品年度促销计划.doc
2021-09-16 06:48

文档中的内容涉及的是宝洁公司旗下沙宣品牌在2001年度针对新产品——沙宣深层洁净洗发露的市场分析、SWOT分析、推广目标和策略，以及目标消费群定位。以下是这些知识点的详细说明： 1. **市场背景**：在中高档次...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 8月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 8月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 8月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 8月6日
展开全部

使用XGboost在回归任务中沙宣特征出现“标签必须是正数”的错误

1条回答 默认 最新

问题事件

1条回答默认最新