C医生 2019-03-16 01:05 采纳率: 0%
浏览 479

关于如何设置dummy而不影响X,y的问题

本人初学者,接触机器学习才个把月,不会写代码,到处复制黏贴,
学网上教程用df=pd.read_csv(本地路径)来打开数据集,
然后定义:
X = df.iloc[:,0:30]
y = df.iloc[:,[30]]
然后用train_test_split来抽样分训练和测试,这里碰到关于get_dummy的问题,
数据集里有很多无序类别,想用dummy转化,
但是get_dummy后,维度就增加了,特征也多了,y就不在原来[30]的位置上了,
等于target错了,整个模型结果都错了。
如果在定义X,y后再dummy,
也就是:
1.X = df.iloc[:,0:30]
y = df.iloc[:,[30]]
2.get_dummy
3.train_test_split,
这样的顺序好像dummy和后面的模型又没关系了,有没dummy结果跑出来一样。
请教下各位老师该如何处理dummy?
顺便问下,关于dummy,
所有的数据在放入模型跑前都要转换吗?最近在用xgboost,看网上的教程都没有转化,是xgboost不需要转化类别数据吗?

  • 写回答

0条回答

    报告相同问题?

    悬赏问题

    • ¥15 安卓adb backup备份应用数据失败
    • ¥15 eclipse运行项目时遇到的问题
    • ¥15 关于#c##的问题:最近需要用CAT工具Trados进行一些开发
    • ¥15 南大pa1 小游戏没有界面,并且报了如下错误,尝试过换显卡驱动,但是好像不行
    • ¥15 没有证书,nginx怎么反向代理到只能接受https的公网网站
    • ¥50 成都蓉城足球俱乐部小程序抢票
    • ¥15 yolov7训练自己的数据集
    • ¥15 esp8266与51单片机连接问题(标签-单片机|关键词-串口)(相关搜索:51单片机|单片机|测试代码)
    • ¥15 电力市场出清matlab yalmip kkt 双层优化问题
    • ¥30 ros小车路径规划实现不了,如何解决?(操作系统-ubuntu)