请问为什么python决策树运行结果会出现restart shell

如图

以下是代码

import numpy as np
import pandas as pd
from pandas import DataFrame,Series
from sklearn.ensemble import RandomForestRegressor
from sklearn import tree
import seaborn as sns
import rpy2.robjects as ro
from rpy2.robjects.packages import importr
from rpy2.robjects import numpy2ri
from rpy2.robjects import pandas2ri
from rpy2.robjects.conversion import localconverter
from sklearn.model_selection import cross_val_predict




save_path=r"E:\研究生资料\数据清洗\CGSS\CGSS2010\df_result.csv"
path=r"E:\研究生资料\数据清洗\CGSS\CGSS2010\df_estima.csv"
varimp_path=r"E:\研究生资料\数据清洗\CGSS\CGSS2010"
df=pd.read_csv(path,index_col=0)

df=df[df["income"]>0]
df.index=np.arange(len(df))


#-------------------------描述性统计-------------------------



#生成虚拟变量：

init_var=list()

dumm_var=["fedu","fwork","ftype","medu","mtype",
          'mwork'
          ]

for i in dumm_var:
    df=pd.concat([df,pd.get_dummies(df[i],prefix=i)],axis=1)


remove_var=['id','provinces','hu','work','income']
remove_var.extend(dumm_var)
v=list(df.columns)
for i in remove_var:
    v.remove(i) 


income=np.log(df["income"].values) 
x=df[v].values

#-------------------------Python：回归树-------------------------
clf = tree.DecisionTreeRegressor() 
clf2 = clf.fit(x,income.ravel())
# py_rt_pre=clf.predict(x)

py_rt_pre=cross_val_predict(clf2,x,income.ravel(), cv=10)

#-------------------------Python：随机森林-------------------------
rfc=RandomForestRegressor(n_estimators=1000,random_state=2)
#n_estimators 迭代次数，即决策树的数量；random_state 控制随机性
rfc2= rfc.fit(x,income.ravel())
# py_rf_pre=rfc.predict(x)
py_rf_pre=cross_val_predict(rfc2,x,income.ravel(), cv=10)
varimp_rf=rfc2.feature_importances_ #特征筛选
# df_varimp_rf
df_varimp_rf=DataFrame({"var":v,"varimp":list(varimp_rf)})
df_varimp_rf=df_varimp_rf.sort_values(by=["varimp"],ascending=False)

#ascending=true 表示降序排列；ascending=false 表示升序排序




#------------------------------R：party------------------------------
party=importr("party")
base=importr("base")
stats=importr("stats")


df_r=df[v]
df_r.loc[:,"lny"]=income

with localconverter(ro.default_converter + pandas2ri.converter):
    df_r_use=ro.conversion.py2rpy(df_r)


x_name=list(df_r.columns)
x_name.remove("lny")
formula_str="+".join(x_name)
formula_str="lny~"+formula_str


#----------------------party：条件推断树----------------------
base.set_seed(1)
ct=party.ctree(formula=stats.as_formula(formula_str),
      data=df_r_use,
      control=party.ctree_control(
          mincriterion=0.90,
          testtype="Bonferroni",
          )
      )

pa_ct_pre=stats.predict(ct)
pa_ct_pre=np.array(pa_ct_pre)



#----------------------party：条件推断森林----------------------

base.set_seed(1)
ctf=party.cforest(formula=stats.as_formula(formula_str),
      data=df_r_use,
      control=party.cforest_control(
          mincriterion=0.90,
          mtry=len(v)**(0.5),
          testtype="Bonferroni",
          ntree=1000,
          fraction=0.5,
          replace=False
         )
      )

pa_cf_pre=stats.predict(ctf)
pa_cf_pre=np.array(pa_cf_pre)
varimp_cf=party.varimp(ctf)
df_varimp_cf=DataFrame({"var":x_name,"varimp":list(varimp_cf)})
df_varimp_cf.loc[:,"varimp_sd"]=df_varimp_cf["varimp"]/np.sum(df_varimp_cf["varimp"])
df_varimp_cf=df_varimp_cf.sort_values(by=["varimp"],ascending=False)


#整理最终数据表
df=df[init_var]
df.loc[:,"py_rt"]=py_rt_pre
df.loc[:,"py_rf"]=py_rf_pre
df.loc[:,"pa_ct"]=pa_ct_pre
df.loc[:,"pa_cf"]=pa_cf_pre


# sns.displot(data=df,x="py_rt",kde=True)
# sns.displot(data=df,x="py_rf",kde=True)
# sns.displot(data=df,x="pa_ct",kde=True)
# sns.displot(data=df,x="pa_cf",kde=True)

# income_pre=df[["income","py_rt","py_rf","pa_ct","pa_cf"]]

# f=lambda x:x.describe()


# income_pre.apply(f)
# income_pre.apply(np.quantile,q=(0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9))

df.to_csv(save_path,header=True)
df_varimp_cf.to_csv(varimp_path+"\\varimp_cf.csv",header=True)
df_varimp_rf.to_csv(varimp_path+"\\varimp_rf.csv",header=True)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Kwan的解忧杂货铺@新空间代码工作室 2024-02-29 17:25
关注
2301_81671120 下午好🌅🌅🌅
本答案参考通义千问

出现restart shell的错误可能是因为你的代码在某个地方遇到了问题，导致Python解释器需要重启以继续执行。在你提供的代码中，没有直接看到会导致这种问题的明显错误，但可以尝试以下步骤来排查问题：

检查数据格式和类型：

确保输入到模型的数据（x 和 income）是数值型，并且没有缺失值。
检查pandas.get_dummies()函数处理虚拟变量时是否正确。

代码块的顺序：

有时候，如果一个库或函数的导入顺序有问题，可能会引发此错误。确保rpy2库的导入在使用之前完成。

异常处理：

添加适当的异常处理代码，以便在遇到错误时捕获并记录信息，而不是让程序崩溃。例如，在cross_val_predict函数调用后添加try/except块。

逐步调试：

使用print语句或debugger（import pdb; pdb.set_trace()）来查看代码执行过程中变量的值，查找可能的问题点。

代码优化：

如果数据量很大，考虑使用更高效的算法或减少数据量来训练模型。

环境问题：

确保你的Python环境没有冲突，比如不同的版本或库版本。

由于你没有提供具体的错误信息，这些步骤可能需要一些试验才能找到问题所在。如果问题仍然存在，可能需要提供更详细的错误消息或者在问题发生的具体代码行上做标记。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python计算乘方为什么不能用乘法？ python
2022-10-30 13:45

回答 1 已采纳后面这个你改成 3.14*(a*a) 试试， 3.14*a*a 这个相当于进行了两次浮点数相乘，会有误差
容器中运行mysql，docker restart是否会造成mysql数据丢失 docker mysql 有问必答
2021-08-22 14:13

回答 2 已采纳不会啊，这重启操作很正常。只是一般重启在用户量使用少的情况下，避免给用户造成不良体验。
python爬图片，代码没报错但是没有结果 python
2022-06-29 05:32

回答 2 已采纳直接运行这个脚本文件的话，图片并不是存在桌面上。而是在这个py文件同目录下，即“C:/Users/AUB/Desktop/Final Year/Python 练习/p54爬虫”
机器学习实战——决策树Python实现问题记录
2018-09-17 21:46

土耳其的曼谷风的博客 # 在磁盘上存储 决策树对象用于节省时间 def storeTree(inputTree, filename): import pickle fw = open(filename, 'wb') pickle.dump(inputTree, fw) fw.close() 继续运行出现错误：...
Python莱布尼兹公式求pai 迭代n次为什么输入到一定数值就不输出了 python 有问必答
2021-05-24 15:09

回答 2 已采纳我试了一下，输入2990能正常输入出啊
Python处理字符串的时候为啥说缺少单引号 python
2023-02-16 09:56

回答 4 已采纳 CMD = "open keyword "D:\Restart\LS-DYNA\"print("CMD1",CMD)，这个命令现在应该是正确的，题主。
Pycharm中如何用Python运行含有引号、空格和斜杠的代码 pycharm python
2023-02-15 22:51

回答 7 已采纳 python中斜杠\有是特殊符号，你换成双斜杠“\”或反斜杠就可以了如： D:\\Program Files\\ANSYS Inc\\v221\\ansys\\bin\\winx64\\lsprepo
Python学习零基础
2024-03-21 17:05

冰觳的博客 Python基本用法易上手
python搜索文本文件并分析导出内容结果出错 python tcp/ip windows
2023-02-21 17:32

回答 2 已采纳由于没人回答，经不懈努力，终于成功解决了以上问题，虽然还很不成熟，希望能抛砖引玉。主要改进是：放弃了字典存储模式，用理简单的列表存储结果，以简化逻辑。本人是Python的初学者，以学为目的，主要用于解
python2.7idle(python gui)运行代码文件不读取代码怎么办？ python
2020-02-23 12:54

回答 1 已采纳 ``` Python2.7默认使用的字符集是ASCII，并不支持中文字符的显示与处理，因些如果要在Python中处理中文就需要进行一些额外的处理。一、在开头处声明Python使用UTF-
为什么VScode必须要保存一下（control+s）才能成功运行修改以后得代码，之前都不这样，我误触了什么设置？ python vscode
2021-09-05 09:39

回答 1 已采纳设置自动保存
大模型微调之使用 LLaMA-Factory 微调 Llama3
2024-04-25 19:45

段智华的博客运行结果为：检查 GPU 环境更新自我认知数据集可以自由修改 NAME 和 AUTHOR 变量的内容。 identity.json的文件内容为：同时，加载alpaca_gpt4_en,alpaca_gpt4_zh数据集，对应alpaca_gpt4_data_en.json、alpaca...
这游戏运行两次为什么就会出现停止不了
2016-09-29 12:23

回答 1 已采纳这表示没法看，修改一下，有一个专门插入代码的功能
程序员编程笔记
2021-09-20 23:18

黑客&画家的博客 1.查看电脑当前进程和端口cmd netstat -pid netstat -a 查看全部端口信息:netstat –ano ...文件路径文件名(会覆盖原内容) 8.用echo "写入新数据">>d:\a.txt，echo 字符串 >文件路径文件名.
【极富参考价值！】第1章 ClickHouse 简介《ClickHouse 企业级大数据分析引擎实战》...
2021-12-13 10:00

光剑书架上的书的博客这个想法并不新鲜，其可以追溯到 APL 编程语言及其后代：A +、J、K 和 Q。矢量编程被大量用于科学数据处理中。即使在关系型数据库中，这个想法也不是什么新的东西：比如，矢量编程也被大量用于 Vectorwise ...
【完结】cyのMemo（20240422~20240608）
2024-04-22 20:47

囚生CY的博客晚上8点，逮到嘉伟黑练（我真的搞不懂，为什么嘉伟这学期一直黑练，到底是受啥刺激，太奇怪了）。我到场时，他已经跑了3组800米间歇，非常快，目测圈速1’15"上下。我提议没必要这么用力，又没比赛，一起慢跑个10km...
【Spark】(task1)PySpark基础数据处理
2022-03-15 15:44

山顶夕景的博客文章目录学习总结一、Spark介绍1.1 Scala和PySpark1.2 Spark原理1.3 一个具体栗子二、安装方式三、测试是否安装成功四、Spark程序的模块分类五、数据处理任务5.1 使用Python链接Spark环境5.2 创建dateframe数据5.3 ...
【安全测试概述以及Kali Linux基础】
2023-05-25 23:36

colo_ilco的博客为了创建一个普通用户，可以使用以下命令： adduser 接着会出现对应指令定义新建普通用户的信息。 4、配置网络服务和安全通信在此环节的操作中，首先因该确保我们能够访问网络，并且该网络能够通过有线或无线网络...
覆盖17类面试题小结
2021-11-01 15:42

软件测试君的博客 1、测试概论 1、描述缺陷的管理流程提交缺陷–评审缺陷–分配缺陷–分析修改缺陷–确认缺陷–关闭缺陷 2、缺陷单包含哪些要素摘要、提交人、发现时间、严重程度、...1、为什么做测试分析测试分析能够明确具体要.
机器人操作系统二（ROS2）- 修行 Taoism
2019-08-21 09:51

zhangrelay的博客为什么不加强ROS 1 Why not just enhance ROS 1 原则上，上述变化可以集成到现有的核心ROS代码中。例如，新的通讯传输技术可以添加到 roscpp 和 rospy 。我们考虑了这个选项，并得出结论认为，鉴于实现我们所...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 2月29日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月29日

悬赏问题

¥15 sessionStorage在vue中的用法
¥15 wordpress更换域名后用户图片头像不显示
¥15 如何在ubunto上安装CEF (Chromium Embedded Framework)，并且基于qt实现打开一个web
¥30 AD9854 为什么输出波形幅度受限，AI机器人勿扰
¥15 如何在ubunto上安装CEF (Chromium Embedded Framework
¥15 数据库原理及应用上机练习题
¥15 如何联系真正的开发者而非公司
¥15 有偿求苍穹外卖环境配置
¥15 代码在keil5里变成了这样怎么办啊，文件图像也变了，
¥20 Ue4.26打包win64bit报错，如何解决？(语言-c++)

请问为什么python决策树运行结果会出现restart shell

3条回答 默认 最新

问题事件

悬赏问题

3条回答默认最新