python金融数据挖掘第九章复习思考题1

怎么写啊，决策树代码乱码导不出来用的pycharm.应该一样的但是一直做不出来

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 优质创作者: 编程框架技术领域 2024-06-06 11:12
关注
引自免费微信小程序：皆我百晓生

为了帮助您理解如何构建决策树并进行预测，我会提供一个详细的步骤和代码示例。首先，我们需要安装必要的库，然后准备数据，定义模型，训练模型，并使用新用户的数据进行预测。

安装所需库:

pip install pandas scikit-learn

导入库并准备数据:

import pandas as pd from sklearn.tree import DecisionTreeClassifier from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score # 创建数据框 data = { '拥有房产': ['是', '否', '否', '是', '否', '否', '是', '否', '否', '否'], '婚姻情况': ['单身', '已婚', '单身', '已婚', '离婚', '已婚', '离婚', '单身', '已婚', '单身'], '年收入（千元）': [125, 100, 70, 120, 95, 60, None, 220, 85, 90], '无法偿还债务': [False, False, True, False, True, True, False, False, True, False] } df = pd.DataFrame(data)

注意：数据集中年龄和工作信息缺失，这里我们暂时忽略这两个特征。对于缺失值，我们可以选择填充平均值、中位数或者删除这一行。这里我们先保留这一行。

数据预处理:

# 处理缺失值 df['年收入（千元）'].fillna(df['年收入（千元）'].mean(), inplace=True) # 将分类变量转换为数值型 df = pd.get_dummies(df, columns=['拥有房产', '婚姻情况']) # 特征和目标变量分离 X = df.drop('无法偿还债务', axis=1) y = df['无法偿还债务']

划分训练集和测试集:

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

训练决策树模型:

model = DecisionTreeClassifier() model.fit(X_train, y_train)

预测新用户:

new_user_data = { '拥有房产_是': 0, '拥有房产_否': 1, '婚姻情况_单身': 1, '婚姻情况_已婚': 0, '婚姻情况_离婚': 0, '年收入（千元）': 55 } new_user_df = pd.DataFrame(new_user_data, index=[0]) prediction = model.predict(new_user_df) print(f"新用户的还款能力预测结果: {'否' if prediction[0] else '是'}")

这段代码将创建一个简单的决策树模型，用于预测用户能否偿还债务。对于新用户（无房产，单身，年收入55千元），它会输出预测结果。

至于手动画出决策树，这通常涉及到图形绘制库，如graphviz。然而，在文本环境中很难展示完整的图形。您可以尝试使用Python的graphviz库结合sklearn的export_graphviz函数来可视化决策树。如果你对这个过程有疑问，我可以提供更详细的指导。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

《python数据分析与挖掘实战》笔记第2章
2021-02-13 22:30

周小董的博客文章目录第2章：python数据分析简介2.2、python使用入门2.2.3、数据结构(1)列表/元组(2)字典(3)集合(4)函数式编程2.2.4、库的导入与添加2.3、python数据分析工具2.3.1、numpy2.3.2、scipy2.3.3、matplotlib2.3.4、...
【数据挖掘复习题】
2022-06-12 17:24

爱笑的冷面鬼的博客 1.下面哪个不属于数据的属性类型 A.标称 B.序数 C.区间 D.相异2.属于定量的属性类型是 A.标称 B.序数 C.区间 D.相异3.一所大学内的各年纪人数分别为：一年级200人，二年级160人，三年级130人，四年级110人。则年级...
python股票分析挖掘预测金融大数据获取方法和实现（2）
2023-12-29 09:30

Adam_new的博客本人股市多年的老韭菜了，各种股票分析书籍，技术指标书籍阅历无数，萌发想法，何不自己开发个股票预测分析软件，选择python因为够强大，它提供了很多高效便捷的数据分析工具包，我们已经初步的接触与学习其中数据...
数据挖掘（应试版）
2025-02-25 06:00

愚戏师的博客探索学习的艺术（如何快速学习）写在前面：本篇是作为应试复习使用，参考教材为《数据挖掘算法与应用》1-5章第一步：构知识框架 数据挖掘知识框架（按重要程度⭐️划分） 1. 数据挖掘导论（⭐️⭐️⭐️）核心...
python30道练习题
2026-02-27 17:43

weixin_45794208的博客 python简单demo练习题
python编程语言汇总-Python技术之书籍汇总
2020-10-30 23:24

weixin_37988176的博客 Python入门《Python编程快速上手——让繁琐工作自动化》作者：【美】Al Sweigart（斯维加特）Python3编程从入门到实践亚马逊畅销Python编程图书本书是一本面向实践的Python编程实用指南。本书不仅介绍了Python语言...
Python语言程序设计基础（第2版）课后习题答案嵩天、礼欣、黄天羽版高等教育出版社试题和答案和解析
2020-03-14 12:05

北海知己的博客 Python语言程序设计基础（第2版）课后习题答案嵩天、礼欣、黄天羽版高等教育出版社试题和答案和解析复习提纲答案下载点这里，答案下载请点我答案下载点这里，答案下载点我点我第一部分初识Python语言课后...
数据挖掘在大数据领域教育行业的应用前景
2025-09-07 14:40

AI云原生与云计算技术学院的博客 数据挖掘的目的，就是解决这个问题。它通过分析教育过程中产生的海量数据（比如作业、考试、课堂互动、线上学习行为等），找出学生的学习规律、知识漏洞、学习习惯，甚至是情绪状态，从而帮助老师、学校做出更精准的...
第九十一篇：如何制作一份打动面试官的简历（Python工程师版）
2025-12-27 15:09

yongche_shi的博客摘要：Python工程师简历优化指南本文系统介绍了Python...文章提出了针对Python不同细分领域（后端、数据工程、机器学习、DevOps）的定制化方法，并提供了Python代码示例展示如何自动化分析职位描述和调整简历内容。
适合小学生python的书_小学生开始学Python,最接近AI的编程语言:安利一波Python书单...
2020-12-16 00:51

weixin_39616379的博客原标题：小学生开始学Python,最接近AI的编程语言:安利一波Python书单AlphaGo 都在使用的 Python 语言，是最接近 AI 的编程语言。教育部考试中心近日发布了“关于全国计算机等级(NCRE)体系调整”的通知，决定自2018年...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 6月6日

python金融数据挖掘第九章复习思考题1

2条回答 默认 最新

问题事件

2条回答默认最新