随机森林分类应用在预测外汇涨跌上，我做的模型为啥精度这么奇怪，求大神给解释下

刚开始接触金融量化投资这块。导师让做一个随机森林的模型，数据是老师给的大概6000条的外汇交易数据（包含开盘、收盘，最高，最低价），利用这4个特征算出来另外11个特征，并且根据开盘和收盘价给数据打好了一列标签也就是Y。
（交易日期开盘价最高价最低价收盘价 MACD MACDsignal MACDhist MA10_talib RSI k d j upper middle lower div label）这些是所有的列名，相当于输入特征有15个，输出为y（label），y是判断1或者0或者-1；

随机森林部分代码如下：

from sklearn.ensemble import RandomForestClassifier
X_train,X_test,Y_train,Y_test= train_test_split(x,y,test_size=0.3,random_state=1)
rf = RandomForestClassifier(n_estimators=100, max_depth=20,bootstrap=True,random_state=1)#基分类器
rf.fit(X_train, Y_train)
print('Training set score:{:.3f}'.format(rf.score(X_train,Y_train)))
print('Test set score:{:.3f}'.format(rf.score(X_test,Y_test)))

输出结果如下：Training set score:1.000
Test set score:0.998

这结果搞得我有点怕。。。。。求大神给讲讲

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
tomorrowpan 2019-03-14 16:21
关注
我觉得出现这个结果的原因可能有两个：
1.数据质量比较好，这些数据可能都是前人整理清洗过的数据，用来做基础练习用的；
2.第二个问题我觉得是值得你注意的，在数据集划分阶段你只做了一次70%/30%的随机抽样，实验结果的偶然性和误差肯定较大，模型泛化能力可能较差。现在大家在做机器学习model selection的时候是常常会用K-fold交叉验证的方法，具体原理你可以去百度，这样结果更具说服力。
你可以在你的基础上加上这些代码，简单看一下，score平均都很高的话说明就是第一种情况：
from sklearn.model_selection import cross_val_score
scores = cross_val_score(rf, x, y, cv=10) #10折交叉验证
print(scores)

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

tushare股票涨跌率 python 有问必答
2021-12-16 19:49

回答 1 已采纳代码中计算式有误，改成如下试试： stock_table=pd.read_csv('fin1.csv') order=['日期','名称','开盘价','收盘价','股价涨跌幅(%)','10分钟成交
php 循环10次随机数，加起来的和要为100，这个怎么写？ php
2019-10-25 16:41

回答 2 已采纳给你提供一种思路：获取n个随机数n1,n2,n3...，分别对某个数取余并加1作为最后的值，把所有取余得到的值加起来得到sum，每个人获得的红包=n1/sum*红包比如红包总数为100，发
python3为什么print的内容与存入的内容不同？ list python 有问必答
2021-07-20 21:24

回答 2 已采纳应该把 single_stock_dic = {} 放到外循环内，让每次循环都创建一个新的字典。 stock_list = [ ['股票代码', '股票名称', '当前价', '涨跌额', '涨跌幅
人工智能-项目实践-数据预处理-使用随机森林模型预测股价趋势(涉及数据预处理)
2024-03-02 20:35

主题：使用随机森林分类器去预测金融市场股票未来第K天的涨跌情况细节：原始股票数据经过指数平滑处理，并计算常用的技术指标，进行最大最小归一化处理，使用随机森林分类器训练预测 1、get_stock_data通过Tushare...
在django中view.py怎么写调用test.py代码实现在index.html显示出来 django python 后端
2021-12-10 10:31

回答 2 已采纳按我最后说的方法，是可以实现的，我把代码加到我一个示范里，成果显示你的爬取结果。
spyder运行别的都有12个图，长安汽车只有十个 python 有问必答
2022-05-27 12:00

回答 2 已采纳检查下你的数据涨跌幅和涨跌额是不是有缺失值或者异常的数据
如何对网页局部定时刷新？ java 有问必答
2022-02-19 21:20

回答 2 已采纳用ajax定时局部刷新参考https://www.jb51.net/article/72597.htm 如有帮助，请点击我的回答下方的【采纳该答案】按钮帮忙采纳下，谢谢!
python利用stacking模型提高预测准确率（决策树、随机森林）（多图易懂）
2023-01-13 12:59

本文要解决的问题为预测问题，即给出seer提取的癌症病人数据，如A病人的患病时长，性别，年龄等信息以及他是否死亡，通过训练后，给出某个病人的信息后就可以判定他是否死亡，具有一定的现实意义。同理还有股票涨跌...
随机森林——股票涨跌预测模型搭建
2022-08-05 21:04

遇鱼语渔的博客 随机森林——股票涨跌预测模型搭建
Python实现股票涨跌预测——随机森林模型
2021-03-18 18:00

威少的书童的博客 """ parameters = {'n_estimators': [5, 10, 20], 'max_depth': [2, 3, 4, 5], 'min_samples_leaf': [5, 10, 20, 30]} new_rfc = RandomForestClassifier(random_state=1) # 构建的随机森林模型 """设置cv参数为6，...
基于Matlab实现SVM预测上证指数涨跌（源码+数据）.rar
2023-05-29 12:16

1、资源内容：基于Matlab实现SVM预测上证指数涨跌（源码+数据）.rar 2、适用人群：计算机，电子信息工程、数学等专业的大学生课程设计、期末大作业或毕业设计，作为“参考资料”使用。 3、解压说明：本资源需要电脑...
利用随机森林预测股票大盘涨跌
2018-08-15 16:22

weixin_42974192的博客本文仅从实战角度去观察，利用机器学习算法中，随机森林模型预测股票市场指数涨跌的准确率。适合入门玩家首先，我们导入所需要的模块 import numpy as np import pandas as pd import talib as ta #金融数据...
基于LSTM对股票价格进行回归预测，对股价涨跌进行分类预测源码+项目说明.zip
2024-02-27 12:10

基于LSTM对股票价格进行回归预测，对股价涨跌进行分类预测源码+项目说明.zip基于LSTM对股票价格进行回归预测，对股价涨跌进行分类预测源码+项目说明.zip基于LSTM对股票价格进行回归预测，对股价涨跌进行分类预测源码...
基于考虑方向混合回归损失函数的神经网络股票涨跌额预测模型研究.zip
2024-02-10 16:05

人工智能——模拟人类智能的技术和理论，使其在计算机上展现出类似人类的思考、判断、决策、学习和交流能力。这不仅是一门技术，更是一种前沿的科学探索。【实战项目与源码分享】我们深入探讨了深度学习的基本...
python利用stacking模型提高预测准确率（决策树、随机森林）
2021-02-05 06:21

只会cv的nlp的博客本文要解决的问题为预测问题，即给出seer提取的癌症病人数据，如A病人的患病时长，性别，年龄等信息以及他是否死亡，通过训练后，给出...本文计划采用决策树、随机森林、stacking融合两种模型三种方式进行训练和预测。
python随机森林模型简单股票涨跌预测
2020-08-19 17:28

Wilburzzz的博客以前上学时还觉得数学只要学会加减乘除就可以了，什么导数，回归方程都没什么用，这段时间真后悔死，看了好多模型原理推导，有好多的数学符号都不认识了，全部还给了老师，改天还得回家找下以前初中高中的数学书看看...
金融学教授：ChatGPT可通过分析财经新闻预测股价涨跌
2023-04-13 21:58

美国佛罗里达大学（University of Florida）金融学教授亚历桑德罗·洛佩兹-里拉（Alejandro Lopez-Lira）认为，大型语言模型能够预测股价涨跌。他在近期一篇未经同行评审的论文中表示，在使用ChatGPT来分析新闻...
python股票交易模型_python随机森林模型简单股票涨跌预测
2020-12-04 12:57

weixin_39758618的博客提取特征变量和目标变量，用当天收盘后获取完整的数据为特征变量，下一天的涨跌情况为目标变量这样来训练分类决策树模型 X = df[['close', 'vol', 'close-open', 'MA5', 'MA10', 'high-low', 'RSI', 'MOM', 'EMA12',...
随机森林模型及案例（Python）
2022-04-21 17:37

QYiRen的博客 Bagging算法的典型机器学习模型为随机森林模型，而Boosting算法的典型机器学习模型则为AdaBoost、GBDT、XGBoost和LightGBM模型。 1.1 Bagging算法简介 Bagging算法的原理类似投票，每个弱学习器都有一票，最终根据...
没有解决我的问题, 去提问

悬赏问题

¥15 安卓adb backup备份应用数据失败
¥15 eclipse运行项目时遇到的问题
¥15 关于#c##的问题：最近需要用CAT工具Trados进行一些开发
¥15 南大pa1 小游戏没有界面，并且报了如下错误，尝试过换显卡驱动，但是好像不行
¥15 没有证书，nginx怎么反向代理到只能接受https的公网网站
¥50 成都蓉城足球俱乐部小程序抢票
¥15 yolov7训练自己的数据集
¥15 esp8266与51单片机连接问题(标签-单片机|关键词-串口)（相关搜索：51单片机|单片机|测试代码）
¥15 电力市场出清matlab yalmip kkt 双层优化问题
¥30 ros小车路径规划实现不了，如何解决？(操作系统-ubuntu)