刚开始接触金融量化投资这块。导师让做一个随机森林的模型,数据是老师给的大概6000条的外汇交易数据(包含开盘、收盘,最高,最低价),利用这4个特征算出来另外11个特征,并且根据开盘和收盘价给数据打好了一列标签也就是Y。
(交易日期 开盘价 最高价 最低价 收盘价 MACD MACDsignal MACDhist MA10_talib RSI k d j upper middle lower div label)这些是所有的列名,相当于输入特征有15个,输出为y(label),y是判断1或者0或者-1;
随机森林部分代码如下:
from sklearn.ensemble import RandomForestClassifier
X_train,X_test,Y_train,Y_test= train_test_split(x,y,test_size=0.3,random_state=1)
rf = RandomForestClassifier(n_estimators=100, max_depth=20,bootstrap=True,random_state=1)#基分类器
rf.fit(X_train, Y_train)
print('Training set score:{:.3f}'.format(rf.score(X_train,Y_train)))
print('Test set score:{:.3f}'.format(rf.score(X_test,Y_test)))
输出结果如下:Training set score:1.000
Test set score:0.998
这结果搞得我有点怕。。。。。求大神给讲讲