问题遇到的现象和发生背景
使用skmultilearn中的classifierchain,得到的预测结果如下图,不太懂在讲什么,因为我要使用多个CC模型的预测结果得到权重,所以,我希望能把下面的预测结果看懂,或是转换成数组或是其他类型。
我的解答思路和尝试过的方法
我type了一下结果:
使用skmultilearn中的classifierchain,得到的预测结果如下图,不太懂在讲什么,因为我要使用多个CC模型的预测结果得到权重,所以,我希望能把下面的预测结果看懂,或是转换成数组或是其他类型。
我type了一下结果:
假设预测的结果变量为predictions,则可以使用predictions.toarray(),得到完整的结果,具体代码如下所示:
from sklearn.svm import SVC
from skmultilearn.dataset import load_dataset
from skmultilearn.problem_transform import ClassifierChain
X_train, y_train, feature_names, label_names = load_dataset('emotions', 'train')
X_test, y_test, _, _ = load_dataset('emotions', 'test')
clf = ClassifierChain(
classifier=SVC(),
require_dense=[False, True]
)
clf.fit(X_train, y_train)
prediction = clf.predict(X_test)
print(prediction.toarray())
完整结果如下所示:
array([[0., 0., 1., 0., 0., 0.],
[1., 0., 0., 0., 0., 1.],
[1., 0., 0., 0., 0., 0.],
...,
[0., 0., 1., 1., 0., 0.],
[0., 0., 1., 0., 0., 0.],
[0., 0., 1., 0., 0., 0.]])
之所以使用稀疏矩阵进行存储,主要是由于结果绝大多数为0,因为多标签任务中预测到的类别一般来说只是一部分。