2 zshxsr zshxsr 于 2017.01.08 10:24 提问

机器学习算法-决策树对未知类别标签数据进行分类问题

机器学习算法还处于基础阶段,对决策树分类问题疑惑已久:构建好一颗决策树后,用该决策树对未知标签的数据进行分类,只能得到绝对的类别标签吗?有什么方法可以得到分类结果的概率呢?
比如:类别标签有两个:yes,no。决策树对某条未知标签的分类结果是yes,能否求出“yes”这个结果的概率,而不是绝对的一个类别标签。

1个回答

devmiao
devmiao   Ds   Rxr 2017.01.08 10:47
Csdn user default icon
上传中...
上传图片
插入图片
准确详细的回答,更有利于被提问者采纳,从而获得C币。复制、灌水、广告等回答会被删除,是时候展现真正的技术了!
其他相关推荐
分类问题-----多标签(multilabel)、多类别(multiclass)
转自:大致上,解决multilabel的方法有两种1)转化问题。把问题转化为一个或多个单目标分类问题,或是回归问题。2)算法适应。修改学习算法使得能直接处理multilabel的数据。问题转化方法 dubbed PTx法。包括PT1 对有多标签的数据随机选取一个标签 PT2 直接把标签数大于1的都丢掉PT3 对标签集合进行排列组合,即组合好的成为一个新的单标签PT4 把一个含有L个标签的训练转化为...
初探NO.2—离散分类问题&决策树的启示
决策树看起来挺好的那么它是如何学习出来的?这就需要我们再细细探究一番。通过观察会其实我们会发现这个树学习的关键是找出它的各个节点之间的排列次序,既然所有的叶子节点都是判断的结果,那么哪一个特征需要我们拿来作为根节点,哪一个会成为它子节点......其实决策树的精髓也在于此,只要我们知道怎么去给特征排序,那么问题基本就解决了。
机器学习笔记-多分类学习,类别不平衡,决策树
读书笔记 多分类学习 基本思想:拆解法;将多分类任务拆解为若干个二分类任务求解,先对这些问题经拆分,为拆分出的每个二分类任务训练一个分类器,测试时,对这些分类器的预测结果进行集成以获得最终的多分类结果, 拆分策略:one vs one,一对一,将N个类别两两配对,产生,即N(N-1)/2个分类结果,最终结果通过投票产生,投票是把被预测的最多的类别作为最终分类结果。          One
在分类中如何处理训练集中不平衡问题
在分类中如何处理训练集中不平衡问题,在很多机器学习任务中,训练集中可能会存在某个或某些类别下的样本数远大于另一些类别下的样本数目。即类别不平衡,为了使得学习达到更好的效果,因此需要解决该类别不平衡问题。
几种分类问题的区别:多类分类,多标签分类,多示例学习,多任务学
original url: http://lib.csdn.net/article/machinelearning/34703 多类分类(Multiclass Classification) 一个样本属于且只属于多个类中的一个,一个样本只能属于一个类,不同类之间是互斥的。 典型方法: One-vs-All or One-vs.-rest: 将多类问题分成
林轩田机器学习基石——多类别分类问题(multi-class classification)
林轩田机器学习基石——多类别分类问题(multi-class classification)对于一个k类别分类问题,我们要做的是判断一个样本是k类别中的哪一类,实际上是二分类问题的拓展,解决方法也是二分类分类方法的延伸。 问题描述为:现有N个训练样本,每个样本的输出是k类类标的一种,我们需要训练出一个能够判别出样本类标的训练器。简单,常用的多分类方法可分为两种:一对多方法(One-Versus-A
多类别分类-机器学习(machine learning)笔记(Andrew Ng)
多类别分类(multi-class classification)问题 类别标签不止两个(0或者1),有多个(0,1,2,3…),例如邮件分类有工作、朋友、家庭等,天气分类有晴朗、多云、雨、雪等。 一对多方法(one-versus-all method) 解决多类别分类问题我们可以转化为二元分类问题。假设我们现在有三个类别(0,1,2),先将0作为一个类别,1和2作为另一个类别,此时问题
决策树实战项目-鸢尾花分类
决策树实战项目-鸢尾花分类 一、实验介绍 1.1 实验内容 决策树是机器学习中一种简单而又经典的算法。本次实验将带领了解决策树的基本原理,并学习使用 scikit-learn 来构建一个决策树分类模型,最后使用此模型预测鸢尾花的种类。 1.2 实验知识点 决策树的基本原理。决策树在生成和修剪中使用的 ID3, C4.5 及 CART 算法。使用 scikit-learn 中提供的决策
Python数据挖掘学习笔记-决策树分类
1、决策树算法原理&主要流程框架决策树方法在分类、决策、规则提取等领域有着广泛的应用。决策树是一种树状结构,其中包含三种节点: 根节点:没有入边,但有零条或多条出边。 内部节点:恰有一条入边和两条或多条出边。 叶节点:恰有一条入边,但没有出边。 也就是说每一个叶节点对应着一个分类,非叶节点对应着某个属性上的划分。构造决策树的核心问题是在每一步如何选择适当的属性对样本做拆分。 常用的决策树算法有ID
6.项目中的数据是否会归一化处理,哪个机器学习算法不需要归一化处理 ?
6.项目中的数据是否会归一化处理,哪个机器学习算法不需要归一化处理 ?答:归一化的目的是处理不同规模和量纲的数据,时期缩放到相同的数据区间和范围,以减少规模、特征、分布差异对模型的影响。Max-Min(线性归一化)Max-Min归一化是对原始数据进行线性变化,利用变量取值的最大值和最小值将原始数据转换为某一范围的数据。缺点是尤其其归一化过程仅与该变量的最大值和最小值有关,容易受到极端取值的影响。会...