机器学习算法-决策树对未知类别标签数据进行分类问题

机器学习算法还处于基础阶段,对决策树分类问题疑惑已久:构建好一颗决策树后,用该决策树对未知标签的数据进行分类,只能得到绝对的类别标签吗?有什么方法可以得到分类结果的概率呢?
比如:类别标签有两个:yes,no。决策树对某条未知标签的分类结果是yes,能否求出“yes”这个结果的概率,而不是绝对的一个类别标签。

1个回答

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
怎么用决策树进行多分类

是要给每一类建立一个决策树 然后分别判断 还是可以建立一个多分类的决策树啊 现在看的决策树都是二分 要么是这类要么不是这类 觉得只能判断属不属于一类 不能直接分成多类啊 求解

基于ID3算法构建决策树

4、考虑去卡拉OK厅唱歌的时候,是否要等待包间的问题。规定如下属性可用于描述该领域内的实例: (1)Others(其他地点):附近是否有其他卡拉OK厅; (2)WaitCond(等候条件):供顾客等候的地方是否舒适; (3)Weekend(周末):若是周六或周日,则为真; (4)Conssumers(顾客):店中有多少顾客(值为None(没人),Some(一些)或Full(满座)); (5)Price(价格):价格范围(值为Cheep(便宜),Middle(中等),Expensive(较贵)); (6)Raining(下雨):外面是否在下雨; (7)Reservation(预约):是否预约过; (8)WaitEstimate(等候时间估计):估计的等候时间(值为0—10,10—30,30—60,>60,单位为分钟)。 训练集见图![图片说明](https://img-ask.csdn.net/upload/202006/10/1591798429_179050.png) 数字化结果![图片说明](https://img-ask.csdn.net/upload/202006/10/1591798553_770257.png) 问题:考虑该问题是否可以基于ID3算法构建决策树,若可行,其分类结果与BP神经网络模型进行对比分析。 (ps请给出ID3算法代码及运行过程、分析结果,编程语言自选)

如何进行机器学习算法的实验?

学习了很多的机器学习算法,但是理解的还是不够透彻,想自己跑实验试试,但是有不知如何下手?! 请教各位大神该如何深入理解和运用?

关于Python实现决策树算法

用Python画出了决策树的形状,但是不理解决策树图中每个节点的内容。对某一个具体的节点,里面的内容包括判别指标,entropy(或gini)的值,samples表示样本个数,但是value表示什么意思,还有为什么在节点里面还有class表示的类,不是还没有开始判别吗,怎么会分类了?

关于机器学习中垃圾图像识别的特征提取问题。

如题,想用: **决策树、朴素贝叶斯和SVM**这三个传统机器学习算法,对github上的garythung的垃圾数据集进行识别分类。 1.但是对于图像预处理的特征提取有点云里雾里的,应该选取什么特征比较好啊?看了很多大神分享的博客,发现大家都是图像预处理之后,选择神经网络CNN进行训练的,无需特征提取。 所以有点困惑,了解到的有HOG,SIFT特征。 2.对于传统的机器学习算法,一定要进行特征提取吗?一些颜色特征、边缘特征也可以吗?这些颜色边缘一类的特征如何进行提取呢?也是使用opencv吗? 万分感谢万分感谢

SVM对纯数据进行分类,分类公式怎么得到?

![图片说明](https://img-ask.csdn.net/upload/201905/09/1557397868_476010.png) ![图片说明](https://img-ask.csdn.net/upload/201905/09/1557397920_863442.png) 这是训练样本数据,麻烦大神们,使用SVM算法对各个地区进行分类,分类的那条线的公式是什么,麻烦各位了

严重的非平衡数据二分类问题

数据挖掘中,利用机器学习算法解决二分类问题,数据样本分布极不平衡: 好样本和坏样本之间的比率高达500:1, 请问采用什么机器学习算法和数据采样方法,或者两者的可以解决这样的数据极不平衡问题?

数据预处理:类别型变量的编码问题

在数据挖掘的数据预处理对类别型变量编码过程中,其中一个类别型变量含具有有很多不同的取值(200个),若对这个的类型做OneHot编码,会给数据增加200个特征,大大增加了数据的维数。 请问对于这样的类型变量该怎么处理呢? 1.需要做卡方封箱吗?用python该怎么分箱处理? 2.或者编码后做PCA降维处理?PCA具体怎么降维呢? 3.还有其他更好的方法吗? 谢谢

如何使用聚类算法K-means对karate经典数据集进行划分

有没有大佬可以用python实现k-means对karate数据集的划分

哪些机器学习算法可以估计参数呢?

微分方程中可以不求解,通过学习参数来解决问题,高斯过程非参数贝叶斯机器学习可 以用来估计参数,那还有哪些机器学习的算法也可以估计参数呢?

分类模型预测的类别如何进行识别

我的模型数据中,原始目标变量设置了类别,分别是3,4,5(原来的标准是1-6,但是数据实际分类出来只符合了3,4,5三种类别,其他类别没有数据匹配到); 而模型预测出来的类别却自动命名为0,1,2。 那我该如何得知他们之间的对应关系呢? 我的代码该如何写?

机器学习到底要不要大数据的支持,如果要数据的支持,支持到哪一步?

机器学习到底要不要大数据的支持,如果要数据的支持,支持到哪一步? 众所周知AlphaGo是需要大量的数据来进行学习的,ZERO却只需要少量的数据样本即可达到甚至超过AlphaGo的水准,那么问题来了,这个数据量的多少从科学的角度来说它的一个标准是什么,或者说它怎么来度量? ———————————————————————————————— 谢谢各位的回答,实际上我对我自己提出的两个问题中的前一个和大家的看法是差不多的,但实际上我希望得到第二个问题的解答。 我们的共识是,机器学习在大部分时候都是需要大量数据的(实际上我没有见过不需要大量数据就能训练出来的智能),然而在现实操作中总会面临数据量不是不够就是浪费的情况(且不说数据的质量),所以去预测一个具体需要的数据量就是极其必要的。打个比方,在运用人工智能对医学影像进行分析的时候,我们需要极其大量的数据,但我们不可能去向医院索取它的全部数据,所以就会想要通过计算得到一个大概的数据量的值,而不需要三番五次地去向医院申请数据。 再举一个例子,比如我们在打磨一个适用于某处的齿轮,我们当然可以一边打磨一边拿去比较大小是否合适,但这一点也不方便,我们通常通过测量来获取需要的数据,然后直接按照这个数据来打磨齿轮。 所以精确计算每次训练时所需要的数据量,这显然是极其必要的,既可以让我们避免数据不足的情况又不至于让我们一直盲目地收集数据。 可问题就出在这里,这个数据量如何去测量? ———————————————————————————————— 回复caozhy:感谢你的回答:)。是的,数据的获取存在困难是一个现实存在的问题,例如医院里病人的数据签了保密协议,要取出是很麻烦的,其他领域也是一样,只有用钱把数据砸出来,从这方面来说估计一个需要的数据的量也是必要的。即使是能够获取到大量的数据,我们也希望能通过计算直接得到一个最优的数据量,如果这个计算方法真的存在并且被发现,自然是一桩好事。 ———————————————————————————————— 说明一下,这个问题是在最近的第194期双清论坛上由高文院士提出的,我有幸听到教授的转述,才会对此有所思考,当然才疏学浅,对人工智能的理解也不够深入,只能做上述的一些浅层解读,请点拨指正。

决策树在预测时怎么返回叶子节点信息?

决策树在预测时总是返回根节点的信息,怎么返回相应叶子节点的信息。 ``` def classifer(Tree, testVec): """ 输入:决策树,分类标签,测试数据 输出:决策结果 """ if Tree.results == None: if testVec[Tree.col] >= Tree.value: Tree=Tree.trueBranch classifer(Tree, testVec) else: Tree=Tree.falseBranch classifer(Tree, testVec) else: return Tree.results ``` ``` a=[168,179,109,221] print(classifer(decisionTree, a)) ``` 以下打印是正确的,但是在返回时还是返回根节点的信息。decisionTree是递归产生的实例 ``` def classifer(Tree, testVec): """ 输入:决策树,分类标签,测试数据 输出:决策结果 """ if Tree.results == None: if testVec[Tree.col] >= Tree.value: Tree=Tree.trueBranch classifer(Tree, testVec) else: Tree=Tree.falseBranch classifer(Tree, testVec) else: return print(Tree.results) ``` ``` ``` ``` 第一次提问可能说得有点不清楚,着急解决,希望大家帮我看看,谢谢啦!

机器学习模型及其算法的框架疑问

刚开始学机器学习,对其中的模型及其适用的算法,都有些没搞明白。。也努力去看了些文章,还是越高越迷糊。。求高手指点一二。。 我自己弄了下大致框架,就是想知道到底哪些模型,适用哪些算法?(这个神经网络,按正常分类,应该属于深度学习范畴的,到底属于生成法还是判别法,还是都不算?) 现在什么梯度下降法,极大似然估计,最小二乘法,核函数等,简直把我搞晕了。。 ![图片说明](https://img-ask.csdn.net/upload/201904/14/1555205748_608313.png)

新闻标题党识别算法(机器学习)

对标题党新闻识别技术的相关知识进行研究和总结,包括网页去噪工作原理、向量空间模型和矩阵的奇异值分解的相关知识。了解基于潜在语义分析的标题党识别系统,学习其相关技术,包括向量空间模型的构建、基于SVD的塌陷矩阵构建模块和基于LSA算法的标题党新闻判定模块。 主要工作内容:数据集特征分析及模型训练 哪位大神帮忙指导下学习思路和研究步骤,万分感谢,急求

机器学习菜鸟求问短文本分类问题

我有一个短文本集,基本上每段都是不超过100字的文本,是关于某个学科的描述。 然后我现在也有相关学科的列表,并且知道每个学科的核心关键词。 现在的任务是需要自动地对这些短文本进行分类,打上相应学科的标签,一般一段文本对应一个学科。 求教大神应该怎么做,越详细越好,包括是否需要人工做标注,用什么算法,怎么训练参数。本人拥有一定的Python编程基础,在数据挖掘和机器学习方面都是刚刚入门的菜鸟知道一定的概念但是懂得不多不深入,切词什么的还是会的。主要就是不知道切完词之后,词序列如何和 学科对应的关键词进行匹配,每个关键词的参数如何训练 我知道关于文本分类、短文本分类都有很多现成的研究,网上也有很多文章,主要是现在时间比较紧急,没有时间一点点地阅读学习,所以希望得到快速的指导,谢谢!

数据分析数据结构,有没有相关的机器学习算法? 急求大神指点

比如一个表格,用ocr识别后,内容很乱,希望恢复成原有的数据结构。 对于这种事情,有相应的机器学习方法吗? 急切求助,非常感谢。 比如: ![图片说明](https://img-ask.csdn.net/upload/201812/28/1545985609_513797.png) 恢复数据结构为 [1,BAST,谷草转氨酶,21,**<37,IU/L] 即,恢复为原有的数组形式**

使用增量学习算法,对一堆数据进行聚类处理,然后再次输入新的样本,如何判断该样本的可靠性如何?

使用增量学习算法,对一堆数据进行了聚类处理,然后再次输入新的样本,如何判断该样本的可靠性?

细胞自动机可以和哪些机器学习算法结合使用?

有大神了解细胞自动机(元胞自动机)吗?知不知道有哪些机器学习的算法可以和元胞自动机结合使用?具体能怎么使用? 遗传算法和神经网络可以和细胞自动机结合吗?有没有大神指点一下。

C/C++学习指南全套教程

C/C++学习的全套教程,从基本语法,基本原理,到界面开发、网络开发、Linux开发、安全算法,应用尽用。由毕业于清华大学的业内人士执课,为C/C++编程爱好者的教程。

定量遥感中文版 梁顺林著 范闻捷译

这是梁顺林的定量遥感的中文版,由范闻捷等翻译的,是电子版PDF,解决了大家看英文费时费事的问题,希望大家下载看看,一定会有帮助的

YOLOv3目标检测实战:训练自己的数据集

YOLOv3是一种基于深度学习的端到端实时目标检测方法,以速度快见长。本课程将手把手地教大家使用labelImg标注和使用YOLOv3训练自己的数据集。课程分为三个小项目:足球目标检测(单目标检测)、梅西目标检测(单目标检测)、足球和梅西同时目标检测(两目标检测)。 本课程的YOLOv3使用Darknet,在Ubuntu系统上做项目演示。包括:安装Darknet、给自己的数据集打标签、整理自己的数据集、修改配置文件、训练自己的数据集、测试训练出的网络模型、性能统计(mAP计算和画出PR曲线)和先验框聚类。 Darknet是使用C语言实现的轻型开源深度学习框架,依赖少,可移植性好,值得深入探究。 除本课程《YOLOv3目标检测实战:训练自己的数据集》外,本人推出了有关YOLOv3目标检测的系列课程,请持续关注该系列的其它课程视频,包括: 《YOLOv3目标检测实战:交通标志识别》 《YOLOv3目标检测:原理与源码解析》 《YOLOv3目标检测:网络模型改进方法》 敬请关注并选择学习!

sql语句 异常 Err] 1064 - You have an error in your SQL syntax; check the manual that corresponds to your

在我们开发的工程中,有时候会报 [Err] 1064 - You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near ------ 这种异常 不用多想,肯定是我们的sql语句出现问题,下面...

浪潮集团 往年的软件类 笔试题 比较详细的哦

浪潮集团 往年的软件类 笔试题 比较详细的哦

2019 AI开发者大会

2019 AI开发者大会(AI ProCon 2019)是由中国IT社区CSDN主办的AI技术与产业年度盛会。多年经验淬炼,如今蓄势待发:2019年9月6-7日,大会将有近百位中美顶尖AI专家、知名企业代表以及千余名AI开发者齐聚北京,进行技术解读和产业论证。我们不空谈口号,只谈技术,诚挚邀请AI业内人士一起共铸人工智能新篇章!

I2c串口通信实现加速度传感器和FPGA的交流

此代码能实现加速度传感器与FPGA之间的交流,从而测出运动物体的加速度。

Python可以这样学(第一季:Python内功修炼)

董付国系列教材《Python程序设计基础》、《Python程序设计(第2版)》、《Python可以这样学》配套视频,讲解Python 3.5.x和3.6.x语法、内置对象用法、选择与循环以及函数设计与使用、lambda表达式用法、字符串与正则表达式应用、面向对象编程、文本文件与二进制文件操作、目录操作与系统运维、异常处理结构。

微信公众平台开发入门

本套课程的设计完全是为初学者量身打造,课程内容由浅入深,课程讲解通俗易懂,代码实现简洁清晰。通过本课程的学习,学员能够入门微信公众平台开发,能够胜任企业级的订阅号、服务号、企业号的应用开发工作。 通过本课程的学习,学员能够对微信公众平台有一个清晰的、系统性的认识。例如,公众号是什么,它有什么特点,它能做什么,怎么开发公众号。 其次,通过本课程的学习,学员能够掌握微信公众平台开发的方法、技术和应用实现。例如,开发者文档怎么看,开发环境怎么搭建,基本的消息交互如何实现,常用的方法技巧有哪些,真实应用怎么开发。

机器学习初学者必会的案例精讲

通过六个实际的编码项目,带领同学入门人工智能。这些项目涉及机器学习(回归,分类,聚类),深度学习(神经网络),底层数学算法,Weka数据挖掘,利用Git开源项目实战等。

eclipseme 1.7.9

eclipse 出了新的eclipseme插件,官方有下载,但特慢,我都下了大半天(可能自己网速差)。有急需要的朋友可以下哦。。。

Spring Boot -01- 快速入门篇(图文教程)

Spring Boot -01- 快速入门篇 今天开始不断整理 Spring Boot 2.0 版本学习笔记,大家可以在博客看到我的笔记,然后大家想看视频课程也可以到【慕课网】手机 app,去找【Spring Boot 2.0 深度实践】的课程,令人开心的是,课程完全免费! 什么是 Spring Boot? Spring Boot 是由 Pivotal 团队提供的全新框架。Spring Boot...

HoloLens2开发入门教程

本课程为HoloLens2开发入门教程,讲解部署开发环境,安装VS2019,Unity版本,Windows SDK,创建Unity项目,讲解如何使用MRTK,编辑器模拟手势交互,打包VS工程并编译部署应用到HoloLens上等。

最简单的倍频verilog程序(Quartus II)

一个工程文件 几段简单的代码 一个输入一个输出(50Mhz倍频到100Mhz)

计算机组成原理实验教程

西北工业大学计算机组成原理实验课唐都仪器实验帮助,同实验指导书。分为运算器,存储器,控制器,模型计算机,输入输出系统5个章节

4小时玩转微信小程序——基础入门与微信支付实战

这是一个门针对零基础学员学习微信小程序开发的视频教学课程。课程采用腾讯官方文档作为教程的唯一技术资料来源。杜绝网络上质量良莠不齐的资料给学员学习带来的障碍。 视频课程按照开发工具的下载、安装、使用、程序结构、视图层、逻辑层、微信小程序等几个部分组织课程,详细讲解整个小程序的开发过程

面试了一个 31 岁程序员,让我有所触动,30岁以上的程序员该何去何从?

最近面试了一个31岁8年经验的程序猿,让我有点感慨,大龄程序猿该何去何从。

基于RSA通信密钥分发的加密通信

基于RSA通信密钥分发的加密通信,采用pycrypto中的RSA、AES模块实现

不同变质程度煤尘爆炸残留气体特征研究

为分析不同变质程度煤尘爆炸残留气体成分的特征规律,利用水平管道煤尘爆炸实验装置进行了贫瘦煤、肥煤、气煤、长焰煤4种不同变质程度的煤尘爆炸实验,研究了不同变质程度煤尘爆炸后气体残留物含量的差异,并对气体

设计模式(JAVA语言实现)--20种设计模式附带源码

课程亮点: 课程培训详细的笔记以及实例代码,让学员开始掌握设计模式知识点 课程内容: 工厂模式、桥接模式、组合模式、装饰器模式、外观模式、享元模式、原型模型、代理模式、单例模式、适配器模式 策略模式、模板方法模式、观察者模式、迭代器模式、责任链模式、命令模式、备忘录模式、状态模式、访问者模式 课程特色: 笔记设计模式,用笔记串连所有知识点,让学员从一点一滴积累,学习过程无压力 笔记标题采用关键字标识法,帮助学员更加容易记住知识点 笔记以超链接形式让知识点关联起来,形式知识体系 采用先概念后实例再应用方式,知识点深入浅出 提供授课内容笔记作为课后复习以及工作备查工具 部分图表(电脑PC端查看):

MySQL数据库面试题(2020最新版)

文章目录数据库基础知识为什么要使用数据库什么是SQL?什么是MySQL?数据库三大范式是什么mysql有关权限的表都有哪几个MySQL的binlog有有几种录入格式?分别有什么区别?数据类型mysql有哪些数据类型引擎MySQL存储引擎MyISAM与InnoDB区别MyISAM索引与InnoDB索引的区别?InnoDB引擎的4大特性存储引擎选择索引什么是索引?索引有哪些优缺点?索引使用场景(重点)...

软件测试2小时入门

本课程内容系统、全面、简洁、通俗易懂,通过2个多小时的介绍,让大家对软件测试有个系统的理解和认识,具备基本的软件测试理论基础。 主要内容分为5个部分: 1 软件测试概述,了解测试是什么、测试的对象、原则、流程、方法、模型;&nbsp; 2.常用的黑盒测试用例设计方法及示例演示;&nbsp; 3 常用白盒测试用例设计方法及示例演示;&nbsp; 4.自动化测试优缺点、使用范围及示例‘;&nbsp; 5.测试经验谈。

几率大的Redis面试题(含答案)

本文的面试题如下: Redis 持久化机制 缓存雪崩、缓存穿透、缓存预热、缓存更新、缓存降级等问题 热点数据和冷数据是什么 Memcache与Redis的区别都有哪些? 单线程的redis为什么这么快 redis的数据类型,以及每种数据类型的使用场景,Redis 内部结构 redis的过期策略以及内存淘汰机制【~】 Redis 为什么是单线程的,优点 如何解决redis的并发竞争key问题 Red...

手把手实现Java图书管理系统(附源码)

【超实用课程内容】 本课程演示的是一套基于Java的SSM框架实现的图书管理系统,主要针对计算机相关专业的正在做毕设的学生与需要项目实战练习的java人群。详细介绍了图书管理系统的实现,包括:环境搭建、系统业务、技术实现、项目运行、功能演示、系统扩展等,以通俗易懂的方式,手把手的带你从零开始运行本套图书管理系统,该项目附带全部源码可作为毕设使用。 【课程如何观看?】 PC端:https://edu.csdn.net/course/detail/27513 移动端:CSDN 学院APP(注意不是CSDN APP哦) 本课程为录播课,课程2年有效观看时长,大家可以抓紧时间学习后一起讨论哦~ 【学员专享增值服务】 源码开放 课件、课程案例代码完全开放给你,你可以根据所学知识,自行修改、优化

jsp+servlet入门项目实例

jsp+servlet实现班级信息管理项目

winfrom中嵌套html,跟html的交互

winfrom中嵌套html,跟html的交互,源码就在里面一看就懂,很简单

Java面试题大全(2020版)

发现网上很多Java面试题都没有答案,所以花了很长时间搜集整理出来了这套Java面试题大全,希望对大家有帮助哈~ 本套Java面试题大全,全的不能再全,哈哈~ 一、Java 基础 1. JDK 和 JRE 有什么区别? JDK:Java Development Kit 的简称,java 开发工具包,提供了 java 的开发环境和运行环境。 JRE:Java Runtime Environ...

python实现数字水印添加与提取及鲁棒性测试(GUI,基于DCT,含测试图片)

由python写的GUI,可以实现数字水印的添加与提取,提取是根据添加系数的相关性,实现了盲提取。含有两种攻击测试方法(高斯低通滤波、高斯白噪声)。基于python2.7,watermark.py为主

Xshell6完美破解版,亲测可用

Xshell6破解版,亲测可用,分享给大家。直接解压即可使用

你连存活到JDK8中著名的Bug都不知道,我怎么敢给你加薪

CopyOnWriteArrayList.java和ArrayList.java,这2个类的构造函数,注释中有一句话 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 public ArrayList(Collection&lt;? ...

相关热词 c# dbml文件 修改 c#遍历tree c# 能够控制单片机 c#对象写入数据库 c# 添加activex c#2005 json c# 数据库在云端 c# 字符串移位加密 c#禁用滚轮 c#实体类list去重复
立即提问