向大神请教:数据分析中如何选取变量? 20C

向大神请教:数据分析中(逻辑回归,聚类,决策树等算法中),业务已经把可能有用的相关变量告知,那数据分析人员要从数据分析的角度来说的话如何在他们的基础上选取自变量呢?不同的算法中需要有不同的选取办法么?

8个回答

变量应该就是你所分析的采集来的数据呀

有了相关变量则代入数学模型中进行训练分析,根据结果继续调整变量,或者模型参数

自变量的选取还是要根据具体解决而主要问题是什么,选择与问题直接相关的变量作为自变量,其余可以作为协变量或者无关变量,可以先进行简单的相关性分析,看看是那个变量相关性最显著。也可以用主成分分析。

tin:数值;分量(也称变量);你想改的数据

在数据分析中,针对不同的问题,需要采用不同的算法进行变量选择,当然采用多种算法所选择的变量也可能会又算不同,这个也就要结合经验来判断哪个算法选择的变量合适了

主成分分析降维,筛选自变量

1.如果不需要得到变量的名字,可以直接使用卷积神经网络自动筛选变量,当数据大时时间可能比较久。
2.如果需要得到确切的变量就必须要了解对应的业务流程,先选出对输出有影响的变量,然后再筛选出重要的。可以结合一些降维方法,像SVD,PCA这样的。

如果需要进行变量筛选就选择全部相关的采集变量,可以查阅具有较高影响因子的相关专业文献看别人如何做的。

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
求大神支招:如何学好Ruby语言
求大神支招:如何学好Ruby语言,还有Ruby什么版本用的人比较多,看什么书?
求大神指教:html网页怎么与数据库mysql中数据进行交互?
求大神指教: 我写了一个html网页,登录账号、密码等数据在mysql中,怎么样可以让我对页面输入的登录账号和密码与数据库中的进行比对,从而登入页面?我用的vs写的,通过控件连接上了数据库,然后不知道在那个界面些什么代码。 新人一枚,大家说用js实现,脑袋里没概念。求类似代码
求大神告知:如何在 visual studio code中编译运行C/C++代码?
求大神告知:如何在 visual studio code中编译运行C/C++代码,如需配置环境,怎么配置?求详细操作,拜谢!
字符串在内存中存储位置
初学Java,向大神请教:请问string a = "a" + "b";在内存中是如何运行的 ?
望大神解决:数据累加逻辑问题
从数据库取到一个数据进行运算后累加到另一个数据上,此数据每次登陆会进到运算中一次,如何避免重复的数据累加。 例如:a = 100;是每次登陆获取到的数据,b = a-50; c+=a 进行累加,但是如果a的值没变,或者a第一次登陆的时候进行运算,要怎么避免重复数据累加的情况。
跪求大神指导:RedHat4 安装vsftpd
跪求大神指导:RedHat4 安装vsftpd 我在电脑的虚拟机里安装了RedHat4 但是没有装vsftpd 求大神指导如何安装
Android开发 大神们:怎么实现相机预览时的实时滤镜效果呀(预览图实时改变)?跪求大神指导!
Android开发 大神们:怎么实现相机预览时的实时滤镜效果呀(就是拍照时预览界面 点击某一滤镜效果预览图会实时改变)?跪求大神指导!
机器学习knn算法中目标变量转换为factor
向大神们请教:1,学习knn算法中将目标变量转换为factor,目的是什么?且他的level设定有什么具体的要求么?使用knn算法时,变量必须要处理成有序分类变量么?
数据分析小白求大神指导入门
数据分析小白一名,分到大数据部,即将入职。完全不知道怎么融入工作,迷茫啊!请问一下大家数据分析师主要会用到什么软件?求各位大神介绍数据分析相关入门书籍和数据分析必须的入门软件教程
问下各位大神java环境变量怎么设置
我的java装在D:\Java\jdk1.7.0_25这里在D:\Java下面还有一个D:\Java\jre7 那个环境变量怎么设置啊还有那个path里为%SystemRoot%\system32;%SystemRoot%;%SystemRoot%\System32\Wbem;%SYSTEMROOT%\System32\WindowsPowerShell\v1.0\;C:\Program Files\ATI Technologies\ATI.ACE\Core-Static;C:\Program Files\Common Files\Thunder Network\KanKan\Codecs;c:\Program Files\Common Files\Ulead Systems\MPEG 不知道可不可以删除 求大神帮忙
请大神指点: python中如果类有多个属性,可以通过setter一次性对全部属性值进行设置吗?
请大神指点: 如果类有多个属性,可以通过setter一次性对全部属性值进行设置吗? 比如: ``` class A(): def __init__(self, x=0, y=0): self.x = x self.y = y @property def a(self): ... @a.setter def a(self, x, y): self.x = x self.y = y >>z = A(2, 3) >>z.a = 4, 5 ``` @oyljerry
plsql中文乱码,请教大神数据库字符集怎么设置
用plsql有中文显示为??的问题,想请教下各位大神数据库的字符集怎么设置,网上查了下始终解决不了。 1.注册表里显示的是 SIMPLIFIED CHINESE_CHINA.ZHS16GBK ![图片说明](https://img-ask.csdn.net/upload/201605/29/1464500367_329354.png) 2.但是用plsql查出来却是AMERACIAN....的 ![图片说明](https://img-ask.csdn.net/upload/201605/29/1464500380_808754.png) 3.我也没设置过NLS_LANG这类环境变量 想请教大神怎么解决这个中文乱码的问题
请教:数据库排序后分页查询的问题
test表只有一个 id字段,总共5条记录(1,2,3,4,5)如下图 ![图片说明](https://img-ask.csdn.net/upload/201608/15/1471191235_318238.png) 我想实现,对id排序后分页,每一页3条记录。 第一页:5,4,3 第二页:2,1 而我的代码执行结果却是 第一页:5,4,3 第二页:5,4 代码如下: 第一页:select top 3 * from test where id not in (select top 0 id from test) order by id desc 第二页:select top 3 * from test where id not in (select top 3 id from test) order by id desc 请大神看看这是什么问题
Android请教:同时显示日期和时间选择器
开发中遇到一个问题: 需要在一个控件中同时显示日期和时间选择器 要求:日期只显示月、日;时间只显示24小时制的时 网上翻了好久没看见合适的,请教各位路过的大神给一些思路或者解决方案
mybatis mysq自定义变量
各位大神: mybatis mysq自定义变量如何处理
新手:vs2012中如何连接数据库,求大神指教,最好有代码示例。谢谢。
如题:vs2012中如何连接数据库,求大神指教,最好有代码示例。谢谢。
ajax的dataType为text,那么controller的返回值类型是什么?
向各位大神请教: 当ajax的dataType为text,那么Controller与之对应的返回值类型是什么? 望各位大佬不吝赐教!
新手:vs2012中如何连接mysql数据库,求大神指教,最好有代码示例。谢谢。
如题:vs2012中如何连接mysql数据库,求大神指教,最好有代码示例。谢谢。
java变量修饰符问题,大神来回答啊
如下图:为什么方法中的变量只能用final修饰? ![图片说明](https://img-ask.csdn.net/upload/201604/25/1461589735_537046.png)
爬虫福利二 之 妹子图网MM批量下载
爬虫福利一:27报网MM批量下载    点击 看了本文,相信大家对爬虫一定会产生强烈的兴趣,激励自己去学习爬虫,在这里提前祝:大家学有所成! 目标网站:妹子图网 环境:Python3.x 相关第三方模块:requests、beautifulsoup4 Re:各位在测试时只需要将代码里的变量 path 指定为你当前系统要保存的路径,使用 python xxx.py 或IDE运行即可。
Java学习的正确打开方式
在博主认为,对于入门级学习java的最佳学习方法莫过于视频+博客+书籍+总结,前三者博主将淋漓尽致地挥毫于这篇博客文章中,至于总结在于个人,实际上越到后面你会发现学习的最好方式就是阅读参考官方文档其次就是国内的书籍,博客次之,这又是一个层次了,这里暂时不提后面再谈。博主将为各位入门java保驾护航,各位只管冲鸭!!!上天是公平的,只要不辜负时间,时间自然不会辜负你。 何谓学习?博主所理解的学习,它
程序员必须掌握的核心算法有哪些?
由于我之前一直强调数据结构以及算法学习的重要性,所以就有一些读者经常问我,数据结构与算法应该要学习到哪个程度呢?,说实话,这个问题我不知道要怎么回答你,主要取决于你想学习到哪些程度,不过针对这个问题,我稍微总结一下我学过的算法知识点,以及我觉得值得学习的算法。这些算法与数据结构的学习大多数是零散的,并没有一本把他们全部覆盖的书籍。下面是我觉得值得学习的一些算法以及数据结构,当然,我也会整理一些看过
大学四年自学走来,这些私藏的实用工具/学习网站我贡献出来了
大学四年,看课本是不可能一直看课本的了,对于学习,特别是自学,善于搜索网上的一些资源来辅助,还是非常有必要的,下面我就把这几年私藏的各种资源,网站贡献出来给你们。主要有:电子书搜索、实用工具、在线视频学习网站、非视频学习网站、软件下载、面试/求职必备网站。 注意:文中提到的所有资源,文末我都给你整理好了,你们只管拿去,如果觉得不错,转发、分享就是最大的支持了。 一、PDF搜索网站推荐 对于大部
linux系列之常用运维命令整理笔录
本博客记录工作中需要的linux运维命令,大学时候开始接触linux,会一些基本操作,可是都没有整理起来,加上是做开发,不做运维,有些命令忘记了,所以现在整理成博客,当然vi,文件操作等就不介绍了,慢慢积累一些其它拓展的命令,博客不定时更新 顺便拉下票,我在参加csdn博客之星竞选,欢迎投票支持,每个QQ或者微信每天都可以投5票,扫二维码即可,http://m234140.nofollow.ax.
Vue + Spring Boot 项目实战(十四):用户认证方案与完善的访问拦截
本篇文章主要讲解 token、session 等用户认证方案的区别并分析常见误区,以及如何通过前后端的配合实现完善的访问拦截,为下一步权限控制的实现打下基础。
比特币原理详解
一、什么是比特币 比特币是一种电子货币,是一种基于密码学的货币,在2008年11月1日由中本聪发表比特币白皮书,文中提出了一种去中心化的电子记账系统,我们平时的电子现金是银行来记账,因为银行的背后是国家信用。去中心化电子记账系统是参与者共同记账。比特币可以防止主权危机、信用风险。其好处不多做赘述,这一层面介绍的文章很多,本文主要从更深层的技术原理角度进行介绍。 二、问题引入  假设现有4个人
程序员接私活怎样防止做完了不给钱?
首先跟大家说明一点,我们做 IT 类的外包开发,是非标品开发,所以很有可能在开发过程中会有这样那样的需求修改,而这种需求修改很容易造成扯皮,进而影响到费用支付,甚至出现做完了项目收不到钱的情况。 那么,怎么保证自己的薪酬安全呢? 我们在开工前,一定要做好一些证据方面的准备(也就是“讨薪”的理论依据),这其中最重要的就是需求文档和验收标准。一定要让需求方提供这两个文档资料作为开发的基础。之后开发
网页实现一个简单的音乐播放器(大佬别看。(⊙﹏⊙))
今天闲着无事,就想写点东西。然后听了下歌,就打算写个播放器。 于是乎用h5 audio的加上js简单的播放器完工了。 欢迎 改进 留言。 演示地点跳到演示地点 html代码如下`<!DOCTYPE html> <html> <head> <title>music</title> <meta charset="utf-8"&gt
Python十大装B语法
Python 是一种代表简单思想的语言,其语法相对简单,很容易上手。不过,如果就此小视 Python 语法的精妙和深邃,那就大错特错了。本文精心筛选了最能展现 Python 语法之精妙的十个知识点,并附上详细的实例代码。如能在实战中融会贯通、灵活使用,必将使代码更为精炼、高效,同时也会极大提升代码B格,使之看上去更老练,读起来更优雅。 1. for - else 什么?不是 if 和 else 才
数据库优化 - SQL优化
前面一篇文章从实例的角度进行数据库优化,通过配置一些参数让数据库性能达到最优。但是一些“不好”的SQL也会导致数据库查询变慢,影响业务流程。本文从SQL角度进行数据库优化,提升SQL运行效率。 判断问题SQL 判断SQL是否有问题时可以通过两个表象进行判断: 系统级别表象 CPU消耗严重 IO等待严重 页面响应时间过长
2019年11月中国大陆编程语言排行榜
2019年11月2日,我统计了某招聘网站,获得有效程序员招聘数据9万条。针对招聘信息,提取编程语言关键字,并统计如下: 编程语言比例 rank pl_ percentage 1 java 33.62% 2 c/c++ 16.42% 3 c_sharp 12.82% 4 javascript 12.31% 5 python 7.93% 6 go 7.25% 7
通俗易懂地给女朋友讲:线程池的内部原理
餐厅的约会 餐盘在灯光的照耀下格外晶莹洁白,女朋友拿起红酒杯轻轻地抿了一小口,对我说:“经常听你说线程池,到底线程池到底是个什么原理?”我楞了一下,心里想女朋友今天是怎么了,怎么突然问出这么专业的问题,但做为一个专业人士在女朋友面前也不能露怯啊,想了一下便说:“我先给你讲讲我前同事老王的故事吧!” 大龄程序员老王 老王是一个已经北漂十多年的程序员,岁数大了,加班加不动了,升迁也无望,于是拿着手里
经典算法(5)杨辉三角
写在前面: 我是 扬帆向海,这个昵称来源于我的名字以及女朋友的名字。我热爱技术、热爱开源、热爱编程。技术是开源的、知识是共享的。 这博客是对自己学习的一点点总结及记录,如果您对 Java、算法 感兴趣,可以关注我的动态,我们一起学习。 用知识改变命运,让我们的家人过上更好的生活。 目录一、杨辉三角的介绍二、杨辉三角的算法思想三、代码实现1.第一种写法2.第二种写法 一、杨辉三角的介绍 百度
腾讯算法面试题:64匹马8个跑道需要多少轮才能选出最快的四匹?
昨天,有网友私信我,说去阿里面试,彻底的被打击到了。问了为什么网上大量使用ThreadLocal的源码都会加上private static?他被难住了,因为他从来都没有考虑过这个问题。无独有偶,今天笔者又发现有网友吐槽了一道腾讯的面试题,我们一起来看看。 腾讯算法面试题:64匹马8个跑道需要多少轮才能选出最快的四匹? 在互联网职场论坛,一名程序员发帖求助到。二面腾讯,其中一个算法题:64匹
面试官:你连RESTful都不知道我怎么敢要你?
面试官:了解RESTful吗? 我:听说过。 面试官:那什么是RESTful? 我:就是用起来很规范,挺好的 面试官:是RESTful挺好的,还是自我感觉挺好的 我:都挺好的。 面试官:… 把门关上。 我:… 要干嘛?先关上再说。 面试官:我说出去把门关上。 我:what ?,夺门而去 文章目录01 前言02 RESTful的来源03 RESTful6大原则1. C-S架构2. 无状态3.统一的接
为啥国人偏爱Mybatis,而老外喜欢Hibernate/JPA呢?
关于SQL和ORM的争论,永远都不会终止,我也一直在思考这个问题。昨天又跟群里的小伙伴进行了一番讨论,感触还是有一些,于是就有了今天这篇文。 声明:本文不会下关于Mybatis和JPA两个持久层框架哪个更好这样的结论。只是摆事实,讲道理,所以,请各位看官勿喷。 一、事件起因 关于Mybatis和JPA孰优孰劣的问题,争论已经很多年了。一直也没有结论,毕竟每个人的喜好和习惯是大不相同的。我也看
SQL-小白最佳入门sql查询一
一 说明 如果是初学者,建议去网上寻找安装Mysql的文章安装,以及使用navicat连接数据库,以后的示例基本是使用mysql数据库管理系统; 二 准备前提 需要建立一张学生表,列分别是id,名称,年龄,学生信息;本示例中文章篇幅原因SQL注释略; 建表语句: CREATE TABLE `student` ( `id` int(11) NOT NULL AUTO_INCREMENT, `
项目中的if else太多了,该怎么重构?
介绍 最近跟着公司的大佬开发了一款IM系统,类似QQ和微信哈,就是聊天软件。我们有一部分业务逻辑是这样的 if (msgType = "文本") { // dosomething } else if(msgType = "图片") { // doshomething } else if(msgType = "视频") { // doshomething } else { // dosho
“狗屁不通文章生成器”登顶GitHub热榜,分分钟写出万字形式主义大作
一、垃圾文字生成器介绍 最近在浏览GitHub的时候,发现了这样一个骨骼清奇的雷人项目,而且热度还特别高。 项目中文名:狗屁不通文章生成器 项目英文名:BullshitGenerator 根据作者的介绍,他是偶尔需要一些中文文字用于GUI开发时测试文本渲染,因此开发了这个废话生成器。但由于生成的废话实在是太过富于哲理,所以最近已经被小伙伴们给玩坏了。 他的文风可能是这样的: 你发现,
程序员:我终于知道post和get的区别
IT界知名的程序员曾说:对于那些月薪三万以下,自称IT工程师的码农们,其实我们从来没有把他们归为我们IT工程师的队伍。他们虽然总是以IT工程师自居,但只是他们一厢情愿罢了。 此话一出,不知激起了多少(码农)程序员的愤怒,却又无可奈何,于是码农问程序员。 码农:你知道get和post请求到底有什么区别? 程序员:你看这篇就知道了。 码农:你月薪三万了? 程序员:嗯。 码农:你是怎么做到的? 程序员:
《程序人生》系列-这个程序员只用了20行代码就拿了冠军
你知道的越多,你不知道的越多 点赞再看,养成习惯GitHub上已经开源https://github.com/JavaFamily,有一线大厂面试点脑图,欢迎Star和完善 前言 这一期不算《吊打面试官》系列的,所有没前言我直接开始。 絮叨 本来应该是没有这期的,看过我上期的小伙伴应该是知道的嘛,双十一比较忙嘛,要值班又要去帮忙拍摄年会的视频素材,还得搞个程序员一天的Vlog,还要写BU
加快推动区块链技术和产业创新发展,2019可信区块链峰会在京召开
      11月8日,由中国信息通信研究院、中国通信标准化协会、中国互联网协会、可信区块链推进计划联合主办,科技行者协办的2019可信区块链峰会将在北京悠唐皇冠假日酒店开幕。   区块链技术被认为是继蒸汽机、电力、互联网之后,下一代颠覆性的核心技术。如果说蒸汽机释放了人类的生产力,电力解决了人类基本的生活需求,互联网彻底改变了信息传递的方式,区块链作为构造信任的技术有重要的价值。   1
程序员把地府后台管理系统做出来了,还有3.0版本!12月7号最新消息:已在开发中有github地址
第一幕:缘起 听说阎王爷要做个生死簿后台管理系统,我们派去了一个程序员…… 996程序员做的梦: 第一场:团队招募 为了应对地府管理危机,阎王打算找“人”开发一套地府后台管理系统,于是就在地府总经办群中发了项目需求。 话说还是中国电信的信号好,地府都是满格,哈哈!!! 经常会有外行朋友问:看某网站做的不错,功能也简单,你帮忙做一下? 而这次,面对这样的需求,这个程序员
Android 9.0系统新特性,对刘海屏设备进行适配
其实Android 9.0系统已经是去年推出的“老”系统了,这个系统中新增了一个比较重要的特性,就是对刘海屏设备进行了支持。一直以来我也都有打算针对这个新特性好好地写一篇文章,但是为什么直到拖到了Android 10.0系统都发布了才开始写这篇文章呢?当然,一是因为我这段时间确实比较忙,今年几乎绝大部分的业余时间都放到写新书上了。但是最主要的原因并不是这个,而是因为刘海屏设备的适配存在一定的特殊性
网易云6亿用户音乐推荐算法
网易云音乐是音乐爱好者的集聚地,云音乐推荐系统致力于通过 AI 算法的落地,实现用户千人千面的个性化推荐,为用户带来不一样的听歌体验。 本次分享重点介绍 AI 算法在音乐推荐中的应用实践,以及在算法落地过程中遇到的挑战和解决方案。 将从如下两个部分展开: AI 算法在音乐推荐中的应用 音乐场景下的 AI 思考 从 2013 年 4 月正式上线至今,网易云音乐平台持续提供着:乐屏社区、UGC
【技巧总结】位运算装逼指南
位算法的效率有多快我就不说,不信你可以去用 10 亿个数据模拟一下,今天给大家讲一讲位运算的一些经典例子。不过,最重要的不是看懂了这些例子就好,而是要在以后多去运用位运算这些技巧,当然,采用位运算,也是可以装逼的,不信,你往下看。我会从最简单的讲起,一道比一道难度递增,不过居然是讲技巧,那么也不会太难,相信你分分钟看懂。 判断奇偶数 判断一个数是基于还是偶数,相信很多人都做过,一般的做法的代码如下
日均350000亿接入量,腾讯TubeMQ性能超过Kafka
整理 | 夕颜出品 | AI科技大本营(ID:rgznai100) 【导读】近日,腾讯开源动作不断,相继开源了分布式消息中间件TubeMQ,基于最主流的 OpenJDK8开发的
8年经验面试官详解 Java 面试秘诀
    作者 | 胡书敏 责编 | 刘静 出品 | CSDN(ID:CSDNnews) 本人目前在一家知名外企担任架构师,而且最近八年来,在多家外企和互联网公司担任Java技术面试官,前后累计面试了有两三百位候选人。在本文里,就将结合本人的面试经验,针对Java初学者、Java初级开发和Java开发,给出若干准备简历和准备面试的建议。   Java程序员准备和投递简历的实
面试官如何考察你的思维方式?
1.两种思维方式在求职面试中,经常会考察这种问题:北京有多少量特斯拉汽车? 某胡同口的煎饼摊一年能卖出多少个煎饼? 深圳有多少个产品经理? 一辆公交车里能装下多少个乒乓球? 一
相关热词 c# 二进制截断字符串 c#实现窗体设计器 c#检测是否为微信 c# plc s1200 c#里氏转换原则 c# 主界面 c# do loop c#存为组套 模板 c# 停掉协程 c# rgb 读取图片
立即提问

相似问题

1
请大神指教:Abp框架怎么写Api
1
机器学习knn算法中目标变量转换为factor
5
求大神帮忙:jsp报500错误
1
问题不大,代码有点长,求大神解答:tensorflow生成tfrecord文件运行不下去
2
Java中如何证明条件运算符(?:)的结合性是从右向左?
1
本人C++小白,初学C++,QT,想向各位大神请教下QT调用C++的dll 问题
2
求大神帮助:OWIN创建webapi时 如何接收客户端post过来的json内容
0
数据库登录问题,请教各位大神
1
通过数据分析,根据水电燃气费等分析出租户身份?如何解决,请大神提供思路?
7
python怎么在输出变量时加上引号
3
求大神帮忙:我这个ORACLE语句怎么改成mysql的
0
请问为什么我的上位机接收不到数据?这是我的控件代码,虚心向大神请教。
2
pycharm中出现name 'reponse' is not defined错误怎么解决,请教大神,急????
3
mybatis是否支持mysql中的局部变量
0
c#调用cplex中的问题中,如何用01决策变量*整数决策变量,有大神吗
1
springboot如何把图片上传到oss上,并把图片地址存到数据库中?
2
继续请大神解答问题。JAVA面对对象,两道题
1
间歇性出现:ora-01483:DATE或NUMBER赋值变量的长度无效
1
scrapy中Spider中的变量如何传递给Middleware中的request中
2
请教各位大神:一种新的数组排序,初测速度是快速排序的50倍,有无市场价值,时间复杂度能计算出来吗?