清华学霸、阿里算法工程师带你大战机器学习第二十六期
2017年03月29日--2017年04月03日 分享到:

数据科学家是当下炙手可热的职业,机器学习则是他们的必备技能。机器学习在大数据分析中居于核心地位,在互联网、金融保险、制造业、零售业、医疗等产业领域发挥了越来越大的作用且日益受到关注。然而Python 也是最好最热门的编程语言之一,以简单易学、应用广泛、类库强大而著称,是实现机器学习算法的首选语言。
Python与机器学习两者的碰撞会擦出哪些火花呢?
本期专家问答我们请来了《 Python大战机器学习:数据科学家的第一个小目标 》一书作者 华校专、王正林 来为大家解答机器学习相关问题。

本期问答内容
1、机器学习基础算法
2、机器学习的高级算法
3、机器学习中的特征工程
4、机器学习中正则化的本质
5、典型互联网公司的机器学习工程以及对从业者的要求
6、数学科学的工作要求那些技能
7、学生如何准备找数据科学的工作

作者简介:
华校专
这里写图片描述

清华航天学院工程力学本科,国防科大计算机专业硕士。学霸一枚,清华四年每年成绩都是本系头名。毕业后曾在部队从事专业相关工作,并研读了大量专业书籍在,从操作系统底层到应用APP开发,并且仿照 C++ STL 的风格实现了各种算法(算法导论的C++实现已经放在个人的github上)

为了营造更好的问答氛围,我们不欢迎一切与主题无关的讨论、灌水。欢迎大家踊跃提问,华校专老师会为大家解答问题,并在活动结束后奖励提问的每位用户提供100论坛可用分以及三位幸运用户赠书一本

这里写图片描述

新书购买:点击

已结束
本期嘉宾 1490582671 240307 华校专 清华航天学院工程力学本科,国防科大计算机专业硕士。学霸一枚,清华四年每年成绩都是本系头名。毕业后曾在部队从事专业相关工作,并研读了大量专业书籍在,从操作系统底层到应用APP开发,并且仿照 C++ STL 的风格实现了各种算法(算法导论的C++实现已经放在个人的github上)
2 livej liveJ 2017.03.29 10:15提问
海量数据下机器学习的几个问题

1、建模的耗时问题?
2、如何降低重复建模?
3、基于hadoop等并行计算平台下的机器学习算法该注意什么?
ps:您的个人github地址方便发出来吗?

2 wa2003 wa2003 2017.03.29 20:04回答

1、耗时问题,是指模型算起来很慢是吗?这个没办法,要不怎么有并行计算和集群呢,数据量大,算起来比如慢,还好有集群和多核甚至GPU,空间换时间;
2、重复建模,大公司的项目组,一般会将一些常用的算法封装,这样相同的问题就可以服用,尤其是一些耗时的工作,如数据预处理。
3、注意就是可能坑多,开源的东西,踩坑是必然的。
github地址,书里面有。

2 u012831423 u012831423 2017.03.29 08:58提问
Python对于机器学习为什么是热门语言?

从业不久,未接触过python,想问下Python语言为什么是机器学习的热门语言,本书选择Python大战机器学习为标题的动机是什么。

2 wa2003 wa2003 2017.03.29 19:57回答

1、python简单易学,能从前端干到后台,生态比较好,你用python做的算法,与其他部门也好交互;
2、python的算法包很多,R里面的算法包,这里基本上也都有,而且有些包,python有R还没有呢。
3、动机是,做机器学习用python吧,理由是1和2。

u012831423
u012831423 谢谢回答,看来要学一下python了。
8 个月之前 回复
2 yuyulvxian study yuyulvxian_study 2017.03.28 12:57提问
从事机器学习算法工作,具体需要哪些数学知识

从事机器学习算法工作,具体需要哪些数学知识。能否列举一下相关的数学分支,
涵盖基础和进阶的。非常感谢。

2 wa2003 wa2003 2017.03.29 19:45回答

大学那几门数学基本都要用到。
1、线性代数,主要是矩阵变换,线性变换等知识;
2、概率与统计,主要是样本的统计特征、条件概率、样本分布、极大似然估计等知识;
3、高数,主要是求导,极值等知识。

希望以上回答了您的问题

共12条数据 首页 1 2 4