清华学霸、阿里算法工程师带你大战机器学习第二十六期
2017年03月29日--2017年04月03日 分享到:

数据科学家是当下炙手可热的职业,机器学习则是他们的必备技能。机器学习在大数据分析中居于核心地位,在互联网、金融保险、制造业、零售业、医疗等产业领域发挥了越来越大的作用且日益受到关注。然而Python 也是最好最热门的编程语言之一,以简单易学、应用广泛、类库强大而著称,是实现机器学习算法的首选语言。
Python与机器学习两者的碰撞会擦出哪些火花呢?
本期专家问答我们请来了《 Python大战机器学习:数据科学家的第一个小目标 》一书作者 华校专、王正林 来为大家解答机器学习相关问题。

本期问答内容
1、机器学习基础算法
2、机器学习的高级算法
3、机器学习中的特征工程
4、机器学习中正则化的本质
5、典型互联网公司的机器学习工程以及对从业者的要求
6、数学科学的工作要求那些技能
7、学生如何准备找数据科学的工作

作者简介:
华校专
这里写图片描述

清华航天学院工程力学本科,国防科大计算机专业硕士。学霸一枚,清华四年每年成绩都是本系头名。毕业后曾在部队从事专业相关工作,并研读了大量专业书籍在,从操作系统底层到应用APP开发,并且仿照 C++ STL 的风格实现了各种算法(算法导论的C++实现已经放在个人的github上)

为了营造更好的问答氛围,我们不欢迎一切与主题无关的讨论、灌水。欢迎大家踊跃提问,华校专老师会为大家解答问题,并在活动结束后奖励提问的每位用户提供100论坛可用分以及三位幸运用户赠书一本

这里写图片描述

新书购买:点击

已结束
本期嘉宾 1490582671 240307 华校专 清华航天学院工程力学本科,国防科大计算机专业硕士。学霸一枚,清华四年每年成绩都是本系头名。毕业后曾在部队从事专业相关工作,并研读了大量专业书籍在,从操作系统底层到应用APP开发,并且仿照 C++ STL 的风格实现了各种算法(算法导论的C++实现已经放在个人的github上)
2 fuyonggao fuyonggao 2017.04.02 01:00提问
华老师您好,我想调用您的API生成1个实例

华老师您好:您能提供1个API接口吗?我调用此API能创建1个人大脑实例

2 wa2003 wa2003 2017.04.04 21:29回答

这个没有API接口,书上的代码有git,前言里有,请仔细看一下吧。

fuyonggao
fuyonggao 老师,说得你真能提供模拟人脑实例一般。
大约 2 个月之前 回复
2 xiaohao890809 xiaohao890809 2017.04.01 21:14提问
华老师,您好,请问在分类问题的建模过程中数据是非均衡的以及有噪点时该如何处理呢?

通过改变类别的权重会有效果吗?另外PCA降维和SVD之类的对于处理噪点有帮助吗?还请老师指点一二,谢谢!

2 wa2003 wa2003 2017.04.04 14:16回答

如果有偏离正常值很远的噪点,则可以通过异常点检测算法来检测。另外也可以考虑滤波算法将数据通过一个滤波器。

如果是类别不平衡问题,那么一般需要考虑降采样,从而平衡类别的比例。改变类别的权重的本质是算法偏好的取舍:你的算法倾向于选择权重较大的类别。

PCA 降维之类的算法只是将数据从高维降低到低维空间,它并没有增加或者减少样本数据。但是如果你的噪点与正常点在低纬空间的投影重合的,那么噪点就被正常点给掩盖住了。所以PCA降维之类的算法,对于噪点问题,至少它没有坏处。

2 x15327576405 x15327576405 2017.04.01 15:47提问
转到Python的磨合适应期会很长吗?

专家老师您好,很长时间都是用的node.js,也想过深入算法领域,但是数学基础不如编码能力扎实。如果开始学习,会很难懂以及很难适应吗?

2 wa2003 wa2003 2017.04.04 14:17回答

Python是一门对新手很友好的语言。基本上有编程功底的话,会很快上手。这门语言的优点是有大量的第三方库,基本上你能想到的功能都有别人实现好的工具。你专注于你的问题求解,而不是工具的制造。

共12条数据 1 3 4 尾页