student1562659 2022-11-11 05:27 采纳率: 100%
浏览 28
已结题

数据挖掘学习规划建议

机器学习必须掌握的知识与技能有哪些?想从事数据挖掘机器学习方向应该掌握哪些技能?

  • 写回答

4条回答 默认 最新

  • CSDN专家-sinJack 2022-11-11 06:33
    关注
    1. 计算机科学基础和编程
    2. 概率论和数理统计
    3. 数据建模及评估
    4. 应用机器学习算法和库
    5. 软件工程和系统设计
    
    工程能力
    ( 1 )编程基础:需要掌握一大一小两门语言,大的指 C++ 或者 Java ,小的指Python 或者 shell 脚本;需要掌握基本的数据库语言;
    建议:MySQL + python + C++ ;语言只是一种工具,看看语法就好;
    推荐书籍:《C++ primer plus 》
    ( 2 )开发平台: Linux ;
    建议:掌握常见的命令,掌握 Linux 下的源码编译原理;
    推荐书籍:《Linux 私房菜》
    ( 3 )数据结构与算法分析基础:掌握常见的数据结构以及操作(线性表,队,列,字符串,树,图等),掌握常见的计算机算法(排序算法,查找算法,动态规划,递归等);
    建议:多敲代码,多刷题;
    推荐书籍:《大话数据结构》《剑指 offer 》
    ( 4 )海量数据处理平台: Hadoop ( mr 计算模型,java 开发)或者 Spark ( rdd 计算模型, scala开发),重点推荐后者;
    建议:主要是会使用,有精力的话可以看看源码了解集群调度机制之类的;
    推荐书籍:《大数据 spark 企业级实战》
    算法能力
    ( 1 )数学基础:概率论,数理统计,线性代数,随机过程,最优化理论
    建议:这些是必须要了解的,即使没法做到基础扎实,起码也要掌握每门学科的理论体系,涉及到相应知识点时通过查阅资料可以做到无障碍理解;
    ( 2 )机器学习 / 深度学习:掌握 常见的机器学习模型(线性回归,逻辑回归, SVM ,感知机;决策树,随机森林, GBDT , XGBoost ;贝叶斯, KNN , K-means , EM 等);掌握常见的机器学习理论(过拟合问题,交叉验证问题,模型选择问题,模型融合问题等);掌握常见的深度学习模型( CNN ,RNN 等);
    建议:这里的掌握指的是能够熟悉推导公式并能知道模型的适用场景;
    推荐书籍:《统计学习方法》《机器学习》《机器学习实战》《 UFLDL 》
    ( 3 )自然语言处理:掌握常见的方法( tf-idf , word2vec ,LDA );
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(3条)
编辑
预览

报告相同问题?

问题事件

  • 系统已结题 11月18日
  • 已采纳回答 11月11日
  • 创建了问题 11月11日

悬赏问题

  • ¥15 KeiI中头文件找不到怎么解决
  • ¥15 QT6将音频采样数据转PCM
  • ¥15 本地安装org.Hs.eg.dby一直这样的图片报错如何解决?
  • ¥15 下面三个文件分别是OFDM波形的数据,我的思路公式和我写的成像算法代码,有没有人能帮我改一改,如何解决?
  • ¥15 Ubuntu打开gazebo模型调不出来,如何解决?
  • ¥100 有chang请一位会arm和dsp的朋友解读一个工程
  • ¥50 求代做一个阿里云百炼的小实验
  • ¥15 查询优化:A表100000行,B表2000 行,内存页大小只有20页,运行时3页,设计两个表等值连接的最简单的算法
  • ¥15 led数码显示控制(标签-流程图)
  • ¥20 为什么在复位后出现错误帧