student1562659 2022-11-11 13:27 采纳率: 100%
浏览 27
已结题

数据挖掘学习规划建议

机器学习必须掌握的知识与技能有哪些?想从事数据挖掘机器学习方向应该掌握哪些技能?

  • 写回答

4条回答 默认 最新

  • CSDN专家-sinJack 2022-11-11 14:33
    关注
    1. 计算机科学基础和编程
    2. 概率论和数理统计
    3. 数据建模及评估
    4. 应用机器学习算法和库
    5. 软件工程和系统设计
    
    工程能力
    ( 1 )编程基础:需要掌握一大一小两门语言,大的指 C++ 或者 Java ,小的指Python 或者 shell 脚本;需要掌握基本的数据库语言;
    建议:MySQL + python + C++ ;语言只是一种工具,看看语法就好;
    推荐书籍:《C++ primer plus 》
    ( 2 )开发平台: Linux ;
    建议:掌握常见的命令,掌握 Linux 下的源码编译原理;
    推荐书籍:《Linux 私房菜》
    ( 3 )数据结构与算法分析基础:掌握常见的数据结构以及操作(线性表,队,列,字符串,树,图等),掌握常见的计算机算法(排序算法,查找算法,动态规划,递归等);
    建议:多敲代码,多刷题;
    推荐书籍:《大话数据结构》《剑指 offer 》
    ( 4 )海量数据处理平台: Hadoop ( mr 计算模型,java 开发)或者 Spark ( rdd 计算模型, scala开发),重点推荐后者;
    建议:主要是会使用,有精力的话可以看看源码了解集群调度机制之类的;
    推荐书籍:《大数据 spark 企业级实战》
    算法能力
    ( 1 )数学基础:概率论,数理统计,线性代数,随机过程,最优化理论
    建议:这些是必须要了解的,即使没法做到基础扎实,起码也要掌握每门学科的理论体系,涉及到相应知识点时通过查阅资料可以做到无障碍理解;
    ( 2 )机器学习 / 深度学习:掌握 常见的机器学习模型(线性回归,逻辑回归, SVM ,感知机;决策树,随机森林, GBDT , XGBoost ;贝叶斯, KNN , K-means , EM 等);掌握常见的机器学习理论(过拟合问题,交叉验证问题,模型选择问题,模型融合问题等);掌握常见的深度学习模型( CNN ,RNN 等);
    建议:这里的掌握指的是能够熟悉推导公式并能知道模型的适用场景;
    推荐书籍:《统计学习方法》《机器学习》《机器学习实战》《 UFLDL 》
    ( 3 )自然语言处理:掌握常见的方法( tf-idf , word2vec ,LDA );
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(3条)

报告相同问题?

问题事件

  • 系统已结题 11月19日
  • 已采纳回答 11月11日
  • 创建了问题 11月11日

悬赏问题

  • ¥15 腾讯云如何建立同一个项目中物模型之间的联系
  • ¥30 VMware 云桌面水印如何添加
  • ¥15 用ns3仿真出5G核心网网元
  • ¥15 matlab答疑 关于海上风电的爬坡事件检测
  • ¥88 python部署量化回测异常问题
  • ¥30 酬劳2w元求合作写文章
  • ¥15 在现有系统基础上增加功能
  • ¥15 远程桌面文档内容复制粘贴,格式会变化
  • ¥15 这种微信登录授权 谁可以做啊
  • ¥15 请问我该如何添加自己的数据去运行蚁群算法代码