现在对于大数据,脱口而出就是4个V(量Volume,多样Variety,价值Value,速Velocity),这些在BAT公司可能时常关注。 但是对于大部分中小型企业来说,做好自己的产品仅是最好的目标了。真正对于分布式、数据挖掘、数据分析,还用不上。自己去自学,也有点茫然。有种望之长叹,无从下手的感叹。若一个从未接触大数据的人,想自学的话,该如何入手,若一个IT公司想引入大数据理念并执行,该如何下手。望指导~
1条回答 默认 最新
- gaoyangau 2016-06-27 11:43关注
你好。
你说的这些内容确实很多,很容易迷茫,不过对于个人发展仍然把握两个原则,一个是“扬长避短”,一个是“厚积薄发”。
扬长避短的意思就是还是要找自己擅长的方面,比如自己对于数学、统计学这些比较擅长,那么就可以走分析路线,具体的hadoop/spark这些工程性的框架会用就可以了;如果对数学方面不感冒,走大数据可视化、大数据编程,这些开发相关的路线也可以。
厚积薄发的意思就是说如果想未来5年10年还是保持优势的话,还是要去做积累性比较好的领域,比如窄而深的针对某种行业的具体分析场景或应用场景等。
关于你提到的分布式,数据挖掘,数据分析这些东西,从一种入手就可以,没必要同时开始学,这样会让自己的焦点不容易集中。
你提到的大数据理念,我想应该是说的数据运营吧,就是根据数据的解读来找公司业务的改进方向,是这样吗?
我想除了目前市面能找到一些针对具体业务数据分析相关的读本以外,我的书应该也能帮上你一些。把工作中的内容指标化,长期化观察它们的运行规律、分布特点,以及改进工作后的效能提升,并逐步总结出“专家系统”或者“KNOW HOW”来,这样我认为就是对大数据应用的良好诠释了。解决 无用评论 打赏 举报
悬赏问题
- ¥15 交替优化波束形成和ris反射角使保密速率最大化
- ¥15 树莓派与pix飞控通信
- ¥15 自动转发微信群信息到另外一个微信群
- ¥15 outlook无法配置成功
- ¥30 这是哪个作者做的宝宝起名网站
- ¥60 版本过低apk如何修改可以兼容新的安卓系统
- ¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
- ¥50 有数据,怎么建立模型求影响全要素生产率的因素
- ¥50 有数据,怎么用matlab求全要素生产率
- ¥15 TI的insta-spin例程