1.有大量数据,只有数据没有其他信息。在不知道取得什么结果的情况下,分析数据,进行聚类、回归等计算,算出来啥就是啥。数据有表头,但是电力专业化程度较高。要求仅通过数据进行分析。(客户给出的限制)这些数据我都分析不出来最基本的K-means算法分几类,或者看不懂是否含有线性回归的关系,客户说有,我看不出来。
2.我没学过大数据和算法,目前做到的只是搭建起来hadoop、spark、hive之类的,java写MapReduce需要算法基础,PySpark一样需要先了解算法,在了解API。
3.希望有兴趣的大佬帮忙做做看。you chang的哦,详情私聊。