oHouQiZhiXiu 2015-04-03 09:33 采纳率: 0%
浏览 1781
已结题

新手weka问题,急SOS~~

没做过数据挖掘这方面,但是那边安排了个这方面的活,要求用weka做挖掘,现学了两天半吊子,特来求解各位大神。
问题1:现在遇到问题是挖掘内容大概150w条,在mysql中占400+M.当我用weka从数据库导入时weka就会死掉,
我把jvm内存调到1500M还是崩,再调大了就不允许。是不是和我机子内存有关系,加内存就能解决问题么,有没有别的解决方案,我用的机子内存4G
问题2:我想通过调用weka的api直接把聚类结果拿来直接传到前台做图展示,可是发现weka的clusterResultsToString()方法返回的结果都是比较杂,有没有直接返回聚类名和所占比例的方法函数
问题3:因为公司那边还没给全数据,只是给了数据库表结构和不到1/3的数据,挖的内容是关于产品,产地,产品审批信息状态等等,那边说先编好代码再填数据,一段时间自动根据数据重新挖掘展示,并且要求挖出100~200个可以展示的表,以供他们提供思路上的创新。话说这样怎么挖掘啊,这种展示类的我是不是只能从聚类上下手,关联这部分没数据的话是没法做吧。我太菜求解释。

  • 写回答

2条回答 默认 最新

报告相同问题?

悬赏问题

  • ¥60 求一个简单的网页(标签-安全|关键词-上传)
  • ¥35 lstm时间序列共享单车预测,loss值优化,参数优化算法
  • ¥15 基于卷积神经网络的声纹识别
  • ¥15 Python中的request,如何使用ssr节点,通过代理requests网页。本人在泰国,需要用大陆ip才能玩网页游戏,合法合规。
  • ¥100 为什么这个恒流源电路不能恒流?
  • ¥15 有偿求跨组件数据流路径图
  • ¥15 写一个方法checkPerson,入参实体类Person,出参布尔值
  • ¥15 我想咨询一下路面纹理三维点云数据处理的一些问题,上传的坐标文件里是怎么对无序点进行编号的,以及xy坐标在处理的时候是进行整体模型分片处理的吗
  • ¥15 一直显示正在等待HID—ISP
  • ¥15 Python turtle 画图