大数据 136个问题
2018.01.16 10:35来自 TheManOfCoding 悬赏 20C
impalad服务启动不了,如何解决?
我服务器上面的所有防火墙都关闭了。我的三个数据节点分级别是data1,data2,data3,它们三个上面impalad服务全都死了,我重新开启之后过一会就又死了。其中以data1为例,以下是我的错误截图: ![...
3

回答

2018.01.07 20:34来自 m0_37347456 悬赏 5C
大数据hive分区表导入数据的问题
分区表导入数据load data local inpath '/opt/datas/distdata/emp.txt' into table emp_partition partition(month='20151...
5

回答

2018.01.06 22:34来自 qq_16590545 悬赏 20C
大数据排序,请高手指点
我有10亿的用户数据放在节点中;key,value格式:姓名、金额 数据场景:这10亿为交易支付数据,可能存在重复支付的数据 计算设备:一台物理机、配置不限、需要运用nosql中间件来处理这10亿数据。 问题:我要...
3

回答

2017.12.27 11:27来自 cc395800 悬赏 10C
求助:大数据环境下下载数据的性能问题
大数据环境用的是CDH5.11,主要组件是hadoop+zookeeper+hbase+solr+hive, 目前hbase数据量为5亿,用solr查询habse,多条件分页查询很快, 最近提出了下载功能,需要将查...
2

回答

2017.12.19 11:16来自 liu15838011628 悬赏 5C
MongoDB大数据下是否需要分表
目前公司使用MongoDB存储业务数据,每天产生2000万条左右,数据保存90天, 这样单独一张表会存在20亿左右数据。 为保证数据操作(增、删、改、查)的效率,是否需要对表进行分表? 一段时间生成一张...
3

回答

2017.12.16 22:40来自 baishuiniyaonulia 悬赏 5C
机器学习到底要不要大数据的支持,如果要数据的支持,支持到哪一步?
机器学习到底要不要大数据的支持,如果要数据的支持,支持到哪一步? 众所周知AlphaGo是需要大量的数据来进行学习的,ZERO却只需要少量的数据样本即可达到甚至超过AlphaGo的水准,那么问题来了,这个数据...
9

回答

2017.12.11 00:18来自 u012587011 悬赏 80C
Spark部署不知为何出错
从网上找的linearRegression案例 ![图片说明](http://img.ask.csdn.net/upload/201712/11/1512922142_727946.png) 本地是可以跑通...
4

回答

2017.12.10 23:34来自 eeeewwwqq
大数据量下数据怎么全量比较
大数据量下数据怎么全量比较 大数据量下数据怎么全量比较 大数据量下数据怎么全量比较 有没有好的思路
2

回答

2017.12.06 01:23来自 ll1111r
新手,大数据在循环中应怎么样提高运行效率,一道简单的题目为例
![图片说明](http://img.ask.csdn.net/upload/201712/06/1512494493_296049.jpg) 一个数如果满足以下全部条件的话,那么这个数便是滋润数。 1. a为...
1

回答

2017.11.25 13:04来自 qq_17260701 悬赏 100C
千万级文本特征向量互相匹配计算余弦距离带来大量计算量该如何解决
最近公司有个需求,要求要对2800万客户的地址(短中文文本),从中找出两两地址相似的客户。比如A 客户填写的地址与B客户填写的地址相似,不要求完全想等,就可以认为他们可能存在关系。最后把所有两两有地址相似的客...
2

回答

共136条数据 1 3 4 ... 尾页