大数据 全部 | 未解决 | 已解决
2019.04.24 12:37来自 qq_44970389

请问各位大神们分布式环境下hadoop集群搭建实训报告怎么写

分布式环境下hadoop集群搭建实训报告怎么写 所用设备 实验原理实验内容及步骤
1

回答

2018.12.11 08:54来自 学编程的萌新

hadoop + hive + tez 整合问题

我使用的hadoop以及hive还有tez的版本是: hadoop2.6.0-cdh5.13.0 + hive1.1.0-cdh5.13.0 + tez0.8.5 在hadoop集群上面,mr能够换成tez...
0

回答

2018.12.06 09:12来自 河西那头

hadoop用hive清洗、处理后如何给用户展示?

公司接了个大数据的活,没做过。 难道要hive处理后的数据再放到hbase?
3

回答

2018.11.22 06:01来自 听说海的那边有宝藏

我怎么才能知道 Ambari 的公共库文件(public repository)地址呢?

我怎么才能知道 Ambari 的公共库文件(public repository)地址呢? 网上教程都是直接wget,但是后面的地址到底是哪里查到的呢?或者是有什么规律呢?
1

回答

2018.11.07 13:10来自 式微胡不归

[已解决] hadoop第一个程序WordCount出现的问题

我用mapreduce做单词的统计 数据: ![图片说明](https://img-ask.csdn.net/upload/201811/07/1541595872_223143.png) ...
2

回答

2018.11.07 06:36来自 杜少陵

HashMap如何设计缓存大数据

场景: 1. 表A的数据每月刷新一次,数据量较大,主要通过外部excel导入; 2. 获取表B的数据和表A数据按照一定的条件规则进行比对; 3. 再将符合条件的比对结果存入表C。 问: 如何设计缓存表...
1

回答

2018.10.31 07:23来自 Knimet

[已解决] 深度学习验证集accuracy和测试集accuracy的问题

我对一份数据集构建了一个两层的baseline和一个深层的网络,两份模型在验证集上的表现是相同的acc 67左右,但是在测试集上两层的网络acc 37,后面这个深层的63,为什么会这样? 同样的训练集、验证集和测试集
2

回答

2018.10.30 11:12来自 吴家行hang

列存储的数据进行压缩和解压?

现有一个包含两列数据的大数据txt文件,如何对其进行压缩和解压?
1

回答

2018.10.26 13:59来自 望隐少年

Secondary namenode工作原理提问!~

看网上是这么写的,hdfs进行写操作的时候,NameNode会先把操作写到edits log里然后再保存到内存里,而不是直接写入内存里?请问为何要多此一举呢,如果直接把内存的数据合并到fsimage里不是更好? ...
1

回答

2018.10.24 16:59来自 妙蛙种子bibi 悬赏 5C

sqoop数据倾斜问题,如何解决

如何解决数据倾斜问题? ![图片说明](https://img-ask.csdn.net/upload/201810/25/1540400318_596472.png) ![图片说明](https://im...
1

回答