hadoop一个mapreduce的JOB最短执行时间

如题，我想用hadoop来进行文本检索，想法是一个查询对应一个JOB，检索的话肯定时间要快。
但是我在eclipse中跑一个JOB时，即使是什么都不做，也需要7秒，用hadoop jar命令更久。
请问这个时间可以优化吗，还是Mapreduce初始JOB就需要这么久。还有一个奇怪的现象：
JOB如果遍历文本集合来进行检索，竟然只需要6秒多，比什么都不干还快。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
小威xiaowei2 2016-04-28 08:00
关注
看起来不会有人回答了，个人感觉mapreduce就是慢，不是说它不适合实时处理吗，查询这种对响应时间要求很高的还是不能这样干，
一个job的运行时间不可能小于1s，就是什么都不干都不行。果断放弃，还好有另外一个方法

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

debug调试无法运行 Method threw.Cannot evaluate org.apache.hadoop.mapreduce.Job.toString() hadoop mapreduce 大数据有问必答
2023-04-05 23:37

回答 2 已采纳参考这篇文章试下https://blog.csdn.net/weixin_37895026/article/details/125660368
mapreduce.job执行失败 hadoop
2021-09-12 12:13

回答 2 已采纳您好，看看这篇文章是否有帮助：解决运行MapReduce时遇到:Container killed on request. Exit code is 143_ZCYlee
运行Hadoop自带的MapReduce例子求PI值异常 hadoop
2023-04-09 21:34

回答 1 已采纳你的数据节点没有找到，所以没法计算，还是配置的问题，好好检查检查
大数据Hadoop原理介绍+安装+实战操作（HDFS+YARN+MapReduce）
2021-12-14 18:11

大数据老司机的博客文章目录一、概述HDFS的设计特点二、HDFS组成1）Client2）NameNode（NN）3）DataNode（DN）4）Secondary NameNode（2NN）三、HDFS具体工作原理1）两个核心的数据结构: Fslmage和EditLog2）工作流程3）HDFS读文件流程...
大数据、Hadoop hadoop 大数据
2022-12-19 16:44

回答 1 已采纳 format只需要对NameNode做，如果你在node3做了也没关系，删除node3上的、hdfs-site.xml中配置的NameNode对应的目录即可，然后在node1上也删除相同的目录后，重新
Hadoop mapreduce传值问题 hadoop mapreduce 推荐算法
2018-04-25 00:52

回答 1 已采纳 step4输出的是 UserId\tItemId,Score，也就是Step5的Map的step4数据KEY是UserId，map的step2的数据KEY是itemID，肯定没办法走到同一个循环。
MapReduce，hadoop,eclipse hadoop java mapreduce
2022-12-15 20:47

回答 1 已采纳这些都是日志，包含处理进度、数据处理的一些统计信息，比如数据条数、所占空间大小等。
MapReduce入门编程及源码详解
2022-11-16 21:40

火玄的博客 MapReduce基础编程（源码篇）
Hadoop 1.0.2中mapreduce的版本是1还是2 hadoop mapreduce
2015-04-16 01:58

回答 1 已采纳版本1，slot。 hadoop 1.0 指的是1.x(0.20.x),0.21,0.22 hadoop 2.0 指的是2.x,0.23.x
hadoop version在执行后会自己增加两个路径 hadoop linux 大数据有问必答
2021-07-28 14:35

回答 2 已采纳需要重新设置jdk的路径,我猜想你没有进行配置,在hadoop下(在etc下)**找到hadoop-env.sh文件，用编译器打开这个文件.修改JAVA_HOME的路径为这种格式,配置Java环境时j
hadoop和大数据、spark的关系该怎么理解？ hadoop spark 大数据
2022-06-23 13:55

回答 1 已采纳 Hadoop和Spark都是处理大数据的框架。就象你说关系型数据库，这只是一个概念，但是代表了一系列的含意，比如数据是结构化的，基于关系模型存储的。而MySQL、Oracle、SqlServer这些就
大数据Hadoop，spark学习
2019-10-10 15:28

iwtbs_kevin的博客一个 Hadoop job 通常都是这样的：从 HDFS 读取输入数据；在 Map 阶段使用用户定义的 mapper function, 然后把结果写入磁盘；在 Reduce 阶段，从各个处于 Map 阶段的机器中读取 Map 计算的中间结果，使用用户...
org.apache.hadoop.fs.Options$ChecksumCombineMode hadoop mapreduce 大数据
2022-08-22 18:57

回答 3 已采纳大概率就是这个依赖与其他依赖产生了冲突，题主试一下去pom文件中，更改一下配置，将这个配置删除，就OK了
Hadoop总结
2022-07-02 13:36

ArimaMisaki的博客 Hadoop总结
MapReduce基本操作 -- 最优路径案例
2023-12-04 19:09

异世界的猫咪的博客 MapReduce基本操作 -- 最优路径案例，根据相关知识内容实现 MapReduce 最优路径的算法！
没有解决我的问题, 去提问

悬赏问题

¥20 删除和修改功能无法调用
¥15 kafka topic 所有分副本数修改
¥15 小程序中fit格式等运动数据文件怎样实现可视化？（包含心率信息））
¥15 如何利用mmdetection3d中的get_flops.py文件计算fcos3d方法的flops？
¥40 串口调试助手打开串口后,keil5的代码就停止了
¥15 电脑最近经常蓝屏，求大家看看哪的问题
¥60 高价有偿求java辅导。工程量较大，价格你定，联系确定辅导后将采纳你的答案。希望能给出完整详细代码，并能解释回答我关于代码的疑问疑问，代码要求如下，联系我会发文档
¥50 C++五子棋AI程序编写
¥30 求安卓设备利用一个typeC接口，同时实现向pc一边投屏一边上传数据的解决方案。
¥15 SQL Server analysis services 服务安装失败

hadoop一个mapreduce的JOB最短执行时间

2条回答 默认 最新

悬赏问题

2条回答默认最新