用shell脚本读取Hadoop集群上的文件

我想用grep -Ff 命令提取hadoop上两个文件中相同的内容，
例如hadoop上的文件位置为/hadoop/file1和/hadoop/file2,
我想在本地用shell脚本编写比较hadoop上这两个文件内容的代码，求指点

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
oyljerry 2015-01-08 14:54
关注
需要脚步跑到Hadoop。本地没法获取

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Hadoop集群搭建时问题 big data hadoop 大数据
2022-02-09 08:07

回答 1 已采纳题主的hadoop102 和 hadoop103 应该没有开sudo 对吧，直接使用ssh进行命令的启动恐怕是不行的，可以尝试写一个跳转的shell到每个node中进行sudo启动，关于sudo权限
hadoop集群测试pi实例出错 hadoop
2022-04-24 18:59

回答 1 已采纳你好，我之前测试成功过，如有帮助，请采纳！然后进入到etc/hadoop 目录下，使用命令vim mapred-site.xml将路径添加到<property></property
Hadoop集群搭建格式化多次，没有了data文件，还有啥解决办法吗？ hadoop
2022-07-14 10:44

回答 2 已采纳每次重新搭建的时候，data文件不是自己去创建指定的吗，如果删除了那基本没法找回
Shell 脚本：Hadoop 集群一键安装脚本
2022-12-27 10:33

左瞧瞧右看看的博客一键安装完全分布式 Hadoop 集群脚本
搭建hadoop集群时，格式化失败 hadoop 大数据
2021-11-05 23:39

回答 2 已采纳哈哈，我之前也遇到类似的问题，先启动dfs start-dfs.sh,在格式化，我前两天也上传一个Hadoop集群，可以看看
【Hadoop】上传文件在虚拟机里怎么找 hadoop 大数据
2022-06-18 15:45

回答 1 已采纳你第一个图是HDFS目录，第二个是服务器磁盘目录。你上传文件是到服务器磁盘，直接拖进去就行上传都HDFS要要服务器磁盘上用Hadoop fs -put 磁盘文件 HDFS目录来上传文件
大数据、Hadoop hadoop 大数据
2022-12-19 16:44

回答 1 已采纳 format只需要对NameNode做，如果你在node3做了也没关系，删除node3上的、hdfs-site.xml中配置的NameNode对应的目录即可，然后在node1上也删除相同的目录后，重新
使用shell脚本查看HADOOP集群节点状态
2022-06-14 10:37

光数葱丁的博客但是在shell脚本中，直接使用会提示：’bash: jps: 未找到命令‘，原因很简单：因为jps命令是位于jdk的bin目录下（hadoop基于java），执行shell脚本的时候,并不会读取/etc/profile文件，因此才会找不到。解决的办法...
如何将搭建好的Hadoop集群，导入虚拟机上 linux
2022-10-06 02:10

回答 2 已采纳如果都是VMware弄好的虚拟机，就直接下载好，用VMware 在文件那里，选择---打开，之后直接选择你下载好的虚拟机就OK啊，或者，选择---扫描虚拟机都可以。我做讲师去讲课时，做好的环境，
Hadoop集群搭建好之后，开启集群出现错误 centos hadoop linux
2022-04-11 01:29

回答 1 已采纳有两个问题：第一个问题就是你说的，无法解析主机名，这应该是你在hadoop1里面，没有设置，ip地址对应主机名（hadoop1）；解决方法：修改etc/hosts文件，上面两行注释了，添加一个本机ip
hadoop集群搭建，web页面没有其他显示 hadoop 大数据有问必答
2021-09-21 11:15

回答 1 已采纳在hdfs-site.xml中关闭权限检查 <property> <name>dfs.permissions.enabled</name>
大数据开发常用Shell脚本
2022-02-18 20:41

白小脑电的博客数据仓库集群搭建时一些常用脚本，方便集群的启调停
hadoop和大数据、spark的关系该怎么理解？ hadoop spark 大数据
2022-06-23 13:55

回答 1 已采纳 Hadoop和Spark都是处理大数据的框架。就象你说关系型数据库，这只是一个概念，但是代表了一系列的含意，比如数据是结构化的，基于关系模型存储的。而MySQL、Oracle、SqlServer这些就
Hadoop | 集群配置（一）使用Shell脚本解决完全分布式集群节点之间的文件传输问题 | scp命令 | rsync命令
2022-01-15 20:40

「已注销」的博客文章目录参考资料一、前言二、rsync 远程同步工具三、使用 shell 编写分发脚本四、总结参考资料视频链接 Linux scp命令一、前言在Hadoop完全分布式集群环境下，里面的各个节点都是通过 SSH免密登陆连接的，...
Hadoop与Spark等大数据框架介绍
2018-08-09 17:06

von Neumann的博客很早以前，当一台电脑无法存储这么庞大的数据时，采用的解决方案是使用NFS(网络文件系统)将数据分开存储。但是这种方法无法充分利用多台计算机同时进行分析数据。一个实际的需求场景：日志分析日志...
没有解决我的问题, 去提问

悬赏问题

¥15 一道python难题
¥15 用matlab 设计一个不动点迭代法求解非线性方程组的代码
¥15 牛顿斯科特系数表表示
¥15 arduino 步进电机
¥20 程序进入HardFault_Handler
¥15 oracle集群安装出bug
¥15 关于#python#的问题：自动化测试
¥20 问题请教！vue项目关于Nginx配置nonce安全策略的问题
¥15 教务系统账号被盗号如何追溯设备
¥20 delta降尺度方法，未来数据怎么降尺度

用shell脚本读取Hadoop集群上的文件

1条回答 默认 最新

悬赏问题

1条回答默认最新