hadoop中wordcount使用IKsegmenter分词器后本地编译运行通过，打成jar包后报IKsegmenter类无法找到

使用eclipse在本地上编译运行的时候没有问题，output能够获得正常结果。
但是使用hadoop运行时就会报错，之前没有使用过ecipse，在网上找了半天，export里面的选项来回试了一下也没成功..以下是报错信息：

19/11/19 20:57:39 INFO client.RMProxy: Connecting to ResourceManager at bigdata-senior01.chybinmy.com/192.168.100.10:8032
19/11/19 20:57:40 INFO input.FileInputFormat: Total input files to process : 1
19/11/19 20:57:40 INFO mapreduce.JobSubmitter: number of splits:1
19/11/19 20:57:41 INFO Configuration.deprecation: yarn.resourcemanager.system-metrics-publisher.enabled is deprecated. Instead, use yarn.system-metrics-publisher.enabled
19/11/19 20:57:41 INFO mapreduce.JobSubmitter: Submitting tokens for job: job_1574165004078_0005
19/11/19 20:57:41 INFO conf.Configuration: resource-types.xml not found
19/11/19 20:57:41 INFO resource.ResourceUtils: Unable to find 'resource-types.xml'.
19/11/19 20:57:41 INFO resource.ResourceUtils: Adding resource type - name = memory-mb, units = Mi, type = COUNTABLE
19/11/19 20:57:41 INFO resource.ResourceUtils: Adding resource type - name = vcores, units = , type = COUNTABLE
19/11/19 20:57:42 INFO impl.YarnClientImpl: Submitted application application_1574165004078_0005
19/11/19 20:57:42 INFO mapreduce.Job: The url to track the job: http://bigdata-senior01.chybinmy.com:8088/proxy/application_1574165004078_0005/
19/11/19 20:57:42 INFO mapreduce.Job: Running job: job_1574165004078_0005
19/11/19 20:57:49 INFO mapreduce.Job: Job job_1574165004078_0005 running in uber mode : false
19/11/19 20:57:49 INFO mapreduce.Job:  map 0% reduce 0%
19/11/19 20:57:53 INFO mapreduce.Job: Task Id : attempt_1574165004078_0005_m_000000_0, Status : FAILED
Error: java.lang.ClassNotFoundException: org.wltea.analyzer.core.IKSegmenter
    at java.net.URLClassLoader$1.run(URLClassLoader.java:366)
    at java.net.URLClassLoader$1.run(URLClassLoader.java:355)
    at java.security.AccessController.doPrivileged(Native Method)
    at java.net.URLClassLoader.findClass(URLClassLoader.java:354)
    at java.lang.ClassLoader.loadClass(ClassLoader.java:425)
    at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:308)
    at java.lang.ClassLoader.loadClass(ClassLoader.java:358)
    at com.example.test.ChineseWordCount$TokenizerMapper.map(ChineseWordCount.java:36)
    at com.example.test.ChineseWordCount$TokenizerMapper.map(ChineseWordCount.java:1)
    at org.apache.hadoop.mapreduce.Mapper.run(Mapper.java:146)
    at org.apache.hadoop.mapred.MapTask.runNewMapper(MapTask.java:793)
    at org.apache.hadoop.mapred.MapTask.run(MapTask.java:341)
    at org.apache.hadoop.mapred.YarnChild$2.run(YarnChild.java:177)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:415)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1893)
    at org.apache.hadoop.mapred.YarnChild.main(YarnChild.java:171)

19/11/19 20:57:58 INFO mapreduce.Job: Task Id : attempt_1574165004078_0005_m_000000_1, Status : FAILED
Error: java.lang.ClassNotFoundException: org.wltea.analyzer.core.IKSegmenter
    at java.net.URLClassLoader$1.run(URLClassLoader.java:366)
    at java.net.URLClassLoader$1.run(URLClassLoader.java:355)
    at java.security.AccessController.doPrivileged(Native Method)
    at java.net.URLClassLoader.findClass(URLClassLoader.java:354)
    at java.lang.ClassLoader.loadClass(ClassLoader.java:425)
    at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:308)
    at java.lang.ClassLoader.loadClass(ClassLoader.java:358)
    at com.example.test.ChineseWordCount$TokenizerMapper.map(ChineseWordCount.java:36)
    at com.example.test.ChineseWordCount$TokenizerMapper.map(ChineseWordCount.java:1)
    at org.apache.hadoop.mapreduce.Mapper.run(Mapper.java:146)
    at org.apache.hadoop.mapred.MapTask.runNewMapper(MapTask.java:793)
    at org.apache.hadoop.mapred.MapTask.run(MapTask.java:341)
    at org.apache.hadoop.mapred.YarnChild$2.run(YarnChild.java:177)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:415)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1893)
    at org.apache.hadoop.mapred.YarnChild.main(YarnChild.java:171)

19/11/19 20:58:03 INFO mapreduce.Job: Task Id : attempt_1574165004078_0005_m_000000_2, Status : FAILED
Error: java.lang.ClassNotFoundException: org.wltea.analyzer.core.IKSegmenter
    at java.net.URLClassLoader$1.run(URLClassLoader.java:366)
    at java.net.URLClassLoader$1.run(URLClassLoader.java:355)
    at java.security.AccessController.doPrivileged(Native Method)
    at java.net.URLClassLoader.findClass(URLClassLoader.java:354)
    at java.lang.ClassLoader.loadClass(ClassLoader.java:425)
    at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:308)
    at java.lang.ClassLoader.loadClass(ClassLoader.java:358)
    at com.example.test.ChineseWordCount$TokenizerMapper.map(ChineseWordCount.java:36)
    at com.example.test.ChineseWordCount$TokenizerMapper.map(ChineseWordCount.java:1)
    at org.apache.hadoop.mapreduce.Mapper.run(Mapper.java:146)
    at org.apache.hadoop.mapred.MapTask.runNewMapper(MapTask.java:793)
    at org.apache.hadoop.mapred.MapTask.run(MapTask.java:341)
    at org.apache.hadoop.mapred.YarnChild$2.run(YarnChild.java:177)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:415)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1893)
    at org.apache.hadoop.mapred.YarnChild.main(YarnChild.java:171)

19/11/19 20:58:11 INFO mapreduce.Job:  map 100% reduce 100%
19/11/19 20:58:12 INFO mapreduce.Job: Job job_1574165004078_0005 failed with state FAILED due to: Task failed task_1574165004078_0005_m_000000
Job failed as tasks failed. failedMaps:1 failedReduces:0

19/11/19 20:58:12 INFO mapreduce.Job: Counters: 13
    Job Counters 
        Failed map tasks=4
        Killed reduce tasks=1
        Launched map tasks=4
        Other local map tasks=3
        Data-local map tasks=1
        Total time spent by all maps in occupied slots (ms)=12897
        Total time spent by all reduces in occupied slots (ms)=0
        Total time spent by all map tasks (ms)=12897
        Total vcore-milliseconds taken by all map tasks=12897
        Total megabyte-milliseconds taken by all map tasks=13206528
    Map-Reduce Framework
        CPU time spent (ms)=0
        Physical memory (bytes) snapshot=0
        Virtual memory (bytes) snapshot=0
[hadoop@bigdata-senior01 hadoop-2.10.0]$ bin/hdfs dfs -ls /
Found 4 items
drwxr-xr-x   - hadoop supergroup          0 2019-11-19 20:13 /input
drwxr-xr-x   - hadoop supergroup          0 2019-11-19 20:54 /output
drwxr-xr-x   - hadoop supergroup          0 2019-11-19 20:58 /output2
drwx------   - hadoop supergroup          0 2019-11-19 20:16 /tmp

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
明初啥都能学会 2024-04-18 22:05
关注
这个错误 java.lang.ClassNotFoundException: org.wltea.analyzer.core.IKSegmenter 表明 Hadoop 无法找到 org.wltea.analyzer.core.IKSegmenter 这个类。这可能是由于缺少相应的依赖库或者没有将依赖库打包到您的 Jar 文件中导致的。

为了解决这个问题，您需要确保在 Hadoop 的类路径中包含了 org.wltea.analyzer.core.IKSegmenter 类所在的依赖库。您可以尝试将相关的 jar 文件添加到 Hadoop 的 classpath 中或者将其包含在您的项目的依赖中，并重新提交作业。如果您使用 Maven 进行构建项目，可以将相关的依赖添加到 pom.xml 文件中。

另外，请确保您的项目中包含了所有需要的依赖，并且在提交作业时将它们一起打包到 Jar 文件中。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

我的jar包在hadoop运行程序出现了问题（非代码错误） hadoop java 有问必答
2021-07-27 18:50

回答 2 已采纳可参考：https://blog.csdn.net/wk51920/article/details/51698042https://stackoverflow.com/questions/145540
Hadoop如何运行本地jar包 hadoop
2016-07-05 10:51

回答 2 已采纳进入jar包所在目录下执行指令
hadoop 运行本地jar包无法读取文件。 hadoop
2018-09-30 02:05

回答 2 已采纳使用-files option加上本地文件路径即可。
重新编译hadoop的wordcount集成ik分词器
2017-03-28 09:29

wallfeacers的博客 1、手动安装ik-analyzers到本地仓库，这是因为maven仓库支持的版本太，高目前支持5.1.0版本，在编译的时候楼主使用的JDK版本是1.8.0_111，而运行的时候使用的JDK 版本是1.7.0_79，这样的话有个版本问题解决方式一...
maven仓库导入jar包后，无法引用类 intellij-idea jar
2019-01-20 10:18

回答 2 已采纳你先确定导入是否正确，如果导入的时候都不正确，那肯定找不到，再看看maven库里面有没有对应该版本的jar包。你点开Lib看看该包里面有没有你要找的类，有的时候版本更新会移动类的地址。
hadoop运行jar包的那些事 hadoop java mapreduce
2023-03-22 00:06

回答 2 已采纳 1.、程序执行出现Error: java.lang.NullPointerException空指针异常，确保java程序的正确。变量什么的使用前先实例化声明，不要有数组越界之类的现象。检查程序。2、执
大数据hadoop3.x.x在win10环境下编译后的jar包 linux 开发语言
2019-03-29 14:19

回答 2 已采纳 [hadoop](http://archive.apache.org/dist/hadoop/core/hadoop-3.0.0/ "")
Hadoop示例程序WordCount运行及详解
2022-08-16 17:44

m0_67393039的博客其实WordCount并不难，只是一下子接触到了很多的API，有一些陌生，还有就是很传统的开发相比，map-reduce确实是一种新的编程理念，为了让各位新手少走弯路，我将WordCount中的很多API都做了注释，其实这些方法搞...
hadoop 运行wordcount出错 hadoop
2021-10-01 19:28

回答 3 已采纳 Container [pid=7204,containerID=container_1607355221856_0001_01_000002] is running b
hadoop简单问题，如何在spring boot中，同时使用这4个jar，能够正常运行 gradle hadoop java spring
2018-03-14 08:19

回答 3 已采纳因为依赖的配置路径变了
hadoop运行wordcount时main程序的输入参数不是2个 jar java linux
2019-11-10 17:31

回答 1 已采纳调试下你的args数组的长度是多少。
hadoop中文词频统计WordCount实验
2021-11-05 19:02

夏目玲子Ling的博客前提准备：这里我已经安装好了Ubantu的伪分布式，带有hadoop和JAVA的所以就不需要准备了，没安装的需要配置Java JDK 安装Hadoop和安装eclipse 需要用到Hadoop的插件、IK分词jar包、ChineseWordCount源代码。...
Flink Java 运行WordCount程序报错 flink java 有问必答
2022-04-04 22:57

回答 2 已采纳本地执行需要去掉，依赖范围provided，可以查看我的微博，flink专栏
hadoop-wordcount本地模式及集群模式运行
2019-03-29 17:12

勇敢牛牛_的博客并通过hadoop -jar命令运行了Hadoop自带的一个wordcount例子，那本片文章就通过实现一个wordcount程序，并在本地模式下运行这个程序，了解一下mapreduce编码规范，最后再将这个jar包提交到真正的集群上运行。...
hadoop中文wordcount无结果输出
2017-04-02 11:28

liangsheng_g的博客废话不多说，最近在学hadoop，然后利用docker搭建的集群，网上有利用docker搭建hadoop的博客教程。但是需要提醒一下，我看的两篇博客都没设置将mapreduce函数放到yarn平台跑，都是自己利用本地机器跑的。自己边...
没有解决我的问题, 去提问

悬赏问题

¥30 这是哪个作者做的宝宝起名网站
¥60 版本过低apk如何修改可以兼容新的安卓系统
¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
¥50 有数据，怎么建立模型求影响全要素生产率的因素
¥50 有数据，怎么用matlab求全要素生产率
¥15 TI的insta-spin例程
¥15 完成下列问题完成下列问题
¥15 C#算法问题, 不知道怎么处理这个数据的转换
¥15 YoloV5 第三方库的版本对照问题
¥15 请完成下列相关问题！