spark--java.lang.ArrayIndexOutOfBoundsException: 10582

源文件：

package com.wy.movie;

import java.util.ArrayList;
import java.util.List;

import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.mllib.classification.NaiveBayes;
import org.apache.spark.mllib.classification.NaiveBayesModel;
import org.apache.spark.mllib.linalg.Vector;
import org.apache.spark.mllib.linalg.Vectors;
import org.apache.spark.mllib.regression.LabeledPoint;
import org.junit.Test;

public class BayesTest1 {

    @Test
    public void TestA(){

        /**
         * 本地模式，*表示启用多个线程并行计算
         */
        SparkConf conf = new SparkConf().setAppName("NaiveBayesTest").setMaster("local[*]");
        JavaSparkContext sc = new JavaSparkContext(conf);


        /**
         * MLlib的本地向量主要分为两种，DenseVector和SparseVector
         * 前者是用来保存稠密向量，后者是用来保存稀疏向量         
         */

        /**
         * 短发（1）  长发（2） 运动鞋（3） 高跟鞋（4） 喉结（5） 皮肤白（6） 
         */

        /**
         * 两种方式分别创建向量  == 其实创建稀疏向量的方式有两种，本文只讲一种
         * (1.0, 0.0, 1.0, 0.0, 1.0, 0.0）
         * (1.0, 1.0, 1.0, 1.0, 0.0, 1.0）
         */

        //稠密向量 == 连续的
        Vector vMale = Vectors.dense(1,0,1,0,1,0);


        //稀疏向量 == 间隔的、指定的，未指定位置的向量值默认 = 0.0
        int len = 6;
        int[] index = new int[]{0,1,2,3,5};
        double[] values = new double[]{1,1,1,1,1};
        //索引0、1、2、3、5位置上的向量值=1，索引4没给出，默认0
        Vector vFemale = Vectors.sparse(len, index, values);
        //System.err.println("vFemale == "+vFemale);
        /**
         * labeled point 是一个局部向量，要么是密集型的要么是稀疏型的
         * 用一个label/response进行关联
         * 在MLlib里，labeled points 被用来监督学习算法
         * 我们使用一个double数来存储一个label，因此我们能够使用labeled points进行回归和分类
         * 在二进制分类里，一个label可以是 0（负数）或者 1（正数）
         * 在多级分类中，labels可以是class的索引，从0开始：0,1,2,......
         */

        //训练集生成 ，规定数据结构为LabeledPoint == 构建方式:稠密向量模式  ，1.0:类别编号 == 男性
        LabeledPoint train_one = new LabeledPoint(1.0,vMale);  //(1.0, 0.0, 1.0, 0.0, 1.0, 0.0）
        //训练集生成 ，规定数据结构为LabeledPoint == 构建方式:稀疏向量模式  ，2.0:类别编号 == 女性
        LabeledPoint train_two = new LabeledPoint(2.0,vFemale); //(1.0, 1.0, 1.0, 1.0, 0.0, 1.0）
        //我们也可以给同一个类别增加多个训练集
        LabeledPoint train_three = new LabeledPoint(2.0,Vectors.dense(0,1,1,1,0,1)); 

        //List存放训练集【三个训练样本数据】
        List<LabeledPoint> trains = new ArrayList<>();
        trains.add(train_one);
        trains.add(train_two);
        trains.add(train_three);

        /**
         * SPARK的核心是RDD(弹性分布式数据集)
         * Spark是Scala写的,JavaRDD就是Spark为Java写的一套API
         * JavaSparkContext sc = new JavaSparkContext(sparkConf);    //对应JavaRDD
         * SparkContext     sc = new SparkContext(sparkConf)    ;    //对应RDD
         * 数据类型为LabeledPoint
         */
        JavaRDD<LabeledPoint> trainingRDD = sc.parallelize(trains); 

        /**
         * 利用Spark进行数据分析时，数据一般要转化为RDD
         * JavaRDD转Spark的RDD
         */
        NaiveBayesModel nb_model = NaiveBayes.train(trainingRDD.rdd());

        //测试集生成  == 以下的向量表示，这个人具有特征：短发（1），运动鞋（3）
        double []  dTest = {0,0,0,0,1,0};
        Vector vTest =  Vectors.dense(dTest);//测试对象为单个vector，或者是RDD化后的vector

        //朴素贝叶斯用法
        int modelIndex =(int) nb_model.predict(vTest);
        System.out.println("标签分类编号："+modelIndex);// 分类结果 == 返回分类的标签值
        /**
         * 计算测试目标向量与训练样本数据集里面对应的各个分类标签匹配的概率结果
         */
        System.out.println(nb_model.predictProbabilities(vTest)); 
        if(modelIndex == 1){
            System.out.println("答案：贝叶斯分类器推断这个人的性别是男性");
        }else if(modelIndex == 2){
            System.out.println("答案：贝叶斯分类器推断这个人的性别是女性");
        }
        //最后不要忘了释放资源
        sc.close();

    }
}

报错如下：

 java.lang.ArrayIndexOutOfBoundsException: 10582

    at com.thoughtworks.paranamer.BytecodeReadingParanamer$ClassReader.accept(BytecodeReadingParanamer.java:563)
    at com.thoughtworks.paranamer.BytecodeReadingParanamer$ClassReader.access$200(BytecodeReadingParanamer.java:338)
    at com.thoughtworks.paranamer.BytecodeReadingParanamer.lookupParameterNames(BytecodeReadingParanamer.java:103)
    at com.thoughtworks.paranamer.CachingParanamer.lookupParameterNames(CachingParanamer.java:90)
    at com.fasterxml.jackson.module.scala.introspect.BeanIntrospector$.getCtorParams(BeanIntrospector.scala:44)
    at com.fasterxml.jackson.module.scala.introspect.BeanIntrospector$.$anonfun$apply$1(BeanIntrospector.scala:58)
    at com.fasterxml.jackson.module.scala.introspect.BeanIntrospector$.$anonfun$apply$1$adapted(BeanIntrospector.scala:58)
    at scala.collection.TraversableLike.$anonfun$flatMap$1(TraversableLike.scala:240)
    at scala.collection.Iterator.foreach(Iterator.scala:937)
    at scala.collection.Iterator.foreach$(Iterator.scala:937)
    at scala.collection.AbstractIterator.foreach(Iterator.scala:1425)
    at scala.collection.IterableLike.foreach(IterableLike.scala:70)
    at scala.collection.IterableLike.foreach$(IterableLike.scala:69)
    at scala.collection.AbstractIterable.foreach(Iterable.scala:54)
    at scala.collection.TraversableLike.flatMap(TraversableLike.scala:240)
    at scala.collection.TraversableLike.flatMap$(TraversableLike.scala:237)
    at scala.collection.AbstractTraversable.flatMap(Traversable.scala:104)
    at com.fasterxml.jackson.module.scala.introspect.BeanIntrospector$.findConstructorParam$1(BeanIntrospector.scala:58)
    at com.fasterxml.jackson.module.scala.introspect.BeanIntrospector$.$anonfun$apply$19(BeanIntrospector.scala:176)
    at scala.collection.TraversableLike.$anonfun$map$1(TraversableLike.scala:233)
    at scala.collection.IndexedSeqOptimized.foreach(IndexedSeqOptimized.scala:32)
    at scala.collection.IndexedSeqOptimized.foreach$(IndexedSeqOptimized.scala:29)
    at scala.collection.mutable.ArrayOps$ofRef.foreach(ArrayOps.scala:194)
    at scala.collection.TraversableLike.map(TraversableLike.scala:233)
    at scala.collection.TraversableLike.map$(TraversableLike.scala:226)
    at scala.collection.mutable.ArrayOps$ofRef.map(ArrayOps.scala:194)
    at com.fasterxml.jackson.module.scala.introspect.BeanIntrospector$.$anonfun$apply$14(BeanIntrospector.scala:170)
    at com.fasterxml.jackson.module.scala.introspect.BeanIntrospector$.$anonfun$apply$14$adapted(BeanIntrospector.scala:169)
    at scala.collection.TraversableLike.$anonfun$flatMap$1(TraversableLike.scala:240)
    at scala.collection.immutable.List.foreach(List.scala:388)
    at scala.collection.TraversableLike.flatMap(TraversableLike.scala:240)
    at scala.collection.TraversableLike.flatMap$(TraversableLike.scala:237)
    at scala.collection.immutable.List.flatMap(List.scala:351)
    at com.fasterxml.jackson.module.scala.introspect.BeanIntrospector$.apply(BeanIntrospector.scala:169)
    at com.fasterxml.jackson.module.scala.introspect.ScalaAnnotationIntrospector$._descriptorFor(ScalaAnnotationIntrospectorModule.scala:21)
    at com.fasterxml.jackson.module.scala.introspect.ScalaAnnotationIntrospector$.fieldName(ScalaAnnotationIntrospectorModule.scala:29)
    at com.fasterxml.jackson.module.scala.introspect.ScalaAnnotationIntrospector$.findImplicitPropertyName(ScalaAnnotationIntrospectorModule.scala:77)
    at com.fasterxml.jackson.databind.introspect.AnnotationIntrospectorPair.findImplicitPropertyName(AnnotationIntrospectorPair.java:490)
    at com.fasterxml.jackson.databind.introspect.POJOPropertiesCollector._addFields(POJOPropertiesCollector.java:380)
    at com.fasterxml.jackson.databind.introspect.POJOPropertiesCollector.collectAll(POJOPropertiesCollector.java:308)
    at com.fasterxml.jackson.databind.introspect.POJOPropertiesCollector.getJsonValueAccessor(POJOPropertiesCollector.java:196)
    at com.fasterxml.jackson.databind.introspect.BasicBeanDescription.findJsonValueAccessor(BasicBeanDescription.java:251)
    at com.fasterxml.jackson.databind.ser.BasicSerializerFactory.findSerializerByAnnotations(BasicSerializerFactory.java:346)
    at com.fasterxml.jackson.databind.ser.BeanSerializerFactory._createSerializer2(BeanSerializerFactory.java:216)
    at com.fasterxml.jackson.databind.ser.BeanSerializerFactory.createSerializer(BeanSerializerFactory.java:165)
    at com.fasterxml.jackson.databind.SerializerProvider._createUntypedSerializer(SerializerProvider.java:1388)
    at com.fasterxml.jackson.databind.SerializerProvider._createAndCacheUntypedSerializer(SerializerProvider.java:1336)
    at com.fasterxml.jackson.databind.SerializerProvider.findValueSerializer(SerializerProvider.java:510)
    at com.fasterxml.jackson.databind.SerializerProvider.findTypedValueSerializer(SerializerProvider.java:713)
    at com.fasterxml.jackson.databind.ser.DefaultSerializerProvider.serializeValue(DefaultSerializerProvider.java:308)
    at com.fasterxml.jackson.databind.ObjectMapper._configAndWriteValue(ObjectMapper.java:3905)
    at com.fasterxml.jackson.databind.ObjectMapper.writeValueAsString(ObjectMapper.java:3219)
    at org.apache.spark.rdd.RDDOperationScope.toJson(RDDOperationScope.scala:52)
    at org.apache.spark.rdd.RDDOperationScope$.withScope(RDDOperationScope.scala:145)
    at org.apache.spark.rdd.RDDOperationScope$.withScope(RDDOperationScope.scala:112)
    at org.apache.spark.SparkContext.withScope(SparkContext.scala:699)
    at org.apache.spark.SparkContext.parallelize(SparkContext.scala:716)
    at org.apache.spark.api.java.JavaSparkContext.parallelize(JavaSparkContext.scala:134)
    at org.apache.spark.api.java.JavaSparkContext.parallelize(JavaSparkContext.scala:146)
    at com.wy.movie.BayesTest1.TestA(BayesTest1.java:83)


补充一个pom.xml

<?xml version="1.0" encoding="UTF-8"?>
xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
4.0.0

<groupId>com.wy</groupId>
<artifactId>movie</artifactId>
<version>0.0.1-SNAPSHOT</version>
<packaging>jar</packaging>

<name>movie</name>
<description>Demo project for Spring Boot</description>

<parent>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-parent</artifactId>
    <version>2.1.0.RELEASE</version>
    <relativePath/> <!-- lookup parent from repository -->
</parent>

<properties>
    <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
    <project.reporting.outputEncoding>UTF-8</project.reporting.outputEncoding>
    <java.version>1.8</java.version>
</properties>

<dependencies>
    <dependency>
        <groupId>org.springframework.boot</groupId>
        <artifactId>spring-boot-starter-web</artifactId>
    </dependency>

    <dependency>
        <groupId>org.springframework.boot</groupId>
        <artifactId>spring-boot-starter-test</artifactId>
        <scope>test</scope>
    </dependency>

    <!-- JUnit单元测试 -->
    <dependency>
        <groupId>junit</groupId>
        <artifactId>junit</artifactId>
    </dependency>

    <!-- HanLP汉语言处理包 -->
    <dependency>
        <groupId>com.hankcs</groupId>
        <artifactId>hanlp</artifactId>
        <version>portable-1.7.0</version>
    </dependency>

    <!-- https://mvnrepository.com/artifact/org.apache.spark/spark-core -->
    <dependency>
        <groupId>org.apache.spark</groupId>
        <artifactId>spark-core_2.12</artifactId>
        <version>2.4.0</version>
    </dependency>

    <!-- https://mvnrepository.com/artifact/org.apache.spark/spark-mllib -->
    <dependency>
        <groupId>org.apache.spark</groupId>
        <artifactId>spark-mllib_2.12</artifactId>
        <version>2.4.0</version>
        <scope>runtime</scope>
    </dependency>

    <!-- https://mvnrepository.com/artifact/org.codehaus.janino/janino -->
    <dependency>
        <groupId>org.codehaus.janino</groupId>
        <artifactId>janino</artifactId>
        <version>3.0.10</version>
    </dependency>
</dependencies>

<build>
    <plugins>
        <plugin>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-maven-plugin</artifactId>
        </plugin>
    </plugins>
</build>


就是执行到JavaRDD<LabeledPoint> trainingRDD = sc.parallelize(trains); 这句时出的错，请各位大佬帮忙看看 应该是个小问题 因为我没学过spark和scala什么的 所有很懵逼 先谢谢大家了！

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
唯有杜康TM CSDN副总裁 2018-11-18 03:23
关注
升级你的 paranamer 到2.8 ，这是由于你的jdk版本1.8导致

 <dependency> <groupId>com.thoughtworks.paranamer</groupId> <artifactId>paranamer</artifactId> <version>2.8</version> </dependency>

为了给你评论折腾半天，祝你在机器学习的路上早日成功！
解决 10
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Exception in thread "main" java.lang.ArrayIndexOutOfBoundsException: 4 java 有问必答
2021-12-13 14:35

回答 1 已采纳 ArrayIndexOutOfBoundsException: 4数组越界异常了。看下控制台具体哪一行代码抛出来的。
Runnable 中抛出java.lang.ArrayIndexOutOfBoundsException: -1 java
2019-04-23 14:24

回答 2 已采纳 Random 不要公用,改为线程内新建再试试
java.lang.Exception:java.lang.ArrayIndexOutOfBoundsException: 4 怎么改呐。 java mapreduce
2022-12-24 23:02

回答 1 已采纳应该是存在部分数据split之后是4个，所以你的split[4]数组越界了
spark运行报：java.lang.RuntimeException: Error while encoding: java.lang.ArrayIndexOutOfBoundsException:
2022-04-17 21:33

Nahshon的博客在使用 spark 读取 Hadoop 的 hdfs 上的 txt 文件，进行相关的操作之后，转为 orc 格式，期间报 java.lang.RuntimeException: Error while encoding: java.lang.ArrayIndexOutOfBoundsException: （......class org....
请教这个 java.lang.ArrayIndexOutOfBoundsException: 0 异常
2010-01-27 09:47

回答 4 已采纳 [b][quote]编译时，会报 Exception in thread "main" java.lang.ArrayIndexOutOfBoundsException: 0 at test.
eclipse打不开java.lang.ArrayIndexOutOfBoundsException
2016-09-17 03:03

回答 10 已采纳你的eclipse是最新版的？
运行会出现java.lang.ArrayIndexOutOfBoundsException，为什么?
2017-12-08 06:19

回答 4 已采纳 ``` for(int i = 0; i < BOARD_SIZE; i++){ for(int j = 0; j < BOARD_SIZE; i++){ board[i]
解决Spark GraphX报错： java.lang.ArrayIndexOutOfBoundsException: -1
2021-12-20 15:29

呔小怪兽休走的博客看很少有博客说这种问题，那我就分享一下踩坑记录吧~ 首先说一下解决方法：增加executor的内存资源：--executor-memory 最近用spark做了一个有关风险传导的...但是在调整资源之后，又报了个错：java.lang.ArrayI..
关于easy传数组到后台，报ArrayIndexOutOfBoundsException
2016-10-07 05:32

回答 5 已采纳大致明白了，spring应该会自动把传过来的json字符串转换成对象吧，应该是你在前端拼装的json与javabean对象属性对不上
java swing 按钮事件处理问题 java
2017-09-29 05:31

回答 2 已采纳应该是swing的问题
项目没改睡一觉起来就跑不动了网上也找不到原因下面是报错原因以前能够运行 mysql
2018-11-18 10:23

回答 2 已采纳先写个其他程序看是否连接数据库有问题，排除数据库问题后，检查jar包兼容性及完整性，有时候把jar包换了再换回来就可以了，我也不知道为什么，我遇到过两次类似情况。
Spark_异常_java.lang.ArrayIndexOutOfBoundsException: -7 at org.apache.spark.shuffle.sort.BypassMergeSo
2019-09-18 21:49

高达一号的博客今天尝试了一个新的算子 repartitionAndSortWithinPartitions ，遇到了一个问题...java.lang.ArrayIndexOutOfBoundsException: -7 at org.apache.spark.shuffle.sort.BypassMergeSortShuffleWriter.write(BypassMe...
java中索引越界异常 java
2022-04-12 22:31

回答 1 已采纳字符数组b是空数组，x是大于0的，肯定会下标越界呀
Spark读取CSV异常 java.lang.ArrayIndexOutOfBoundsException:62
2019-11-19 19:01

董可伦的博客前言记录一个异常场景 Spark读取CSV文件，文件里的某些...java.lang.ArrayIndexOutOfBoundsException:62 java.lang.ArrayIndexOutOfBoundsException:63 解决方法情况1：将GBK编码的文件转文UTF-8(我碰见的...
scala编写spark报错java.lang.ArrayIndexOutOfBoundsException: 10582
2019-04-13 17:05

cat__hadoop的博客当前环境：jdk1.8+scala1.2+spark2.4 <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-core_2.12</artifactId> <version&g...
spark "main" java.lang.ArrayIndexOutOfBoundsException: 10582
2019-01-14 14:34

风少年~的博客升级你的 paranamer 到2.8 ，这是由于你的jdk版本1.8导致  <dependency&.../gr...
Spark的WordCount操作过程中出现Exception in thread “main“ java.lang.ArrayIndexOutOfBoundsException: 10582问题
2022-10-17 16:34

SoRA数据家的博客目录出现问题：解决办法：出现问题：在尚硅谷学习Spark过程中，第一个程序出现了以下问题： Exception in thread "main" java.lang.ArrayIndexOutOfBoundsException: 10582 at scala.collection....
Spark进行分层抽样出现java.lang.ArrayIndexOutOfBoundsException：1报错
2022-05-29 16:54

m0_46529164的博客项目场景： ...java.lang.ArrayIndexOutOfBoundsException：1 原因分析：检查前面代码没有出现问题，在检查导入数据集发现多了两行空行解决方案：删除两行空行再次导入数据集，问题解决 ...
IDEA 运行spark 报数组越界异常 java.lang.ArrayIndexOutOfBoundsException: 10582
2020-09-17 17:25

GOD_WAR的博客报错：java.lang.ArrayIndexOutOfBoundsException: 10582 报了数组越界异常，经检查是paranamer造成的 (网上有同行说JDK8得使用paranamer版本2.8以上)，在工程下导入paranamer-2.8.jar就好了。 Maven工程： &...
Spark On CDH5.6.0 报错java.lang.ArrayIndexOutOfBoundsException: 1
2016-09-14 14:57

Oooover的博客 Spark On CDH5.6.0 报错java.lang.ArrayIndexOutOfBoundsException: 1 问题的解决过程分享
没有解决我的问题, 去提问

悬赏问题

¥20 有关区间dp的问题求解
¥15 多电路系统共用电源的串扰问题
¥15 slam rangenet++配置
¥15 有没有研究水声通信方面的帮我改俩matlab代码
¥15 对于相关问题的求解与代码
¥15 ubuntu子系统密码忘记
¥15 信号傅里叶变换在matlab上遇到的小问题请求帮助
¥15 保护模式-系统加载-段寄存器
¥15 电脑桌面设定一个区域禁止鼠标操作
¥15 求NPF226060磁芯的详细资料

spark--java.lang.ArrayIndexOutOfBoundsException: 10582

4条回答 默认 最新

悬赏问题

4条回答默认最新