在使用semanticKITTI数据集的官方API读取.label文件中的数据时,同样的现象也发生在尝试用cpp程序读取.label文件时。打印相应的类别标签出现诸如65791 , 14286858这样很大的值,每一帧数据中有4000到6000个左右的这样的数据,有的甚至有8000个,想知道一下是不是只有我一个人是这样,如果有其他人是这样的话,原因是什么,是读取有问题还是他数据本来就是这样的。那在评估的时候这些数据应该直接就舍弃吗?

在使用semanticKITTI数据集的官方API读取.label文件中的数据时,同样的现象也发生在尝试用cpp程序读取.label文件时。打印相应的类别标签出现诸如65791 , 14286858这样很大的值,每一帧数据中有4000到6000个左右的这样的数据,有的甚至有8000个,想知道一下是不是只有我一个人是这样,如果有其他人是这样的话,原因是什么,是读取有问题还是他数据本来就是这样的。那在评估的时候这些数据应该直接就舍弃吗?

在KITTI的官方介绍http://www.semantic-kitti.org/dataset.html上提到
The label is a 32-bit unsigned integer (aka uint32_t) for each point, where the lower 16 bits correspond to the label. The upper 16 bits encode the instance id, which is temporally consistent over the whole sequence, i.e., the same object in two different scans gets the same id.
所以说这个数据解析出来并不是直接用的,还需要做一下位运算
相关的代码在Kitti的Github上有https://github.com/PRBonn/semantic-kitti-api/blob/master/auxiliary/laserscan.py#L238
注意其中的247和248行
self.sem_label = label & 0xFFFF # semantic label in lower half
self.inst_label = label >> 16 # instance id in upper half