lang_li_bai_sha
独予幽寂
采纳率20%
2021-03-30 10:14 阅读 36

如何将原始数据整理成SVM可以使用的数据

我现在有上万条的货运车辆GPS原始轨迹数据,想要通过支持向量机对货运车辆停车进行交付停车和非交付停车的识别,但是不知道应该将数据进行怎样的处理。支持向量机做为监督性的学习,需要我首先通过订单信息对停车点进行判别,但是上万条数据,不可能是手动的吧,而且停车往往会有几十分钟到几个小时,而GPS数据是每8分钟记录一次,我应该要怎样合并数据呢?

  • 点赞
  • 写回答
  • 关注问题
  • 收藏
  • 复制链接分享

1条回答 默认 最新

  • 已采纳
    xufive 天元浪子 2021-03-30 10:50

    题主的问题中,交付停车、非交付停车以及订单等是和业务密切相关的概念,因为没有定义,所以只能做一点猜测性的分析。这是一个典型的二分类问题,训练集中的一个样本对应一辆车的连续的GPS记录,所有样本的GPS记录数都应等于一个定值,也就是训练集的维度数。原始数据的处理可以分为:

    1. 原始数据按照车辆分组,一辆车一组数据;
    2. 将每组数据处理为同样长度。这需要考虑业务逻辑,比如,哪些位置更有利于分类,就保留哪些位置;哪位位置无助于分类,就可以删减;
    3. 为训练集中的每组数据提供分类标签。
    点赞 评论 复制链接分享

相关推荐