独予幽寂 2021-03-30 10:14 采纳率: 20%
浏览 85
已采纳

如何将原始数据整理成SVM可以使用的数据

我现在有上万条的货运车辆GPS原始轨迹数据,想要通过支持向量机对货运车辆停车进行交付停车和非交付停车的识别,但是不知道应该将数据进行怎样的处理。支持向量机做为监督性的学习,需要我首先通过订单信息对停车点进行判别,但是上万条数据,不可能是手动的吧,而且停车往往会有几十分钟到几个小时,而GPS数据是每8分钟记录一次,我应该要怎样合并数据呢?

  • 写回答

1条回答 默认 最新

  • 天元浪子 Python领域优质创作者 2021-03-30 10:50
    关注

    题主的问题中,交付停车、非交付停车以及订单等是和业务密切相关的概念,因为没有定义,所以只能做一点猜测性的分析。这是一个典型的二分类问题,训练集中的一个样本对应一辆车的连续的GPS记录,所有样本的GPS记录数都应等于一个定值,也就是训练集的维度数。原始数据的处理可以分为:

    1. 原始数据按照车辆分组,一辆车一组数据;
    2. 将每组数据处理为同样长度。这需要考虑业务逻辑,比如,哪些位置更有利于分类,就保留哪些位置;哪位位置无助于分类,就可以删减;
    3. 为训练集中的每组数据提供分类标签。
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥15 编写vba代码实现数据录入工作
  • ¥15 做过TCL海信电视小米电视相关影视会员软件私我
  • ¥15 Mapreduce是正常的,在运行其他jar包时并没有任何问题,只是在做LogCount.jar 时出的问题。如图所示
  • ¥15 ImportError: DLL load failed while importing _iterative: 找不到指定的模块。
  • ¥15 如何通过交互分析得出某高危患者对放疗获益更多
  • ¥15 相关性分析中,p<0.05, r=0.29,怎么评价相关性呢
  • ¥15 docker部署Mongodb后输入命令报错?
  • ¥15 将下列流程图转变成python程序代码
  • ¥15 我需要全国每个城市的最新小区名字等数据。
  • ¥15 开发一个小区生态的小程序