evan_qhy 2020-04-20 11:18 采纳率: 0%
浏览 587

机器学习预测犯罪发生概率,但收集到的犯罪数据已经发生概率都是100%,怎么预测?

各位大神,最近在做毕设,之前没有怎么接触过机器学习,在网上找了一些机器学习的网课看,但是在做的时候还是有好多问题,麻烦帮帮这个我小白吧

问题详细描述

这个机器学习的任务就是:输入时间,地点等信息,预测每种犯罪类型发生的概率。但现在有个问题我一直没想通,就是我收集到的数据都是已经发生过的犯罪事实,那他们发生的概率都是100%,这样的话,不就相当于预测房价的时候,数据集里房间大小、地理位置等不一样,但房价都是一样的,然后用这样一个数据集来训练模型。这样的话,要怎么预测啊,数据集不会存在数据并不平衡的情况吗,但是我也没有办法找到犯罪发生概率在0-100之间的数据啊,发生了就是100%,没发生就是0%,这要怎么搞?



这是我稍微处理后的数据集截图,最后面还有一列Ratio,就是犯罪概率,都是赋值的100%

图片说明

  • 写回答

2条回答 默认 最新

  • HWANGYUKAH 2020-04-20 13:22
    关注

    你可以去了解一下幸存者偏差,贝叶斯公式或对照实验可以消除幸存者偏差

    评论

报告相同问题?

悬赏问题

  • ¥15 素材场景中光线烘焙后灯光失效
  • ¥15 请教一下各位,为什么我这个没有实现模拟点击
  • ¥15 执行 virtuoso 命令后,界面没有,cadence 启动不起来
  • ¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
  • ¥20 有关区间dp的问题求解
  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置
  • ¥15 有没有研究水声通信方面的帮我改俩matlab代码
  • ¥15 ubuntu子系统密码忘记
  • ¥15 保护模式-系统加载-段寄存器