机器学习预测犯罪发生概率,但收集到的犯罪数据已经发生概率都是100%,怎么预测?

各位大神,最近在做毕设,之前没有怎么接触过机器学习,在网上找了一些机器学习的网课看,但是在做的时候还是有好多问题,麻烦帮帮这个我小白吧

问题详细描述

这个机器学习的任务就是:输入时间,地点等信息,预测每种犯罪类型发生的概率。但现在有个问题我一直没想通,就是我收集到的数据都是已经发生过的犯罪事实,那他们发生的概率都是100%,这样的话,不就相当于预测房价的时候,数据集里房间大小、地理位置等不一样,但房价都是一样的,然后用这样一个数据集来训练模型。这样的话,要怎么预测啊,数据集不会存在数据并不平衡的情况吗,但是我也没有办法找到犯罪发生概率在0-100之间的数据啊,发生了就是100%,没发生就是0%,这要怎么搞?



这是我稍微处理后的数据集截图,最后面还有一列Ratio,就是犯罪概率,都是赋值的100%

图片说明

2个回答

你可以去了解一下幸存者偏差,贝叶斯公式或对照实验可以消除幸存者偏差

evan_qhy
evan_qhy 好的 谢谢啦 这就去了解
5 个月之前 回复

可以去看一下这个链接:https://stats.stackexchange.com/questions/76420/classifier-for-only-one-class
里面也有几篇paper,可能会有所帮助

evan_qhy
evan_qhy 恩恩 谢谢!
5 个月之前 回复
Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
立即提问
相关内容推荐