各位大神,最近在做毕设,之前没有怎么接触过机器学习,在网上找了一些机器学习的网课看,但是在做的时候还是有好多问题,麻烦帮帮这个我小白吧
问题详细描述
这个机器学习的任务就是:输入时间,地点等信息,预测每种犯罪类型发生的概率。但现在有个问题我一直没想通,就是我收集到的数据都是已经发生过的犯罪事实,那他们发生的概率都是100%,这样的话,不就相当于预测房价的时候,数据集里房间大小、地理位置等不一样,但房价都是一样的,然后用这样一个数据集来训练模型。这样的话,要怎么预测啊,数据集不会存在数据并不平衡的情况吗,但是我也没有办法找到犯罪发生概率在0-100之间的数据啊,发生了就是100%,没发生就是0%,这要怎么搞?
这是我稍微处理后的数据集截图,最后面还有一列Ratio,就是犯罪概率,都是赋值的100%