机器学习预测犯罪发生概率，但收集到的犯罪数据已经发生概率都是100%，怎么预测？

各位大神，最近在做毕设，之前没有怎么接触过机器学习，在网上找了一些机器学习的网课看，但是在做的时候还是有好多问题，麻烦帮帮这个我小白吧

问题详细描述

这个机器学习的任务就是：输入时间，地点等信息，预测每种犯罪类型发生的概率。但现在有个问题我一直没想通，就是我收集到的数据都是已经发生过的犯罪事实，那他们发生的概率都是100%，这样的话，不就相当于预测房价的时候，数据集里房间大小、地理位置等不一样，但房价都是一样的，然后用这样一个数据集来训练模型。这样的话，要怎么预测啊，数据集不会存在数据并不平衡的情况吗，但是我也没有办法找到犯罪发生概率在0-100之间的数据啊，发生了就是100%，没发生就是0%，这要怎么搞？

这是我稍微处理后的数据集截图，最后面还有一列Ratio，就是犯罪概率，都是赋值的100%

图片说明

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
HWANGYUKAH 2020-04-20 13:22
关注
你可以去了解一下幸存者偏差，贝叶斯公式或对照实验可以消除幸存者偏差

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

多类别机器学习犯罪预测 python 人工智能数据挖掘
2022-09-22 23:32

回答 4 已采纳完全没有问题
如何调用训练好的机器学习模型处理新数据集？人工智能数据挖掘机器学习
2022-02-07 01:05

回答 1 已采纳直接加载模型然后对新数据集进行预测啊，结果就是0或者1，然后把结果按照之前训练的数据集格式写入一个新的csv，这就是相当于打上标签了，但是这个标签不一定是全部对的，除非你能保证你的模型推理结果一定是正
机器学习中，能不能对多个目标进行预测？数据挖掘机器学习深度学习
2019-04-28 20:32

回答 2 已采纳可以进行多目标，比如在回归问题中，决策树和神经网络就可以同时预测多个目标值。可以参考论文，A survey on multi‐output regression
人工智能基础_机器学习038_中国人寿保费预测(EDA数据探索)_导包_数据探索_---人工智能工作笔记0078
2023-11-16 09:43

添柴程序猿的博客在训练SGD模型时，如果输入数据的尺度差异很大，那么在更新模型参数时，尺度较大的特征会占据主导地位，导致模型忽略尺度较小的特征。这样，在更新模型参数时，不同特征都能发挥一定的作用，从而提高模型的性能。...
机器学习如何利用线性回归预测鲍鱼数据的年龄和利用贝叶斯预测鲍鱼的性别啊 python 机器学习线性回归
2022-04-29 09:25

回答 2 已采纳选特征，打标签，调sklearn 包训练，预测，结束
xgboost二分类预测概率为什么二极化？数据挖掘机器学习
2019-12-24 14:22

回答 3 已采纳看你的激活函数，它是非线性的，所以可以让结果更偏向一边，这是故意为之，你不希望结果出来大部分都是0.5附近模棱两可的，对吧。
机器学习是做什么的？人工智能数据挖掘有问必答机器学习
2022-11-11 15:51

回答 4 已采纳 机器学习的一般分类为:监督学习、无监督学习、强化学习、半监督学习、主动学习。很多东西可以cv出来，但是业务不一样，怎么整合你的业务，就是技术问题了。
基于朴素贝叶斯预测芝加哥犯罪类型
2021-08-30 14:45

撇野i的博客基于朴素贝叶斯预测芝加哥犯罪类型 1朴素贝叶斯基本概念 1.1概述 1.2模型 2朴素贝叶斯的原理 2.1分类原理 2.2分类流程图 2.3算法原理 2.4算法优缺点 3实验 3.1数据库选择 4朴素贝叶斯实现基于朴素...
机器学习中分类器验证AUC值不理想，能否比较验证集实际频率和预测概率均值来说明模型准确性。机器学习算法
2018-11-28 14:57

回答 1 已采纳感觉你的描述就是计算交叉熵(Cross Entropy) https://blog.csdn.net/tsyccnh/article/details/79163834
机器学习中怎么使用保存的模型进行预测 python 数据挖掘机器学习深度学习神经网络
2019-09-02 17:37

回答 1 已采纳分割数据集到训练集和测试集 x_train, x_test, y_train, y_test = train_test_split(x, y) 你加载模型直接预测不需要对数据进行再
简单的机器学习更改，指定数据集预测人工智能机器学习深度学习
2019-11-07 07:01

回答 1 已采纳首先，不建议这么做，如果把train和test都用来训练，没测试集来看效果。如果真要这么做，可以在训练前先把两个文件合并再投入训练
连环犯罪凶手藏身地预测matlab时间概率距离法
2022-07-14 15:09

Day-3的博客在1981年，彼得萨克利被判犯有十三起谋杀罪和一系列的恶意伤害罪，在该案中，一种用来缩小搜索萨克利夫先生所在范围的方法是找到这些犯罪地点发生的“重心”最后，这个嫌疑犯恰好生活在用这种技术所预测的那个城镇里...
机器学习构建预测模型怎么以网页版呈现？ python 机器学习算法
2023-01-25 13:56

回答 3 已采纳望采纳：XGBoost算法构建的预测模型可以通过使用一些web框架来在网页上呈现。具体步骤可以是:1.使用一个web框架如 Flask 建立一个网站后端2.在网站后端中加载已经训练好的XGBoost模
【大数据 & AI 人工智能】数据科学家必学的 9 个核心机器学习算法
2023-03-04 01:57

禅与计算机程序设计艺术的博客推荐系统的用途在于在一个数据集中寻找相似的条目。推荐系统在现实世界最常见的应用莫过于奈飞的...逻辑回归是一种用于解决分类问题的机器学习模型。垃圾邮件（垃圾还是非垃圾？汽车保险索赔（销记还是维修？疾病诊断。
量化金融中的机器学习是什么? 定义、类型和示例
2023-04-02 16:12

进击的Matrix的博客 机器学习是什么 机器学习是更广泛的人工智能领域的一个分支，它利用统计模型来进行预测。它通常被描述为预测建模或预测分析的一种形式，传统上，它被定义为计算机在没有明确编程的情况下学习的能力。
没有解决我的问题, 去提问

悬赏问题

¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像，如何解决？
¥15 求daily translation（DT）偏差订正方法的代码
¥15 js调用html页面需要隐藏某个按钮
¥15 ads仿真结果在圆图上是怎么读数的
¥20 Cotex M3的调试和程序执行方式是什么样的？
¥20 java项目连接sqlserver时报ssl相关错误
¥15 一道python难题3
¥15 牛顿斯科特系数表表示
¥15 arduino 步进电机
¥20 程序进入HardFault_Handler