DBSCAN运行30万行数据总是挂掉内核

用的Anaconda Jupyter Notebook的dbscan函数，数据量是30万左右

用了两版数据（已在dataframe里对比过，两版数据大小一致），参数均为2和MinPts=15
（1）第一版未处理过的数据成功运行出了结果
（2）第二版仅做了standardization,但每次运行内核都挂掉，查看了终端运行信息没有发现任何报错，只显示重启Kernal

问：这两版数据我能想到的区别就是
一、第二版数值是小数（小数点后5位）
二、第二版数值存在负数

所以难道是因为负数无法输入dbscan的estimator?
各位大神救救小女子吧，已经埋头苦想三天了
( ；´Д｀)
（现在电脑不在手边，一会儿方便了贴代码）

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
有问必答小助手 2021-08-27 10:21
关注
你好，我是有问必答小助手，非常抱歉，本次您提出的有问必答问题，技术专家团超时未为您做出解答

本次提问扣除的有问必答次数，将会以问答VIP体验卡（1次有问必答机会、商城购买实体图书享受95折优惠）的形式为您补发到账户。

因为有问必答VIP体验卡有效期仅有1天，您在需要使用的时候【私信】联系我，我会为您补发。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

大数据领域数据挖掘的商业应用模式创新
2025-09-12 22:18

操作系统内核探秘的博客本文遵循“原理解析→技术实现→商业应用→趋势展望”的逻辑，从数据挖掘核心概念切入，逐步展开算法原理、数学模型、实战案例及行业应用分析，最终探讨技术发展带来的商业模式创新机遇与挑战。
揭秘单细胞数据聚类难题：如何选择最优聚类算法并避免常见陷阱
2025-12-13 10:49

DevPath的博客掌握单细胞数据的聚类关键方法，解决高维噪声与异质性难题。本文解析常用算法选择策略，涵盖适用场景与避坑指南，提升聚类准确性与生物学可解释性，助力科研高效分析，值得收藏
揭秘大数据数据价值的挖掘与利用技巧
2025-08-12 17:04

操作系统内核探秘的博客通过深入探讨数据价值评估模型、技术架构、算法实现和行业应用案例，本文揭示了如何将原始数据转化为战略性业务资产。特别关注了价值提取过程中的关键挑战与解决方案，包括数据质量提升、特征工程优化、隐私保护与...
机床智能健康管理系统：基于多源数据融合与边缘智能的技术实现
2025-08-24 16:11

zxsz_com_cn的博客机床智能健康管理的技术落地，核心是解决 “干扰抑制 - 工况适配 ...其技术价值不仅体现在 95% 以上的故障识别率，更在于将设备健康数据与加工质量、工艺参数深度关联，实现了从 “设备监测” 到 “生产优化” 的跨越。
【数据挖掘】基于Uber出租车数据分析NewYork市民空间行为特征以及一些空间分布探索性分析
2020-07-12 21:24

狮智先生的博客基于Uber出租车数据分析NewYork市民空间行为特征——以2014年kaggle数据集为例（一）1 研究区域概况2 明确空间数据挖掘任务2.1实现出租车数据与纽约地图数据匹配2.2分析空间分布特征，制作热度图分布图，实现可视化...
车载CAN总线数据采集与故障诊断装置设计与实现
2025-06-21 12:31

HH予的博客本文设计并实现了一种基于STM32的车载CAN总线数据采集与故障诊断装置，针对传统OBD-II诊断方法的不足，提出了高实时性、多协议兼容的解决方案。硬件采用STM32F407主控和MCP2551收发器，优化了抗干扰电路设计；软件...
机器学习算法工程师面试考点汇总
2019-07-01 08:44

喜欢打酱油的老鸟的博客 数据结构与算法 1、查找 1、手写二分查找（1）算法题，单调函数求零点 (简单的二分法) 2、特别大的数据量，实现查找，排序 2、哈希 1 Hash表处理冲突的方法 2、一致性哈希 3、Hash表处理...
数据脱敏实战：如何保护敏感信息
2025-08-23 02:44

操作系统内核探秘的博客在数据驱动的时代，“数据可用不可见”已成为企业平衡业务价值与隐私合规的核心命题。数据脱敏作为实现这一目标的关键技术，并非简单的“打码”或“替换”，而是一套覆盖数据发现、规则设计、动态执行、监控审计的全...
kmeans聚类算法_机器学习算法工程师面试考点汇总
2020-10-23 00:01

weixin_39590472的博客 68、RetinaNet 的大致结构画一下 69、RetinaNet为什么比SSD效果好 数据结构与算法 1、查找 1、手写二分查找 (1)算法题，单调函数求零点 (简单的二分法) 2、特别大的数据量，实现查找，排序 2、哈希 1 Hash表处理...
2023年全国研究生数学建模竞赛华为杯E题出血性脑卒中临床智能诊疗建模求解全过程文档及程序
2025-06-12 21:09

数模竞赛Paid answer的博客对第一小问，选取局部加权回归LOESS（Epanechnikov内核、Cauchy内核）、七阶多项式、二元高斯拟合四种方式对前100位患者数据散点图进行拟合，通过RMSE、R、Adjusted_三个评价指标进行分析，最终选取二元高斯拟合患者...
kmeans聚类算法_机器学习/算法校招面试考点汇总（附面试题和答案）【持续更新】_笔经面经...
2020-10-22 00:11

weixin_39759441的博客以下不作为机器学习/算法工程师的学习路径，只是汇总的校招机器学习/算法工程师面试考点(因为还有笔试考点，后面结合在一起给大家学习路径)，后续会为大家更新10w+字数的机器学习/算法工程师校招面试题库，还有其他...
收藏43个免费数据挖掘软件
2020-07-05 21:09

代码讲故事的博客数据挖掘是在大型数据集中发现模式的计算过程，涉及到使用人工智能、机器学习、统计分析和数据库系统的方法，目标是从数据集中提取信息，并将其转化为可理解的结构，以便进一步使用。在当今的商业市场中，客户与...
典型的聚类算法--学习笔记
2021-01-06 14:23

dreamandgo的博客目录一....常用的聚类算法分为基于划分、层次、密度、网格、统计学、模型等类型的算法，典型算法包括K-Means（经典的聚类算法）、Mean-shift、DBSCAN、凝聚聚类、BIRCH、谱聚类等。 1. 聚类算法的选
内核级异常行为基线：OpenArk如何建立正常系统模型
2025-09-06 15:58

潘聪争的博客当Rootkit通过钩子、内联补丁或驱动隐藏技术绕过传统安全软件时，大多数反Rootkit(ARK)工具仍依赖特征码比对或单一API监控，导致大部分高级威胁检测延迟超过30分钟。OpenArk作为下一代Windows内核分析工具，通过动态...
从零基础到斩获BAT算法岗offer，围观复旦大佬的秋招之路
2019-09-16 16:09

Java技术江湖的博客数据结构，参考书目《算法导论》，求复杂度，红黑树、B+树的一些结构和优点，有些跟算法题一起考察了，也不太分得清，求算法复杂度是最重要的部分，主定理背一背就搞定。 Linux操作，参考书目《鸟哥的linux私房菜》...
数据驱动 + AI：重塑采购数字化的技术内核与落地方法论
2025-10-16 11:31

数在表哥的博客传统采购数字化常陷入"...文章强调数据采集的优先级、清洗标准化的方法论，以及数据中台与业务系统的协同逻辑，为技术从业者提供了从数据治理到AI应用的完整实操指南，避免常见的数据和模型落地陷阱。
法律科技：NLP如何变革非结构化法律文档处理
2025-10-05 01:40

操作系统内核探秘的博客上周刚因为漏看一份采购合同里的“不可抗力免责期限”，差点让客户损失200万；上个月整理12份庭审记录，光是把“被告陈述”和“证人证言”区分开，就花了3天。“要是有个‘文档读心术’就好了——我想找什么，它立刻...
机器视觉工程师如何进行点云处理与分析
2025-05-02 20:16

zhangzhechun_02的博客数据预处理：通过降噪、下采样等方法提高数据质量和处理效率点云配准：使用ICP等算法将不同视角的点云对齐分割与聚类：通过RANSAC平面分割和欧氏聚类等方法将点云分割为有意义的部分特征提取与识别：提取几何特征并...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 9月2日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月25日

DBSCAN运行30万行数据总是挂掉内核

1条回答 默认 最新

问题事件

1条回答默认最新