KNN算法处理mongodb数据

今天看别人的代码，写的是处理mysql的数据，想改成处理mongo数据怎么改啊
我稍微尝试了一下,其实就改了个数据库连接那块


import pandas as pd
from sklearn.cluster import KMeans
from pandas import DataFrame
from scipy.cluster.hierarchy import linkage,dendrogram
import matplotlib.pyplot as plt
import pymongo

if __name__ == '__main__':
    conn = pymongo.MongoClient()

    # cursor = conn.cursor()
    # sql = "select * from DB"
    # cursor.execute(sql)
    results = conn.db.xinxi.find()

    resultList = []

    for result in results:
        resultList.append(result)

    # print(resultList)

    df = DataFrame(resultList)
    # print(df.head())

    # 绘制散点图 评分，参与评论人数
    plt.figure(figsize=(10, 8))
    plt.scatter(df[8].astype(float), df[7].astype(float))
    plt.show()

    scoreDf = pd.DataFrame(df, columns=[7, 8])
    scoreDf.head()

    k = 6  # 聚类的类别
    iteration = 500  # 聚类最大循环次数
    model = KMeans(n_clusters=k,
                   n_jobs=1,
                   max_iter=iteration)  # 分为k类，并发数1，数值大系统卡死
    model.fit(scoreDf)  # 开始聚类

    # 详细输出原始数据及其类别
    res = pd.concat([df,
                     pd.Series(model.labels_, index=df.index)],
                    axis=1)  # 详细输出每个样本对应的类别
    res.columns = list(df.columns) + [u'class']  # 重命名表头

    # 根据聚类画出分类统计图
    for col in res.columns:
        if col in [u'class']:
            fig = plt.figure()
            res[col].hist(bins=20)
            fig.show()

    res.to_excel('knn_result.xls')  # 保存结果

这个是运行成果，请问该怎么写呢，我刚学

D:\Anaconda\Anaconda\python.exe D:/PyCharm/DouBanScrapy-master/code/FisrtKNN.py
Traceback (most recent call last):
  File "D:\Anaconda\Anaconda\lib\site-packages\pandas\core\indexes\base.py", line 3361, in get_loc
    return self._engine.get_loc(casted_key)
  File "pandas\_libs\index.pyx", line 76, in pandas._libs.index.IndexEngine.get_loc
  File "pandas\_libs\index.pyx", line 108, in pandas._libs.index.IndexEngine.get_loc
  File "pandas\_libs\hashtable_class_helper.pxi", line 5198, in pandas._libs.hashtable.PyObjectHashTable.get_item
  File "pandas\_libs\hashtable_class_helper.pxi", line 5206, in pandas._libs.hashtable.PyObjectHashTable.get_item
KeyError: 8

The above exception was the direct cause of the following exception:

Traceback (most recent call last):
  File "D:\PyCharm\DouBanScrapy-master\code\FisrtKNN.py", line 30, in <module>
    plt.scatter(df[8].astype(float), df[7].astype(float))
  File "D:\Anaconda\Anaconda\lib\site-packages\pandas\core\frame.py", line 3458, in __getitem__
    indexer = self.columns.get_loc(key)
  File "D:\Anaconda\Anaconda\lib\site-packages\pandas\core\indexes\base.py", line 3363, in get_loc
    raise KeyError(key) from err
KeyError: 8

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
「已注销」 2022-04-22 21:53
关注
你得先有数据才行

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

sk-learn中KNN算法能动态的构建ball-tree吗算法
2018-02-28 02:50

回答 3 已采纳 sklearn 的 KNN 不能使用 incremental learning，每次训练都需要重新构建ball-tree。在ipython中，运行"knn.fit??"可以查看fit的具体实现。
提升knn算法的准确率 python 人工智能机器学习
2022-09-30 18:14

回答 5 已采纳首先，手写识别的关键是特征描述，如果这一步没有做好，用什么方法，怎么调参，也不会有好的结果。将图像像素值直接作为输入向量，原则上是不适当的。推荐实现方法如下：（1）首先，样本均匀，标准化，归一化，这些
knn算法的使用分析 python 分类有问必答聚类
2022-10-20 20:16

回答 3 已采纳 import pandas as pd import numpy as np import matplotlib.pyplot as plt from pylab import mpl #中文乱码解决
机器学习的敲门砖：kNN算法（下），护士面试视频教学
2024-04-19 05:20

2401_84424649的博客包含：JVM，JAVA集合，网络，JAVA多线程并发，JAVA基础，Spring原理，微服务，Zookeeper，Kafka，RabbitMQ，Hbase，MongoDB，Cassandra，设计模式，负载均衡，数据库，一致性哈希，JAVA算法，数据结构，加密算法，...
knn算法 用python 有人留下代码吗 python 机器学习
2020-09-27 10:29

回答 3 已采纳 ```python #!/usr/bin/python # coding=utf-8 ######################################### # kNN: k Ne
关于机器学习中knn算法的一些问题 python 机器学习
2022-05-21 15:34

回答 1 已采纳好家伙，你这特征数量真心不少。KNN的核心是计算距离，你这个特征这么多，计算的复杂度就会很高，不知道你用的距离算法，也不知道你CPU能不能受的住。减少特征的数量，比如颜色特征，看看能
knn算法不是不需要训练吗，为什么还有训练集 python 有问必答深度学习计算机视觉
2022-04-03 18:39

回答 2 已采纳 KNN是需要训练集的，只是不需要训练算法而已。KNN的原理是找到数据库里和输入样本最近的几个样本，用它们的标签来判决输入样本标签，这就需要一个存在本地的数据库，称之为训练集。按理来说这里没有训练的过程
知乎高赞：算法工程师技术路线图
2022-09-09 22:44

「已注销」的博客这是一份写给公司算法组同事们的技术路线图，其目的主要是为大家在技术路线的成长方面提供一些方向指引，配套一些自我考核项，可以带着实践进行学习，加深理解和掌握。内容上有一定的通用性，所以也分享到知乎...
Golang中的Knn算法
2016-05-13 03:05

回答 1 已采纳 Yes, it makes sense. It depends whether your whole stack is in golang or not. Otherwise, golang do
几种常见机器学习算法分类 python 机器学习算法
2022-05-23 09:05

回答 5 已采纳 GBDT和XGBoost都是决策树分类的，机器学习分类算法应该按照下面的链接来分类，总共有7种，而且你说的神经网络算深度学习了机器学习中的七种分类算法_坠星不坠的博客-
KNN--K近邻算法 pycharm python 有问必答
2021-06-29 09:09

回答 2 已采纳设两个集合的中心点分别为p0和p1表示二元组，方差分别为v0和v1（开方得到标准差），借助于numpy的随机化抽样子模块random很容易得到两个集合，合并为一个样本集。与之对应的标签集也不难制作。之
feedme-server:在NodeJSExpress中使用MongoDB作为数据库开发的Feedme项目的后端服务器。使用BLE信标和KNN算法匿名估计用户的位置
2021-03-20 15:32

Feedme服务器
sklearn中knn算法中的weights=uniform时，相当于投票决定吗 python sklearn 机器学习
2023-04-05 15:31

回答 1 已采纳 uniform是均等的权重，就是说所有的邻近点的权重都是相等的，就是投票决定
观点 | 观远数据字节：算法工程师技术路线图
2020-08-26 10:34

观远数据的博客作者简介-周远（花名：字节） • 观远数据联合创始人兼首席数据科学家 • 知乎机器学习领域KOL • 致力于算法前沿技术在泛零售消费领域的应用落地，深度参与主导了多个AI项目在行业头部、世界五百强客户的
数据分析汇总
2023-06-10 14:58

data_ivy的博客 1、解决数据孤岛，统一数据出口（避免多指标问题）2、解决查询数据慢的问题，数据量大，可以提前做汇总关系型数据库：MySQL、Oracle、postgreSQL、DB2 …非关系型数据库：Hbase、MongoDB、Redis ……直接找到哪一页...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月22日

悬赏问题

¥15 Windows server update services
¥15 关于#c语言#的问题：我现在在做一个墨水屏设计，2.9英寸的小屏怎么换4.2英寸大屏
¥15 模糊pid与pid仿真结果几乎一样
¥15 java的GUI的运用
¥15 Web.config连不上数据库
¥15 我想付费需要AKM公司DSP开发资料及相关开发。
¥15 怎么配置广告联盟瀑布流
¥15 Rstudio 保存代码闪退
¥20 win系统的PYQT程序生成的数据如何放入云服务器阿里云window版？
¥50 invest生境质量模块

KNN算法处理mongodb数据

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新