用sklearn在图片分类中数据降维遇到的一些问题 50C

我在用isomap、pca和MDS对原始矩阵处理后,发现分类成功率反而大大小于没有降维前,为什么会这样子。。
好像不是参数的问题,怎么调效果都不好。。是我的姿势不对吗

# pca
pca = PCA(n_components=30).fit(x)
x2 = pca.transform(x)
x_train, x_test, y_train, y_test = train_test_split(x2, y, train_size=0.9)
model = RandomForestClassifier(n_estimators=20)
model.fit(x_train, y_train)
predict = model.predict(x_test)
accuracy_pca = metrics.accuracy_score(y_test, predict)

# MDS
mds = manifold.MDS(n_components=30, eps=1e-10)
X_r = mds.fit(x).embedding_
x_train, x_test, y_train, y_test = train_test_split(X_r, y, train_size=0.9)
model.fit(x_train, y_train)
predict = model.predict(x_test)
accuracy_MDS = metrics.accuracy_score(y_test, predict)

# isomap
isomap = manifold.Isomap(15, n_components=30).fit_transform(x)
x_train, x_test, y_train, y_test = train_test_split(isomap, y, train_size=0.9)
model.fit(x_train, y_train)
predict = model.predict(x_test)
accuracy_isomap = metrics.accuracy_score(y_test, predict)
print accuracy_isomap

图片是100×100像素
x是数据矩阵(165×10000)
y是标签,从1到15

1个回答

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
Python怎么利用sklearn将pandas读取的数据拆分成训练集和验证集

Python用多元线性回归算法对Boston House Price Dataset数据集进行预测中,怎么利用sklearn将pandas读取的数据拆分成训练集和验证集

sklearn和keras中的数据集分割问题

用sklearn的train_test_split分割了数据集后还有没有必要在keras里的model.fit()里面用validation_split分割

sklearn中的一个问题?

今天在做ROC曲线的时候,遇到了sklearn的一个问题,看了源码中的例子之后 发现还是有问题: ``` Examples -------- >>> import numpy as np >>> from sklearn import metrics >>> y = np.array([1, 1, 2, 2]) >>> scores = np.array([0.1, 0.4, 0.35, 0.8]) >>> fpr, tpr, thresholds = metrics.roc_curve(y, scores, pos_label=2) >>> fpr array([0. , 0. , 0.5, 0.5, 1. ]) >>> tpr array([0. , 0.5, 0.5, 1. , 1. ]) >>> thresholds array([1.8 , 0.8 , 0.4 , 0.35, 0.1 ]) ``` 想问一下这个例子中的1.8是从哪来的,为什么输入的是四列确有五列输出,不是应该按输入的排序然后每一个取做阈值ma

加载sklearn外部数据集时无法停止程序

使用以下代码加载sklearn的California_housing数据集,程序一直在运行,文件成功下载到目标文件夹,但是无法打印变量housing的相关信息。python用的3.6版本 ``` from sklearn.datasets.california_housing import fetch_california_housing housing = fetch_california_housing() print(housing.DESCR) ``` 运行窗口出现这个,![图片说明](https://img-ask.csdn.net/upload/201903/08/1552052688_693941.png) 麻烦大佬们看看是咋回事啊

用sklearn做线性回归, 但数据normalization后,出来MSE全部为0。

用sklearn在股票价格数据 做线性回归, 但数据normalization后,出来MSE的结果全部为0。别人说是模型出错了, 但奈何自己是python新手,请求各位帮忙指出其中原因,感谢感谢!!!! 数据是这样子的: ![图片说明](https://img-ask.csdn.net/upload/201812/09/1544362511_813119.jpg) 这是不加normalization的, ``` from sklearn.linear_model import LinearRegression from sklearn import cross_validation from sklearn.model_selection import train_test_split from sklearn.preprocessing import Normalizer LinearRegression=LinearRegression() scores = cross_validation.cross_val_score(LinearRegression, X_stock1_train, y_stock1_train, scoring='neg_mean_squared_error', cv=10) print (-scores) print ('Average score for Linear Regression:', np.mean(scores)) ``` 结果看起来还算正常: [ 0.03666889 0.05985924 0.05718805 0.04757506 0.05605501 0.05602068 0.04308263 0.05089644 0.0489978 0.0384472 ] Average score for Linear Regression: -0.0494790998005 ##分割线## normalization处理过的: ``` from sklearn.linear_model import LinearRegression from sklearn import cross_validation transformer=Normalizer().fit(X_stock1_train, y_stock1_train) X_stock1_train=transformer.transform(X_stock1_train) y_stock1_train=transformer.transform(y_stock1_train) LinearRegression=LinearRegression() scores = cross_validation.cross_val_score(LinearRegression, X_stock1_train, y_stock1_train, scoring='neg_mean_squared_error', cv=10) print (-scores) print ('Average score for Linear Regression:', np.mean(scores)) ``` 结果: [ 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.] Average score for Linear Regression: 0.0 别人说是模型出错了, 但奈何自己是python新手,请求各位帮忙指出其中原因,感谢感谢!!!

如何对高维数据进行聚类,使用了sklearn库的Kmeans没结果,怎么办?

![图片说明](https://img-ask.csdn.net/upload/201905/05/1557041721_427005.png) 如图,对行聚类,请问用sklearn库可以处理吗?如果不行有别的库可以用吗?

python 读取sklearn内置数据报错

![图片说明](https://img-ask.csdn.net/upload/201908/12/1565569507_27489.png)有大佬知道原因吗?

sklearn中random_state问题

在sklearn中train_test_split()函数 中random_state这个参数有什么用?我只知道选取不同的值对模型训练有影响。

sklearn库中Kmeans函数中init参数如何使用???

sklearn库中Kmeans函数中init参数如何使用???可否对已有的聚类中心进行替换??

pycharm导入sklearn库的问题

![图片说明](https://img-ask.csdn.net/upload/201907/27/1564200996_37345.png) 请问如何解决呢?

如何用sklearn做支持向量机聚类问题

望各位大神帮忙,告知如何用sklearn做支持向量机聚类问题

sklearn PCA如何进行因子旋转?还有如何求出载荷矩阵?

我的主要目的是为了降低维度,筛选因子,所以采用sklearn中的PCA调用,想根据降维后,再进行因子旋转,最后得到载荷矩阵,根据载荷矩阵来确定每个成分中的主因子,但是现在没有找到因子旋转的实用方法,以及载荷矩阵的求法,求大神求解,可酬 初步代码附上 pca=PCA(n_components=20) reduce=pca.fit_transform(data_year_scale_2)#进行降维 print('降维后数据',reduce) print('各维度方差:',pca.explained_variance_)#方差贡献绝对值 print('各成分贡献率:',pca.explained_variance_ratio_)#各成分方差贡献占比 print('降维后维度数量:',pca.n_components_)

Python用sklearn拟合带有随机噪声的sin(x)随机数据,然后输入一个x预测y。用scatter作图

Python用sklearn拟合带有随机噪声的sin(x)随机数据,然后输入一个x预测y。用scatter作图

使用sklearn进行模型预测的时候遇到ValueError错误

程序是: ``` test_matrix = vect.transform(zf['text']) res = model.predict(test_matrix) ``` zf['text']是获取的网页中的纯文本文件。运行到第二句进行预测的时候报错了: ``` Traceback (most recent call last): File "<stdin>", line 1, in <module> File "D:\Program Files\Python36\lib\site-packages\sklearn\linear_model\base.py", line 324, in predict scores = self.decision_function(X) File "D:\Program Files\Python36\lib\site-packages\sklearn\linear_model\base.py", line 305, in decision_function % (X.shape[1], n_features)) ValueError: X has 6140 features per sample; expecting 8 ``` 请问这个报错是什么意思,应该怎么修改呢?

基于lda主题模型的图像分类器

老师给的任务是做一个针对图像的lda分类器,可是没有头绪,希望有大神指点一下啊

python中引用sklearn包报错

只要import sklearn包就报错,是不是我没装好这个包啊。 求大神帮助,这个问题遇到好几次了,真的没办法。。。 ``` Traceback (most recent call last): File "E:/MyPython/Code/Neural_network/My_neural_network/exception.py", line 1, in <module> import sklearn File "C:\Users\wjw\AppData\Local\Programs\Python\Python35\lib\site-packages\sklearn\__init__.py", line 57, in <module> from .base import clone File "C:\Users\wjw\AppData\Local\Programs\Python\Python35\lib\site-packages\sklearn\base.py", line 12, in <module> from .utils.fixes import signature File "C:\Users\wjw\AppData\Local\Programs\Python\Python35\lib\site-packages\sklearn\utils\__init__.py", line 11, in <module> from .validation import (as_float_array, File "C:\Users\wjw\AppData\Local\Programs\Python\Python35\lib\site-packages\sklearn\utils\validation.py", line 18, in <module> from ..utils.fixes import signature File "C:\Users\wjw\AppData\Local\Programs\Python\Python35\lib\site-packages\sklearn\utils\fixes.py", line 406, in <module> if np_version < (1, 12, 0): TypeError: unorderable types: str() < int() ```

关于sklearn 预测波士顿房价问题……

我使用正规方程和梯度下降预测出的结果,为什么是这样的显示: 梯度下降的均方误差: 571.6913370336464 [[-0.08771191 0.12200384 -0.01594064 0.09022779 -0.23661188 0.27422839 -0.02176867 -0.3825644 0.29950068 -0.20738767 -0.22329701 0.08367528 -0.40248485]] 测试集中每个房子的预测价格: [[-3.10504778e-01] [ 7.89659123e-01] [-6.79532852e-02] [-1.81832441e+00] [-6.77809409e-01] [ 9.38547371e-01] [ 1.56677794e-01] [ 9.80903006e-01] [ 5.39914638e-01] [-1.23428574e+00] [ 5.52903295e-02] 还请大佬帮忙看看什么原因

请问下安装sklearn库时按照步骤安装,import sklearn没有报错,正常,但是引入时出现No module named 'sklearn.sklearn'错误,请问怎么解决谢谢

Python 3.7.0 (default, Jun 28 2018, 08:04:48) [MSC v.1912 64 bit (AMD64)] on win32 Type "copyright", "credits" or "license()" for more information. >>> from sklearn.sklearn.model_selection import KFold Traceback (most recent call last): File "<pyshell#0>", line 1, in <module> from sklearn.sklearn.model_selection import KFold ModuleNotFoundError: No module named 'sklearn.sklearn' >>> import sklearn >>> >>> >>>

如何用adaboost算法实现多类多标签的分类

最近初接触这个算法,二分类比较好理解,也查了资料了解到多分类可以转化为二分类问题,变成一对其余问题,那一轮迭代结束后,“一”是从上一轮的其余中确定还是在原始样本集中?

在中国程序员是青春饭吗?

今年,我也32了 ,为了不给大家误导,咨询了猎头、圈内好友,以及年过35岁的几位老程序员……舍了老脸去揭人家伤疤……希望能给大家以帮助,记得帮我点赞哦。 目录: 你以为的人生 一次又一次的伤害 猎头界的真相 如何应对互联网行业的「中年危机」 一、你以为的人生 刚入行时,拿着傲人的工资,想着好好干,以为我们的人生是这样的: 等真到了那一天,你会发现,你的人生很可能是这样的: ...

删库了,我们一定要跑路吗?

在工作中,我们误删数据或者数据库,我们一定需要跑路吗?我看未必,程序员一定要学会自救,神不知鬼不觉的将数据找回。 在 mysql 数据库中,我们知道 binlog 日志记录了我们对数据库的所有操作,所以 binlog 日志就是我们自救的利器。 接下来就来开启程序员自救之路。 想要自救成功,binlog 这把利器一定要好,在自己之前,我们一定要确定我们有 binlog 这把利器,以下就是确保有 bi...

再不跳槽,应届毕业生拿的都比我多了!

跳槽几乎是每个人职业生涯的一部分,很多HR说“三年两跳”已经是一个跳槽频繁与否的阈值了,可为什么市面上有很多程序员不到一年就跳槽呢?他们不担心影响履历吗? PayScale之前发布的**《员工最短任期公司排行榜》中,两家码农大厂Amazon和Google**,以1年和1.1年的员工任期中位数分列第二、第四名。 PayScale:员工最短任期公司排行榜 意外的是,任期中位数极小的这两家公司,薪资...

我以为我学懂了数据结构,直到看了这个导图才发现,我错了

数据结构与算法思维导图

技术大佬:我去,你写的 switch 语句也太老土了吧

昨天早上通过远程的方式 review 了两名新来同事的代码,大部分代码都写得很漂亮,严谨的同时注释也很到位,这令我非常满意。但当我看到他们当中有一个人写的 switch 语句时,还是忍不住破口大骂:“我擦,小王,你丫写的 switch 语句也太老土了吧!” 来看看小王写的代码吧,看完不要骂我装逼啊。 private static String createPlayer(PlayerTypes p...

华为初面+综合面试(Java技术面)附上面试题

华为面试整体流程大致分为笔试,性格测试,面试,综合面试,回学校等结果。笔试来说,华为的难度较中等,选择题难度和网易腾讯差不多。最后的代码题,相比下来就简单很多,一共3道题目,前2题很容易就AC,题目已经记不太清楚,不过难度确实不大。最后一题最后提交的代码过了75%的样例,一直没有发现剩下的25%可能存在什么坑。 笔试部分太久远,我就不怎么回忆了。直接将面试。 面试 如果说腾讯的面试是挥金如土...

和黑客斗争的 6 天!

互联网公司工作,很难避免不和黑客们打交道,我呆过的两家互联网公司,几乎每月每天每分钟都有黑客在公司网站上扫描。有的是寻找 Sql 注入的缺口,有的是寻找线上服务器可能存在的漏洞,大部分都...

讲一个程序员如何副业月赚三万的真实故事

loonggg读完需要3分钟速读仅需 1 分钟大家好,我是你们的校长。我之前讲过,这年头,只要肯动脑,肯行动,程序员凭借自己的技术,赚钱的方式还是有很多种的。仅仅靠在公司出卖自己的劳动时...

上班一个月,后悔当初着急入职的选择了

最近有个老铁,告诉我说,上班一个月,后悔当初着急入职现在公司了。他之前在美图做手机研发,今年美图那边今年也有一波组织优化调整,他是其中一个,在协商离职后,当时捉急找工作上班,因为有房贷供着,不能没有收入来源。所以匆忙选了一家公司,实际上是一个大型外包公司,主要派遣给其他手机厂商做外包项目。**当时承诺待遇还不错,所以就立马入职去上班了。但是后面入职后,发现薪酬待遇这块并不是HR所说那样,那个HR自...

女程序员,为什么比男程序员少???

昨天看到一档综艺节目,讨论了两个话题:(1)中国学生的数学成绩,平均下来看,会比国外好?为什么?(2)男生的数学成绩,平均下来看,会比女生好?为什么?同时,我又联想到了一个技术圈经常讨...

副业收入是我做程序媛的3倍,工作外的B面人生是怎样的?

提到“程序员”,多数人脑海里首先想到的大约是:为人木讷、薪水超高、工作枯燥…… 然而,当离开工作岗位,撕去层层标签,脱下“程序员”这身外套,有的人生动又有趣,马上展现出了完全不同的A/B面人生! 不论是简单的爱好,还是正经的副业,他们都干得同样出色。偶尔,还能和程序员的特质结合,产生奇妙的“化学反应”。 @Charlotte:平日素颜示人,周末美妆博主 大家都以为程序媛也个个不修边幅,但我们也许...

MySQL数据库面试题(2020最新版)

文章目录数据库基础知识为什么要使用数据库什么是SQL?什么是MySQL?数据库三大范式是什么mysql有关权限的表都有哪几个MySQL的binlog有有几种录入格式?分别有什么区别?数据类型mysql有哪些数据类型引擎MySQL存储引擎MyISAM与InnoDB区别MyISAM索引与InnoDB索引的区别?InnoDB引擎的4大特性存储引擎选择索引什么是索引?索引有哪些优缺点?索引使用场景(重点)...

如果你是老板,你会不会踢了这样的员工?

有个好朋友ZS,是技术总监,昨天问我:“有一个老下属,跟了我很多年,做事勤勤恳恳,主动性也很好。但随着公司的发展,他的进步速度,跟不上团队的步伐了,有点...

我入职阿里后,才知道原来简历这么写

私下里,有不少读者问我:“二哥,如何才能写出一份专业的技术简历呢?我总感觉自己写的简历太烂了,所以投了无数份,都石沉大海了。”说实话,我自己好多年没有写过简历了,但我认识的一个同行,他在阿里,给我说了一些他当年写简历的方法论,我感觉太牛逼了,实在是忍不住,就分享了出来,希望能够帮助到你。 01、简历的本质 作为简历的撰写者,你必须要搞清楚一点,简历的本质是什么,它就是为了来销售你的价值主张的。往深...

外包程序员的幸福生活

今天给你们讲述一个外包程序员的幸福生活。男主是Z哥,不是在外包公司上班的那种,是一名自由职业者,接外包项目自己干。接下来讲的都是真人真事。 先给大家介绍一下男主,Z哥,老程序员,是我十多年前的老同事,技术大牛,当过CTO,也创过业。因为我俩都爱好喝酒、踢球,再加上住的距离不算远,所以一直也断断续续的联系着,我对Z哥的状况也有大概了解。 Z哥几年前创业失败,后来他开始干起了外包,利用自己的技术能...

现代的 “Hello, World”,可不仅仅是几行代码而已

作者 |Charles R. Martin译者 | 弯月,责编 | 夕颜头图 |付费下载自视觉中国出品 | CSDN(ID:CSDNnews)新手...

!大部分程序员只会写3年代码

如果世界上都是这种不思进取的软件公司,那别说大部分程序员只会写 3 年代码,恐怕就没有程序员这种职业。

离职半年了,老东家又发 offer,回不回?

有小伙伴问松哥这个问题,他在上海某公司,在离职了几个月后,前公司的领导联系到他,希望他能够返聘回去,他很纠结要不要回去? 俗话说好马不吃回头草,但是这个小伙伴既然感到纠结了,我觉得至少说明了两个问题:1.曾经的公司还不错;2.现在的日子也不是很如意。否则应该就不会纠结了。 老实说,松哥之前也有过类似的经历,今天就来和小伙伴们聊聊回头草到底吃不吃。 首先一个基本观点,就是离职了也没必要和老东家弄的苦...

HTTP与HTTPS的区别

面试官问HTTP与HTTPS的区别,我这样回答让他竖起大拇指!

程序员毕业去大公司好还是小公司好?

虽然大公司并不是人人都能进,但我仍建议还未毕业的同学,尽力地通过校招向大公司挤,但凡挤进去,你这一生会容易很多。 大公司哪里好?没能进大公司怎么办?答案都在这里了,记得帮我点赞哦。 目录: 技术氛围 内部晋升与跳槽 啥也没学会,公司倒闭了? 不同的人脉圈,注定会有不同的结果 没能去大厂怎么办? 一、技术氛围 纵观整个程序员技术领域,哪个在行业有所名气的大牛,不是在大厂? 而且众所...

男生更看重女生的身材脸蛋,还是思想?

往往,我们看不进去大段大段的逻辑。深刻的哲理,往往短而精悍,一阵见血。问:产品经理挺漂亮的,有点心动,但不知道合不合得来。男生更看重女生的身材脸蛋,还是...

程序员为什么千万不要瞎努力?

本文作者用对比非常鲜明的两个开发团队的故事,讲解了敏捷开发之道 —— 如果你的团队缺乏统一标准的环境,那么即使勤劳努力,不仅会极其耗时而且成果甚微,使用...

为什么程序员做外包会被瞧不起?

二哥,有个事想询问下您的意见,您觉得应届生值得去外包吗?公司虽然挺大的,中xx,但待遇感觉挺低,马上要报到,挺纠结的。

当HR压你价,说你只值7K,你该怎么回答?

当HR压你价,说你只值7K时,你可以流畅地回答,记住,是流畅,不能犹豫。 礼貌地说:“7K是吗?了解了。嗯~其实我对贵司的面试官印象很好。只不过,现在我的手头上已经有一份11K的offer。来面试,主要也是自己对贵司挺有兴趣的,所以过来看看……”(未完) 这段话主要是陪HR互诈的同时,从公司兴趣,公司职员印象上,都给予对方正面的肯定,既能提升HR的好感度,又能让谈判气氛融洽,为后面的发挥留足空间。...

面试阿里p7,被按在地上摩擦,鬼知道我经历了什么?

面试阿里p7被问到的问题(当时我只知道第一个):@Conditional是做什么的?@Conditional多个条件是什么逻辑关系?条件判断在什么时候执...

终于懂了TCP和UDP协议区别

终于懂了TCP和UDP协议区别

无代码时代来临,程序员如何保住饭碗?

编程语言层出不穷,从最初的机器语言到如今2500种以上的高级语言,程序员们大呼“学到头秃”。程序员一边面临编程语言不断推陈出新,一边面临由于许多代码已存在,程序员编写新应用程序时存在重复“搬砖”的现象。 无代码/低代码编程应运而生。无代码/低代码是一种创建应用的方法,它可以让开发者使用最少的编码知识来快速开发应用程序。开发者通过图形界面中,可视化建模来组装和配置应用程序。这样一来,开发者直...

面试了一个 31 岁程序员,让我有所触动,30岁以上的程序员该何去何从?

最近面试了一个31岁8年经验的程序猿,让我有点感慨,大龄程序猿该何去何从。

大三实习生,字节跳动面经分享,已拿Offer

说实话,自己的算法,我一个不会,太难了吧

程序员垃圾简历长什么样?

已经连续五年参加大厂校招、社招的技术面试工作,简历看的不下于万份 这篇文章会用实例告诉你,什么是差的程序员简历! 疫情快要结束了,各个公司也都开始春招了,作为即将红遍大江南北的新晋UP主,那当然要为小伙伴们做点事(手动狗头)。 就在公众号里公开征简历,义务帮大家看,并一一点评。《启舰:春招在即,义务帮大家看看简历吧》 一石激起千层浪,三天收到两百多封简历。 花光了两个星期的所有空闲时...

立即提问
相关内容推荐