LogisticRegressionModel训练出逻辑回归模型后,怎么用这个模型去做预测?

LR模型已经训练出来并保存了,再次加载这个LR模型后怎么通过这个模型去做预测?模型类名:org.apache.spark.ml.classification.LogisticRegressionModel

1个回答

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
Logistic回归数据预处理问题

我在做一个新闻数据集的分类,用Logistic回归模型。(数据集来源:http://archive.ics.uci.edu/ml/datasets/Online+News+Popularity) 这个数据集中的数据类型比较杂,有离散的数据也有连续的,有些范围在1以内,有些可以达到几十万,请问对这样的数据可以采用一些什么样的方法预处理,使之适用于Logistic回归?

请用Python完成一个逻辑回归的算法

其中data.npz是数据读取数据的方法为: data = np.load("data.npz") x_train, y_train, x_test, y_test = data["x_train"],data["y_train"],data["x_test"],data["y_test"] x_train为训练集特征,y_train为对应的训练集标签, x_test为测试集特征,y_test为对应的测试集标签, 用训练集训练一个逻辑回归模型,要求在测试集上的测试精度达到90%以上。

Matlab实现Logistic Regression时的一个小问题

Ng机器学习编程作业matlab实现LR时里有这样一段 %% ============= Part 3: Optimizing using fminunc ============= % In this exercise, you will use a built-in function (fminunc) to find the % optimal parameters theta. % Set options for fminunc options = optimset('GradObj', 'on', 'MaxIter', 400); % Run fminunc to obtain the optimal theta % This function will return theta and the cost [theta, cost] = ... fminunc(@(t)(costFunction(t, X, y)), initial_theta, options); ... ================================ 不是很能理解optimset和fminunc的用法 [theta, cost] = ... fminunc(@(t)(costFunction(t, X, y)), initial_theta, options); =============================== 我是matlab初学者,这里需要用这个函数来实现梯度下降算法,也就是迭代多次学习theta。请问在fminunc里是怎样实现迭代的呢?那个@t是什么意思?optimset里的‘GradObj’是什么意思? 跪等大神解救!

想问有关逻辑回归预测的概率

![图片说明](https://img-ask.csdn.net/upload/201911/07/1573130408_381842.png) 逻辑回归预测的概率为什么会出现1和0?

各位大神求教:逻辑回归中置信区间是如何得出来的?

包括回归系数的置信区间计算,以及最终预测结果的置信区间的计算是如何完成的?没找到资料,也没完全想通,望能够给出推算过程的公式推演,以及原理说明,万分感谢!

Ng机器学习课程Part 2 Logistic Regression作业中的问题,急!!!

为什么调用fminunc()求解最佳theta出现这个问题??? ![图片说明](https://img-ask.csdn.net/upload/201507/20/1437398599_658002.png) ![图片说明](https://img-ask.csdn.net/upload/201507/20/1437398625_515983.png)

logistic regression costFunction问题

J = m^-1 * sum(((-1) * y.*log(h)).-((1- y).*log(1 - h))); 在matlab2014b里面提示运算符异常应该如何修改。

matlab实现牛顿法逻辑回归

矢量形式的知道怎么写 clear all; close all; clc x = load('ex4x.dat'); y = load('ex4y.dat'); [m, n] = size(x); % Add intercept term to x x = [ones(m, 1), x]; % Plot the training data % Use different markers for positives and negatives figure pos = find(y); neg = find(y == 0); plot(x(pos, 2), x(pos,3), '+') hold on plot(x(neg, 2), x(neg, 3), 'o') hold on xlabel('Exam 1 score') ylabel('Exam 2 score') % Initialize fitting parameters theta = zeros(n+1, 1); % Define the sigmoid function g = inline('1.0 ./ (1.0 + exp(-z))'); % Newton's method MAX_ITR = 10; J = zeros(MAX_ITR, 1); for i = 1:MAX_ITR % Calculate the hypothesis function z = x * theta; h = g(z); grad = (1/m).*x' * (h-y); H = (1/m).*x' * diag(h) * diag(1-h) * x; % Calculate J (for testing convergence) J(i) =(1/m)*sum(-y.*log(h) - (1-y).*log(1-h)); theta = theta - H\grad; end % Display theta theta % Calculate the probability that a student with % Score 20 on exam 1 and score 80 on exam 2 % will not be admitted prob = 1 - g([1, 20, 80]*theta) % Plot Newton's method result % Only need 2 points to define a line, so choose two endpoints plot_x = [min(x(:,2)+2), max(x(:,2))+2]; % Calculate the decision boundary line plot_y = (-1./theta(3)).*(theta(2).*plot_x +theta(1)); plot(plot_x, plot_y) legend('Admitted', 'Not admitted', 'Decision Boundary') hold off % Plot J figure plot(0:MAX_ITR-1, J, 'o--', 'MarkerFaceColor', 'r', 'MarkerSize', 8) xlabel('Iteration'); ylabel('J-cost') 求助非矢量型的怎么写 自己大概写的如下 是错的 因为不知道H的位置和表达方式 to=cputime(); x = load('ex4x.dat'); y = load('ex4y.dat'); m=length(y); x = [ones(m, 1), x]; pos = find(y); neg = find(y == 0); plot(x(pos, 2), x(pos,3), '*') hold on plot(x(neg, 2), x(neg, 3), 'o') hold on xlabel('Exam 1 score') ylabel('Exam 2 score') numfeature=size(x,2); numtrainsam = size(x,1); theta = zeros(numfeature, 1); maxiterations=10; errorperiteration=zeros(maxiterations,1); g = inline('1.0 ./ (1.0 + exp(-z))'); prevtheta=theta; for t=1:maxiterations toterror=0; for j=1:numfeature totslope=0; for i=1:m z=0; for jj=1:numfeature z=z+prevtheta(jj)*x(i,jj); end h=1.0/(1.0+exp(-z)); H=H+(x(i,q)*h*(1-h)*x(i,jj)); totslope=(totslope+(h-y(i))*x(i,j)); toterror=(toterror+-y(i)*log(h)-(1-y(i))*log(1-h)); end toterror=toterror/numtrainsam; theta(j)= theta(j)-H\totslope; end prevtheta=theta; errorperiteration(t)=toterror/j; end errorperiteration=zeros(maxiterations,1) prevtheta=theta; plot_x = [min(x(:,2)+2), max(x(:,2))+2]; % Calculate the decision boundary line plot_y = (-1./theta(3)).*(theta(2).*plot_x +theta(1)); plot(plot_x, plot_y) legend('Admitted', 'Not admitted', 'Decision Boundary') hold off

逻辑斯蒂回归达不到100%命中

fizzbuzz游戏,输出Y转换为onehot编码( 如 2 就是 [false,false,false,true] ),输入X是2~7是否整除( 比如 2就是 [true,false,false,false,false,false] ),这个问题用手算也是可以解得唯一解的,用logistic达到78%命中率就上不去了,不论怎么调整样本集和初始截距,但是knn和神经网络都能训练到100% 模型的预测结果是一个四列的0~1之间的数值( 比如 [ 0.02222, 0.011111, 0.7622111, 0.020001] ),用sklearn的score函数是不是会因为这个导致评价降低?要如何处理呢? 我把预测结果按照max==1重新分配后发现的确存在误分类点,这又是为什么? 不明白为什么,是模型问题吗?

机器学习中的一个函数:fit() 的相关问题

首先我import一个算法,比如是逻辑回归 ``` from sklearn.linear_model import LogisticRegression ``` 然后 ``` lr=LogisticRegression() ``` 然后就会用到fit函数 ``` lr.fit(x_train,y_train) ``` 如果我先传进去十个数据,再传进去十个数据,后十个会影响到前面的么? 就是说,前十个数据建立了模型,我再fit进去是个数据会对前面的模型有影响么?

请问逻辑回归的函数如何在MATLAB中求导以及求HESSIAN矩阵?

![图片说明](https://img-ask.csdn.net/upload/201905/03/1556864456_931596.png) 优化问题 类似如图的问题 需要用 梯度下降法和牛顿法求解 ``` function [ outcome ] = f( w,c,A,b ) n=size(A,1); m=size(A,2); outcome=0; for i=1:m outcome=outcome+log(1+exp(-b(i)*(w'*A(:,i)+c))); end outcome=(outcome+0.01*(w'*w+c*c))/m; end ``` 这样的函数如何去对他进行求导或者求HESSIAN 是否函数不能这样定义?

如何用AUC值评价logistics模型和ANN模型?

应用患者的肿瘤标志物和B超数据收集的资料,用python语言建立了光使用肿瘤标志物和肿瘤标志物联合B超诊断卵巢包块良性、交界性、恶性的logistics回归模型和ANN模型,现在得出了logistics1(光用肿瘤标志物的logistics回归分类模型)、logistics2(肿瘤标志联合B超的logistics回归分类模型)、BP-ANN1光用肿瘤标志的BP-ANN模型)和BP-ANN2(肿瘤标志联合B超的BP-ANN模型)这4种模型针对卵巢良性、交界性、恶性的诊断ROC曲线和曲线下面积,用于建立这4种模型的样本资料都是一样的,想问下现在是直接对比AUC值得大小就可以评价他们诊断效能的高低吗?还是需要像网上一些算SE、Z值、P值才能评价这些模型间的好坏?比如我给出的图是做出来的四个模型对诊断卵巢良性疾病的ROC曲线,是不是能直接得出bp-ANN2优于logistics2优于bpANN1优于logistics1模型的结论?![图片说明](https://img-ask.csdn.net/upload/201904/16/1555345391_837510.png)

sklearn中cross_val_predict训练过程中对模型拟合了吗?

sklearn中cross_val_predict训练过程中对模型拟合了吗?多分类问题中,已经明确有分类输出了。但是原模型若不fit的话,又无法用于下一步对测试集进行预测。请问cross_val_predict在生成predict时,是否已经训练了一次模型,如果是,这个在cross_val_predict过程中训练出的模型如何用于下一步预测?谢谢! ``` #train data:X0 #label : y #test data: v sgd = SGDClassifier() scores = cross_val_score(sgd, X0, y,cv=5, scoring = 'accuracy') y0 = cross_val_predict(sgd,X0,y,cv=5) print('scores = {}'.format(scores)) print('AVG : {}'.format(np.mean(scores))) print('SGD : {}'.format(sgd)) ``` 此处y0是有输出的。但是这个sgd不进行fit的话,无法调用predict。拟合的话:(假设拟合全部train): ``` sgd.fit(X0,y) y_pred= sgd.predict(X0) ``` 根据全体train得出的预测值y_pred又与原标签y不同。

weka学习AdditiveRegression算法

AdditiveRegression算法(GBDT在weka中的基本实现) 能不能给我一个 拥有使用这个算法对数据进行分类的截图 有正确率的那种 ![J48算法的分类结果](https://img-ask.csdn.net/upload/201604/11/1460360542_959041.png) 我最近才接触WEKA和数据挖掘 对这个算法不是很了解 网上大牛们博客上的中文内容我也基本都浏览完了 但对实现还是有些搞不定 我用的weka对数据进行分析 如果有经常使用这个平台的大神 还望帮帮忙 感激不尽

MATLAB怎么实现多元线性回归

我是做视频人数统计,用背景差分法得到了前景图像,提取前景像素面积和边缘周长,怎么用多元线性回归来估计人数?

Python sklearn LogisticsRegression运行警告问题。

运行Python sklearn LogisticsRegression产生两个警告: FutureWarning: Default solver will be changed to 'lbfgs' in 0.22. Specify a solver to silence this warning. FutureWarning: Default multi_class will be changed to 'auto' in 0.22. Specify the multi_class option to silence this warning. 想知道具体产生的原因,和去除方式。不要和我说屏蔽掉警告啊。

小白机器学习贝叶斯分类训练时候遇到问题,跪求大神解答

在训练多项式贝叶斯分类器classifer.fit(vce.transform(x_train),y_train)之后,想要通过测试集算准确率时classifier.score(vce.transform(x_test),y_test),出现错误MultinominalNB instance is not fitted yet,call 'fit' with appropriate arguments before using this method,我max_features选的是2000个,不知道这是什么问题,求大神指点迷津![图片说明](http://forum.csdn.net/PointForum/ui/scripts/csdn/Plugin/003/onion/3.gif)

有序多分类和无序多分类算法的SAS实现

各位大神们,小女子最近在研究有序多分类和无序多分类的理论知识,并且需要用SAS来实现,网上能够找到的程序实在太少了,有哪位对这方面比较熟悉的吗?希望分享下你们的实现程序,感谢啦

变量分析和数据预处理

### 问题1 有时需要对特征进行一些分析,比如特征之间的相关性,特征与目标变量之间的相关性,有时需要对数据进行一些预处理,比如对分类变量创建虚拟变量,对连续变量进行log变换或者标准化,归一化。 请问,这两个步骤之间的顺序是怎样的?是先创建虚拟变量,进行log变换后,再计算相关系数,进行卡方检验,方差分析或者互信息计算;还是先分析相关系数,卡方检验这些工作再创建虚拟变量,进行log变换? ### 问题2 假设一个分类问题数据集,有30个特征,为提高分类的准确率,或者出于汇报的要求(哪些特征,或者有可解释性意义的特征组合对结果影响较大)需要对特征进行分析和组合,不是PCA之类的降维,比如对两个连续变量进行计算组合,对几个分类变量生成透视表,生成新的变量。 如果只考虑特征的两两组合,有435种可能,这样分析工作量很大,请问,这样分析有必要吗?这还只是特征的两两组合,如果考虑更多变量的组合,可能性就更多了。 ### 问题3 如果问题2需要这些工作,那么,是先通过logistic回归或者随机森林,这些带有特征筛选性质的模型进行训练后,再进行特征组合,还是先进行特征组合再训练模型。 ### 问题4 P2中,对分类变量都创建了虚拟变量。个人理解,创建虚拟变量是为了避免模型认为分类变量之间有线性关系,除logistic回归外,其他模型好像不需要创建虚拟变量。请问哪些模型需要创建虚拟变量,是否创建虚拟变量对这些模型的结果是否有影响?

4小时玩转微信小程序——基础入门与微信支付实战

4小时玩转微信小程序——基础入门与微信支付实战

Python可以这样学(第四季:数据分析与科学计算可视化)

Python可以这样学(第四季:数据分析与科学计算可视化)

组成原理课程设计(实现机器数的真值还原等功能)

实现机器数的真值还原(定点小数)、定点小数的单符号位补码加减运算、定点小数的补码乘法运算和浮点数的加减运算。

javaWeb图书馆管理系统源码mysql版本

系统介绍 图书馆管理系统主要的目的是实现图书馆的信息化管理。图书馆的主要业务就是新书的借阅和归还,因此系统最核心的功能便是实现图书的借阅和归还。此外,还需要提供图书的信息查询、读者图书借阅情况的查询等

土豆浏览器

土豆浏览器可以用来看各种搞笑、电影、电视剧视频

Java面试题大全(2020版)

发现网上很多Java面试题都没有答案,所以花了很长时间搜集整理出来了这套Java面试题大全,希望对大家有帮助哈~ 本套Java面试题大全,全的不能再全,哈哈~ 一、Java 基础 1. JDK 和 JRE 有什么区别? JDK:Java Development Kit 的简称,java 开发工具包,提供了 java 的开发环境和运行环境。 JRE:Java Runtime Environ...

Java8零基础入门视频教程

Java8零基础入门视频教程

Java基础知识面试题(2020最新版)

文章目录Java概述何为编程什么是Javajdk1.5之后的三大版本JVM、JRE和JDK的关系什么是跨平台性?原理是什么Java语言有哪些特点什么是字节码?采用字节码的最大好处是什么什么是Java程序的主类?应用程序和小程序的主类有何不同?Java应用程序与小程序之间有那些差别?Java和C++的区别Oracle JDK 和 OpenJDK 的对比基础语法数据类型Java有哪些数据类型switc...

TTP229触摸代码以及触摸返回值处理

自己总结的ttp229触摸代码,触摸代码以及触摸按键处理

网络工程师小白入门--【思科CCNA、华为HCNA等网络工程师认证】

网络工程师小白入门--【思科CCNA、华为HCNA等网络工程师认证】

深度学习原理+项目实战+算法详解+主流框架(套餐)

深度学习系列课程从深度学习基础知识点开始讲解一步步进入神经网络的世界再到卷积和递归神经网络,详解各大经典网络架构。实战部分选择当下最火爆深度学习框架PyTorch与Tensorflow/Keras,全程实战演示框架核心使用与建模方法。项目实战部分选择计算机视觉与自然语言处理领域经典项目,从零开始详解算法原理,debug模式逐行代码解读。适合准备就业和转行的同学们加入学习! 建议按照下列课程顺序来进行学习 (1)掌握深度学习必备经典网络架构 (2)深度框架实战方法 (3)计算机视觉与自然语言处理项目实战。(按照课程排列顺序即可)

java jdk 8 帮助文档 中文 文档 chm 谷歌翻译

JDK1.8 API 中文谷歌翻译版 java帮助文档 JDK API java 帮助文档 谷歌翻译 JDK1.8 API 中文 谷歌翻译版 java帮助文档 Java最新帮助文档 本帮助文档是使用谷

Ubuntu18.04安装教程

Ubuntu18.04.1安装一、准备工作1.下载Ubuntu18.04.1 LTS2.制作U盘启动盘3.准备 Ubuntu18.04.1 的硬盘空间二、安装Ubuntu18.04.1三、安装后的一些工作1.安装输入法2.更换软件源四、双系统如何卸载Ubuntu18.04.1新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列...

快速排序---(面试碰到过好几次)

原理:    快速排序,说白了就是给基准数据找其正确索引位置的过程.    如下图所示,假设最开始的基准数据为数组第一个元素23,则首先用一个临时变量去存储基准数据,即tmp=23;然后分别从数组的两端扫描数组,设两个指示标志:low指向起始位置,high指向末尾.    首先从后半部分开始,如果扫描到的值大于基准数据就让high减1,如果发现有元素比该基准数据的值小(如上图中18&lt...

手把手实现Java图书管理系统(附源码)

手把手实现Java图书管理系统(附源码)

HTML期末大作业

这是我自己做的HTML期末大作业,花了很多时间,稍加修改就可以作为自己的作业了,而且也可以作为学习参考

Python数据挖掘简易入门

Python数据挖掘简易入门

极简JAVA学习营第四期(报名以后加助教微信:eduxy-1)

极简JAVA学习营第四期(报名以后加助教微信:eduxy-1)

C++语言基础视频教程

C++语言基础视频教程

UnityLicence

UnityLicence

软件测试2小时入门

软件测试2小时入门

YOLOv3目标检测实战:训练自己的数据集

YOLOv3目标检测实战:训练自己的数据集

Python数据分析师-实战系列

系列课程主要包括Python数据分析必备工具包,数据分析案例实战,核心算法实战与企业级数据分析与建模解决方案实战,建议大家按照系列课程阶段顺序进行学习。所有数据集均为企业收集的真实数据集,整体风格以实战为导向,通俗讲解Python数据分析核心技巧与实战解决方案。

YOLOv3目标检测实战系列课程

《YOLOv3目标检测实战系列课程》旨在帮助大家掌握YOLOv3目标检测的训练、原理、源码与网络模型改进方法。 本课程的YOLOv3使用原作darknet(c语言编写),在Ubuntu系统上做项目演示。 本系列课程包括三门课: (1)《YOLOv3目标检测实战:训练自己的数据集》 包括:安装darknet、给自己的数据集打标签、整理自己的数据集、修改配置文件、训练自己的数据集、测试训练出的网络模型、性能统计(mAP计算和画出PR曲线)和先验框聚类。 (2)《YOLOv3目标检测:原理与源码解析》讲解YOLOv1、YOLOv2、YOLOv3的原理、程序流程并解析各层的源码。 (3)《YOLOv3目标检测:网络模型改进方法》讲解YOLOv3的改进方法,包括改进1:不显示指定类别目标的方法 (增加功能) ;改进2:合并BN层到卷积层 (加快推理速度) ; 改进3:使用GIoU指标和损失函数 (提高检测精度) ;改进4:tiny YOLOv3 (简化网络模型)并介绍 AlexeyAB/darknet项目。

超详细MySQL安装及基本使用教程

一、下载MySQL 首先,去数据库的官网http://www.mysql.com下载MySQL。 点击进入后的首页如下:  然后点击downloads,community,选择MySQL Community Server。如下图:  滑到下面,找到Recommended Download,然后点击go to download page。如下图:  点击download进入下载页面选择No...

一学即懂的计算机视觉(第一季)

一学即懂的计算机视觉(第一季)

董付国老师Python全栈学习优惠套餐

购买套餐的朋友可以关注微信公众号“Python小屋”,上传付款截图,然后领取董老师任意图书1本。

爬取妹子图片(简单入门)

安装第三方请求库 requests 被网站禁止了访问 原因是我们是Python过来的 重新给一段 可能还是存在用不了,使用网页的 编写代码 上面注意看匹配内容 User-Agent:请求对象 AppleWebKit:请求内核 Chrome浏览器 //请求网页 import requests import re //正则表达式 就是去不规则的网页里面提取有规律的信息 headers = { 'User-Agent':'存放浏览器里面的' } response = requests.get

web网页制作期末大作业

分享思维,改变世界. web网页制作,期末大作业. 所用技术:html css javascript 分享所学所得

技术大佬:我去,你写的 switch 语句也太老土了吧

昨天早上通过远程的方式 review 了两名新来同事的代码,大部分代码都写得很漂亮,严谨的同时注释也很到位,这令我非常满意。但当我看到他们当中有一个人写的 switch 语句时,还是忍不住破口大骂:“我擦,小王,你丫写的 switch 语句也太老土了吧!” 来看看小王写的代码吧,看完不要骂我装逼啊。 private static String createPlayer(PlayerTypes p...

相关热词 c# 解析cad c#数字格式化万 c#int转byte c#格式化日期 c# wpf 表格 c# 实现ad域验证登录 c#心跳包机制 c#使用fmod.dll c#dll vb 调用 c# outlook
立即提问
相关内容推荐