用statsmodel包做logit回归。

熬了5个小时了，对于小白来讲太蒙了，有没有大神帮帮我。

import pandas as pd
import numpy as np
import statsmodels.api as sm
import pylab as pl
df = pd.read_csv(r'C:\Users\Administrator\Desktop\Application.csv')
print(df.head())

df.columns = ['admit','gre','gpa','sch_rank']
print(df.columns)

df.describe()

dummy_ranks = pd.get_dummies(df['sch_rank'],prefix = 'sch_rank')
print(dummy_ranks.head())

cols_to_keep = ['admit','gre','gpa']
data = df[cols_to_keep].join(dummy_ranks.loc[:, : 'sch_rank_3'])
print(data.head())

data['intercept'] = 1.0
print(data.head())

train_cols = data.columns[1:]
print(train_cols)

logit = sm.Logit(data['admit'],data[train_cols])
result = logit.fit()

我是按照一篇教程做的，但是我这怎么就过不了啊。教程地址放下边。

https://blog.csdn.net/weixin_39641876/article/details/110974752?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522162204686716780271567505%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=162204686716780271567505&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduend~default-1-110974752.first_rank_v2_pc_rank_v29&utm_term=Logit%E6%A8%A1%E5%9E%8B%E6%8B%9F%E5%90%88%E5%AE%9E%E6%88%98%E6%A1%88%E4%BE%8B%EF%BC%88Python%EF%BC%89%E2%80%94%E2%80%94%E7%A6%BB%E6%95%A3%E9%80%89%E6%8B%A9%E6%A8%A1%E5%9E%8B%E4%B9%8B%E5%85%AD&spm=1018.2226.3001.4187

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
python收藏家 2021-05-27 11:38
关注
是不是你数据集不全啊，我看别人的是400条数据，你这才14条

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

has no attribute 'Logit' python 回归有问必答
2021-12-21 15:58

回答 2 已采纳拼写错误? 这样试试 sm.Logit()
条件logit内生性问题怎么解决（stata）其他
2022-05-23 00:12

回答 1 已采纳 EEV的性质是什么？除了二进制的还有别的吗？至少，你应该考虑进行 Hausman 检验。你可以参考下面的论文https://dspace.mit.edu/bitstream/handle/1721.1
Statsmodels.api 训练模型如何解决过拟合的问题？ python 逻辑回归
2023-01-10 11:15

回答 2 已采纳你说的方式都可以缓解过拟合问题。使用 L1 正则化项来解决过拟合问题(使用 statsmodels.formula.logit 函数中的 L1_wt 参数来设置 L1 正则化项，或者使用 L2_w
python 分类变量回归_分类变量回归——Probit和Logit（附代码）
2020-12-09 21:07

weixin_39811386的博客使用普通线性回归技术，我们必须确保回归技术对于研究问题的适用性，才能相信回归结果是可靠的。识别回归技术的适用性，我们需要对回归分析进行诊断，诊断内容是线性回归最基本的六个假设是否成立，即误差项是一个...
GNN解决图着色（图论）问题 pycharm python tensorflow
2023-04-20 10:03

回答 6 已采纳关于loss变化的问题，可能是因为RNN循环的次数较多（32），导致模型训练较慢，需要更多的迭代才能收敛。此外，模型可能存在梯度爆炸或消失问题，可以尝试加入梯度裁剪或使用其他的优化器和学习率调整策略。
如何解读glmer的数据 r语言数据分析逻辑回归
2023-04-09 02:57

回答 2 已采纳以下内容部分参考ChatGPT模型：根据提供的glmer模型结果，我们可以解释各自变量和因变量之间的关系： number：这是一个二元变量，其取值为单数或复数。模型结果显示，单数与名词所属的格为n
pytorch出现TypeError: 'module' object is not callable python pytorch 神经网络
2021-09-02 08:56

回答 1 已采纳 CUB_loader 是什么怎么定义的，可能是传参问题
python做logistic回归分析
2021-01-04 20:21

JECK_ケーキ的博客 python做logistic回归分析，我觉的使用statsmodel库比较好，结果输出比较整齐。很类似传统的统计软件。比如使用 kaggel 的heart数据集。地址在：https://www.kaggle.com/zhaoyingzhu/heartcsv ############...
MATLAB函数使用问题 matlab
2022-12-18 15:04

回答 1 已采纳你可以看下这个问题的回答https://ask.csdn.net/questions/7651503你也可以参考下这篇文章：matlab实用函数汇总你还可以看下matlab参考手册中的 matlab
MATLAB的函数使用错误 matlab
2022-12-17 20:30

回答 1 已采纳在使用 glmfit 函数时出现这个错误的原因有很多种。你的情况下，其中一种可能的原因是您的输入数据有病态系数矩阵。也就是说输入的解释变量（即 x）中的一些列是完全相关的，导致计算线性回归模型的系数
modle.fit训练时出现InvalidArgumentError: logits and labels must have the same first dimension, got logits shape [20,40] and labels shape [800] tensorflow 人工智能深度学习神经网络
2020-07-28 10:50

回答 1 已采纳 https://blog.csdn.net/G_B_L/article/details/99871466
Python statsmodel包训练LR模型
2018-09-29 13:35

lalahu_123的博客 Python中训练LR模型一般使用sklearn包，输出模型报告和其他机器学习方法一样。但从统计背景出发，想看更详细的报告，statsmodel包可以帮助实现。 1.训练模型 import statsmodels.api as sm from statsmodels.stats....
adaptive lasso-logistic r语言有问必答
2021-05-26 18:32

回答 2 已采纳参考一下：https://www.zhihu.com/question/36730804，希望对你有帮助
python和stata回归的区别_多项式Logit模型Python与Stata的不同结果
2020-12-06 13:10

weixin_39594296的博客我尝试使用python和stata构建多项式logit模型。我的数据如下：ses_type prog_type read write math prog ses0 low Diploma 39.2 40.2 46.2 0 01 middle general 39.2 38.2 46.2 1 12 h...
python统计分析——逻辑回归
2024-03-01 01:00

maizeman126的博客设成功概率（即考试合格率）为p，联系函数为logit函数，则考试合格率与学习时间的关系如下：（本例将研究考试合格情况与学习时间的逻辑回归关系）logistic函数时logit函数的反函数，设Logit函数为f(x)，logistic函数...
Python Statsmodels 统计包之 OLS 回归
2018-04-27 10:02

chairmannmg001的博客 Statsmodels 是 Python 中一个强大的统计分析包，包含了回归分析、时间序列分析、假设检验等等的功能。Statsmodels 在计量的简便性上是远远不及 Stata 等软件的，但它的优点在于可以与 Python 的其他的任务（如 ...
多分类逻辑回归 MNLogit python
2022-08-17 17:48

CRLBJ的博客多分类逻辑回归，python实现，统计分析，MNLogit，statsmodels
python 多元线性回归无截距_多元线性回归的statsmodel如何将截距设为0
2020-12-20 13:25

weixin_39686048的博客这取决于您使用的api。如果您使用的是statsmodels.api...如果你不这样做，就没有拦截。在import pandas as pdimport statsmodels.formula.api as smfimport statsmodels.api as smdf = pd.DataFrame({'x': range(0,1...
Python数模笔记-StatsModels 统计回归（1）简介
2021-05-04 10:01

youcans_的博客 statsmodels（http://www.statsmodels.org）是一个Python库，用于拟合多种统计模型，执行统计测试以及数据探索和可视化。文档最新版本的文档位于： https://www.statsmodels.org/stable/ 主要功能线性回归模型...
基于AIC评价指标的逐步回归Python语言实现
2020-12-31 19:30

德瑞-Derry的博客本文主要介绍了逻辑回归的评价指标和逻辑回归中常用的三种变量筛选方法，并介绍了三种变量筛选方法的原理及运行效率问题，在文章最后给出了一种基于AIC评价指标的逐步回归的Python实现。
没有解决我的问题, 去提问

悬赏问题

¥20 关于wordpress建站遇到的问题！(语言-php)（相关搜索：云服务器）
¥15 【求职】怎么找到一个周围人素质都很高不会欺负他人，并且未来月薪能够达到一万以上（技术岗）的工作？希望可以收到写有具体，可靠，已经实践过了的路径的回答？
¥15 Java+vue部署版本反编译
¥100 对反编译和ai熟悉的开发者。
¥15 带序列特征的多输出预测模型
¥15 Python 如何安装 distutils模块
¥15 关于#网络#的问题：网络是从楼上引一根网线下来，接了2台傻瓜交换机，也更换了ip还是不行
¥15 资源泄露软件闪退怎么解决？
¥15 CCF-CSP 2023 第三题解压缩(50％)
¥30 comfyui openpose报错

用statsmodel包做logit回归。

1条回答 默认 最新

悬赏问题

1条回答默认最新