关于#机器学习#的问题：逻辑斯蒂分类(语言-python)

逻辑斯蒂分类的结果很差，有没有大lao看看什么原因？全部代码放在下面，主要问题我觉得应该可能是梯度下降不对，但是实在检查不出来

def acc(y_true,y_pred):
    return np.mean(y_true==y_pred);
def auc(y_true,y_pred):
    return
def logistic(z):
    return 1/(1+np.exp(-z));
def GD(epoch,learning_rates,l2_coef,x_train,y_train,x_test,y_test):
    theta=np.random.normal(size=(x_train.shape[1],)).reshape(-1,1);
    train_losses=[];
    test_losses=[];
    train_acc=[];
    test_acc=[];
    train_auc=[];
    test_auc=[];
    y_train.reshape(-1,1);
    y_test.reshape(-1,1);
    
    for i in range(epoch):
        pred=logistic(x_train@theta).reshape(-1,1);
        theta=(1-l2_coef*learning_rates)*theta+learning_rates*x_train.T@(y_train-pred);
        train_loss=-y_train.T@np.log(pred)-(1-y_train).T@np.log(1-pred)+l2_coef*np.linalg.norm(theta)**2/2;
        train_losses.append(train_loss/len(x_train));
        test_pred=logistic(x_test@theta);
        test_loss=-y_test.T@np.log(test_pred)-(1-y_test).T@np.log(1-test_pred)+l2_coef*np.linalg.norm(theta)**2/2;
        test_losses.append(test_loss/len(x_test));
        train_acc.append(acc(y_train,pred>=0.5));
        test_acc.append(acc(y_test,test_pred>=0.5));
        train_auc.append(acc(y_train,pred>=0.5));
        test_auc.append(acc(y_test,test_pred>=0.5));
    return theta,train_losses,test_losses,train_acc,test_acc,train_auc,test_auc;

#高斯分布参数
mean1 = np.array([0, 0])
cov1 = np.array([[1, 0], [0, 1]])
mean2 = np.array([4,4])
cov2 = np.array([[1, 0], [0, 1]])
#生成高斯分布
m=100
data1 = np.random.multivariate_normal(mean1, cov1, m)
one1=np.ones([m,1]);
data1_and_label=np.concatenate((data1,one1),axis=1);
data2 = np.random.multivariate_normal(mean2, cov2, m)
one2=0*np.ones([m,1]);
data2_and_label=np.concatenate((data2,one2),axis=1);

x1, y1 = data1[:,0],data1[:,1];
x2, y2 = data2[:,0],data1[:,1];

x=np.concatenate((data1,data2),axis=0);
y=np.concatenate((one1,one2),axis=0)

np.random.seed(0);
ratio=0.7;
split=int(len(x)*ratio);
idx=np.random.permutation(len(x));
x=x[idx];
y=y[idx];#x就是坐标，y是label

x_train,y_train=x[:split,:],y[:split];
x_test,y_test=x[split:,:],y[split:];

x_train=np.concatenate((x_train,np.ones([len(x_train),1])),axis=1);
x_test=np.concatenate((x_test,np.ones([len(x_test),1])),axis=1);
epoch=500
learning_rate=0.002;
l2_coef=1;
theta,train_losses,test_losses,train_acc,test_acc,train_auc,test_auc=GD(epoch,learning_rate,l2_coef,x_train,y_train,x_test,y_test)

train_losses=np.reshape(np.array(train_losses),[-1,1]);
test_losses=np.reshape(np.array(test_losses),[-1,1]);
train_acc=np.reshape(np.array(train_acc),[-1,1]);
test_acc=np.reshape(np.array(test_acc),[-1,1]);
train_auc=np.reshape(np.array(train_auc),[-1,1]);
test_auc=np.reshape(np.array(test_auc),[-1,1]);
#损失图像
xticks=np.arange(epoch)+1;
plt.figure(1);
plt.plot(xticks,train_losses,color='b',label='train_loss');
plt.plot(xticks,test_losses,color='r',label='train_loss');
#准确率曲线
plt.figure(2);
plt.plot(xticks,train_acc,color='b',label='train_loss');
plt.plot(xticks,test_acc,color='r',label='train_loss');
#auc曲线
plt.figure(3);
plt.plot(xticks,train_auc,color='b',label='train_loss');
plt.plot(xticks,test_auc,color='r',label='train_loss');
#分类图
plt.figure(4);
plt.scatter(x1, y1, s=15,marker='+', color='coral');
plt.scatter(x2, y2, s=15,marker='p', color='b');
plot_x=np.linspace(min(min(x1),min(x2)),max(max(x1),max(x2)),100);
plot_y=-(theta[0]*plot_x+theta[2])/theta[1];
plt.plot(plot_x,plot_y,ls='-.');
plt.show();

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 全栈领域优质创作者 2024-07-13 20:03
关注
引自免费微信小程序：皆我百晓生

你的代码中有几个可能的问题导致逻辑斯蒂回归分类器的性能不佳。我会逐一分析并提供可能的解决方案。

梯度下降问题

首先，检查你的梯度下降算法。你的更新规则看起来是正确的，但是有几个细节需要注意：

学习率调整：逻辑斯蒂回归中的梯度下降通常需要调整学习率以确保收敛。如果学习率过高，可能会导致模型不收敛或收敛到局部最优解而不是全局最优解。你可能需要尝试使用不同的学习率。
特征缩放：在进行逻辑斯蒂回归之前，确保所有的特征都在相似的尺度上。特征缩放可以加快梯度下降的收敛速度并提高模型的性能。

模型复杂性

检查你的模型是否过于简单或过于复杂。逻辑斯蒂回归适用于线性可分问题。如果你的数据分布非常非线性，模型可能无法准确拟合数据。你可以考虑使用更复杂的模型，如决策树、随机森林或神经网络等。

数据问题

检查你的数据是否适合逻辑斯蒂回归模型。确保你的数据是干净的，并且不包含噪声或异常值。另外，检查数据集的分布是否均衡，类别是否均衡也会影响模型的性能。

代码中的其他潜在问题

在代码中，我发现一些可能需要改进的地方：

在计算损失函数时，确保正确地计算了预测概率和损失值。损失函数应该反映模型预测与真实标签之间的差异。
在绘制准确率曲线和AUC曲线时，确保正确地计算了准确率和AUC值。准确率和AUC的计算方式应该正确反映模型的性能。
在生成高斯分布数据时，检查数据生成的逻辑是否正确，并确保数据的分布符合你的预期。

针对上述问题，你可以尝试以下解决方案：

调整梯度下降的学习率，尝试使用不同的学习率来找到最佳值。
考虑使用特征缩放来确保所有特征都在相似的尺度上。
如果数据非线性可分，尝试使用更复杂的模型。
检查数据的质量和分布，确保数据适合逻辑斯蒂回归模型。
仔细检查代码中的逻辑和计算过程，确保计算准确且没有错误。

此外，为了帮助你更好地理解模型的性能，你还可以考虑绘制混淆矩阵、计算召回率、精确率等指标来评估模型的性能。这些指标可以提供更多关于模型性能的信息，帮助你进行调试和改进。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

关于#机器学习#的问题：如图所示的字符串(语言-python) python
2022-10-02 10:29

回答 1 已采纳处理成什么样？能不能说清楚？
关于#机器学习#的问题，如何解决？(语言-python) python 开发语言机器学习
2023-03-12 14:43

回答 2 已采纳这个错误提示表明，在计算距离的时候使用了字符串类型的数据，而距离计算一般是针对数值型数据的。你需要检查你的数据，看看是否有些特征是字符串类型的，如果有，你需要进行相应的处理，将其转换为数值类型，比如使
关于#机器学习#的问题：问题遇到的现象和发生背景(语言-matlab) matlab 人工智能机器学习
2022-07-30 10:46

回答 1 已采纳注意MATLAB编译和运行Cpp文件需要C++的环境哟~ https://blog.csdn.net/lihe4151021/article/details/121521250这篇文章很好得讲解了如
python人工智能逻辑斯蒂(logistic)分类算法.rar
2021-04-18 20:51

下面将详细阐述Python、人工智能、机器学习以及逻辑斯蒂分类算法在婚恋配对中的应用。首先，让我们了解逻辑斯蒂回归。逻辑斯蒂回归并非真正的“回归”，而是一种分类算法。它通过构建一个S型曲线（即逻辑函数）来...
关于#机器学习#的问题：如何基于交叉验证进行模型的选择与评价人工智能机器学习
2023-02-21 23:52

回答 2 已采纳交叉验证是一种在机器学习中常用的评估模型性能的方法。它的基本思想是将数据集分成若干个互不重叠的子集，然后利用其中的一部分子集作为测试集，而将其他子集作为训练集，这样可以对模型进行多次训练和测试，以获得
关于#机器学习#的问题：回归问题中Y值的大小对评估指标的影响是否很大？人工智能机器学习目标检测
2021-07-11 12:02

回答 1 已采纳你的y是指Y(x)=W0+W1*x的Y么？如果是这个的话，y的大小和评估指标是没有影响的，只有y的分布对这个才有影响。如果说rmes，公式如上，如果训练数据（xi,yi）总体上接近一条直线，那么这
关于#机器学习#的问题：RMSE, MAE都是pso_bp最好，而MAPE却是BP最好机器学习神经网络
2022-11-10 21:25

回答 1 已采纳 MAE和RMSE一样，衡量的是真实值与预测值的偏离的绝对大小情况；而MAPE衡量的是偏离的相对大小（即百分率）。相对来说，MAE和MAPE不容易受极端值的影响；而MSE/RMSE采用误差的平方，会放
基于传统机器学习(朴素贝叶斯逻辑斯蒂回归 lightGBM)实现中文文本分类python源码+文本数据集+项目说明.zip
2024-05-30 16:53

基于传统机器学习(朴素贝叶斯逻辑斯蒂回归 lightGBM)实现中文文本分类python源码+文本数据集+项目说明.zip个人经导师指导并认可通过的高分设计项目，评审分98分。主要针对计算机相关专业的学生和需要项目实战练习的...
关于#python#的问题：用逻辑回归的one VS rest来解决一个三分类的数据 python 分类有问必答机器学习
2022-11-16 14:28

回答 2 已采纳在代码中只需要写一次，因为根据西瓜书第三章的原理，或者sklearn中的解释，内部会训练三个二分类模型从而达到扩展到多分类
关于#python#的问题：如何评价多个向量之间的相似性 python 人工智能机器学习
2023-04-15 09:51

回答 2 已采纳基于Monster 组和GPT的调写：评价多个向量之间的相似性，可以考虑使用聚类分析方法。聚类分析是一种将相似的对象组合成类或簇的技术，其中相似性可以通过各种距离度量来定义。在这种情况下，每个向量
关于#机器学习#的问题：标准方程法需要计算X, X^T， (X^TX)^(-1)和y才能计算\theta 有问必答机器学习
2022-06-14 04:19

回答 2 已采纳吴恩达机器学习笔记：Normal equation（正规方程法） - 知乎 Normal equation: Method to solv
基于机器学习K-means+SVM逻辑斯蒂回归的NBA杰出球员及比赛结果预测.zip
2023-08-20 16:09

基于机器学习K-means+SVM逻辑斯蒂回归的NBA杰出球员及比赛结果预测.zip 该项目是个人大作业项目源码，评审分达到95分以上，都经过严格调试，确保可以运行！放心下载使用。该项目资源主要针对计算机相关专业的学生或...
关于#python#的知识点：关于求得拟合曲线函数的斜率的问题 python 数据挖掘有问必答机器学习
2021-07-13 15:18

回答 1 已采纳 np.poly1d方法生成的多项式本身带有求导的方法deriv n = np.poly1d([2,3,5,7]) print(n.deriv()) print(n.deriv()(1))
机器学习7-逻辑斯蒂回归实现西瓜数据集2.0的二分类
2022-04-14 20:12

Aaron-ywl的博客文章目录1 什么是逻辑回归1.1 Sigmoid函数介绍2 逻辑回归公式推导2.1 损失函数推导3 逻辑回归迭代公式3.1 函数特性3.2 求导过程4 逻辑回归实现西瓜数据集2.0的分类我们在实现西瓜数据集2.0分类之前先讲讲逻辑回归...
机器学习第八篇：详解逻辑斯蒂回归算法
2020-12-19 11:00

俊红的数据分析之路的博客 01|基本概念：在介绍逻辑回归模型以前，先介绍一下逻辑斯谛分布。设X是连续型随机变量，X服从逻辑斯蒂分布是指X具有下列分布函数F(x)和密度函数f(x)：逻辑斯谛分布的分布函数F(x)的...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月13日

悬赏问题

¥15 35114 SVAC视频验签的问题
¥15 impedancepy
¥15 在虚拟机环境下完成以下，要求截图！
¥15 求往届大挑得奖作品（ppt…）
¥15 如何在vue.config.js中读取到public文件夹下window.APP_CONFIG.API_BASE_URL的值
¥50 浦育平台scratch图形化编程
¥20 求这个的原理图只要原理图
¥15 vue2项目中，如何配置环境，可以在打完包之后修改请求的服务器地址
¥20 微信的店铺小程序如何修改背景图
¥15 UE5.1局部变量对蓝图不可见

关于#机器学习#的问题：逻辑斯蒂分类(语言-python)

5条回答 默认 最新

梯度下降问题

模型复杂性

数据问题

代码中的其他潜在问题

问题事件

悬赏问题

5条回答默认最新