猴猴猴码猴 2023-04-18 22:58 采纳率: 100%
浏览 15
已结题

在逻辑回归中,如果F1值为何不下降?

在给定的文本的命名实体识别,逻辑回归的迭代不需要torch,只用给定的公式即可,现发现不管是给定的数据集还是自己试验用的小规模数据,F1是一个常数不随sita的改变而变。请问是什么原因呢?

  • 写回答

1条回答 默认 最新

  • 关注

    在逻辑回归中,如果F1值不下降可能有以下原因:

    1、数据不平衡:F1是准确率和召回率的调和平均数,如果训练数据集中标签的分布不平衡,可能会导致F1值不变或下降。可以考虑对数据进行重采样或使用类别权重等方法来处理数据不平衡问题。

    2、模型没有收敛:如果模型没有收敛,那么在迭代过程中F1值可能会变化或不变。可以尝试调整学习率或增加迭代次数来使模型收敛。

    3、特征选择不合适:如果特征选择不合适,模型可能无法从数据中学到有效的模式,导致F1值不变。可以尝试使用更多的特征或使用特征选择方法来选择最优的特征。

    4、学习率过高或过低:学习率是控制模型参数更新步长的超参数,如果学习率过高或过低,可能会导致模型无法收敛或收敛速度过慢,从而导致F1值不变。可以尝试调整学习率来解决这个问题。

    另外,建议检查一下代码中的实现是否正确,比如sigmoid函数是否正确实现,是否有误差的积累等问题。以下是一份简单的逻辑回归代码示例,供参考:

    import numpy as np
    
    # 计算sigmoid函数
    def sigmoid(x):
        return 1 / (1 + np.exp(-x))
    
    # 计算代价函数和梯度
    def cost_function(theta, X, y):
        m = len(y)
        J = (-1 / m) * np.sum(y * np.log(sigmoid(X.dot(theta))) + (1 - y) * np.log(1 - sigmoid(X.dot(theta))))
        grad = (1 / m) * X.T.dot(sigmoid(X.dot(theta)) - y)
        return J, grad
    
    # 梯度下降算法
    def gradient_descent(X, y, theta, alpha, num_iters):
        m = len(y)
        J_history = np.zeros((num_iters, 1))
        for i in range(num_iters):
            J_history[i], grad = cost_function(theta, X, y)
            theta = theta - alpha * grad
        return theta, J_history
    
    # 加载数据
    data = np.loadtxt('data.txt', delimiter=',')
    X = data[:, :-1]
    y = data[:, -1]
    
    # 特征缩放
    X = (X - np.mean(X, axis=0)) / np.std(X, axis=0)
    
    # 添加一列全为1的偏置项
    X = np.hstack((np.ones((len(y), 1)), X))
    
    # 初始化模型参数
    theta = np.zeros((X.shape[1], 1))
    
    # 设置超参数
    alpha = 0.01
    num_iters = 1000
    
    # 训练模型
    theta, J_history = gradient_descent(X, y, theta
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 4月19日
  • 已采纳回答 4月19日
  • 创建了问题 4月18日

悬赏问题

  • ¥50 pointpillars等目标检测算法怎么融合注意力机制
  • ¥15 关于超局变量获取查询的问题
  • ¥20 Vs code Mac系统 PHP Debug调试环境配置
  • ¥60 大一项目课,微信小程序
  • ¥15 求视频摘要youtube和ovp数据集
  • ¥15 在启动roslaunch时出现如下问题
  • ¥15 汇编语言实现加减法计算器的功能
  • ¥20 关于多单片机模块化的一些问题
  • ¥30 seata使用出现报错,其他服务找不到seata
  • ¥35 引用csv数据文件(4列1800行),通过高斯-赛德尔法拟合曲线,在选取(每五十点取1点)数据,求该数据点的曲率中心。