Cassie_17 2023-11-03 21:08 采纳率: 0%
浏览 23

LDA主题一致性指标为什么每次跑出来的结果不一样?

LDA主题一致性指标为什么每次跑出来的结果不一样?

if __name__ == '__main__':
    dictionary = corpora.Dictionary(cut_word_list)
    doc_term_matrix = [dictionary.doc2bow(rev) for rev in cut_word_list]
    modellist,coherence_values = compute_coherence_values(dictionary=dictionary, corpus=doc_term_matrix, texts=cut_word_list, start=3, limit=15, step=1)
    limit=15; start=3; step=1;
    x = range(start, limit, step)
    plt.plot(x, coherence_values)
    plt.xlabel("主题数")
    plt.ylabel("主题得分")
    plt.legend(("coherence_values"), loc='best')
    plt.show()

  • 写回答

1条回答 默认 最新

  • CSDN-Ada助手 CSDN-AI 官方账号 2023-11-04 08:37
    关注

    【以下回答由 GPT 生成】

    问题分析: LDA主题一致性指标是一种基于统计模型的度量方法,用于评价LDA模型的好坏,其计算过程中存在随机性。这就是每次运行结果不一样的原因。

    解决方案: 要获得一致的结果,可以采取以下两种方法:

    1. 设置随机种子: 在训练LDA模型之前,设置一个固定的随机种子,确保每次运行的随机过程是一样的。这可以使用Python的random模块来实现。例如,在代码中添加以下一行即可:
    import random
    
    random.seed(100)  # 设置随机种子
    

    这样就会使用相同的随机种子,从而得到相同的结果。

    1. 平均多次运行结果: 对于LDA模型的计算结果,可以进行多次运行,然后取平均值作为最终的结果。可以设定一个循环,在循环中运行LDA模型多次,然后将结果累加求平均。以下是代码示例:
    import numpy as np
    
    num_runs = 10
    coherence_values_sum = np.zeros(limit-start+1)
    
    for i in range(num_runs):
        modellist, coherence_values = compute_coherence_values(dictionary=dictionary, corpus=doc_term_matrix, texts=cut_word_list, start=3, limit=15, step=1)
        coherence_values_sum += coherence_values
    
    coherence_values_avg = coherence_values_sum / num_runs
    
    x = range(start, limit, step)
    plt.plot(x, coherence_values_avg)
    plt.xlabel("主题数")
    plt.ylabel("主题得分")
    plt.legend(("coherence_values"), loc='best')
    plt.show()
    

    通过多次运行并取平均值,可以获得一致的结果。

    以上是两种解决问题的方法,你可以根据实际需求选择其中一种或两种方法来得到一致的结果。



    【相关推荐】



    如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^
    评论

报告相同问题?

问题事件

  • 创建了问题 11月3日

悬赏问题

  • ¥15 phython如何实现以下功能?查找同一用户名的消费金额合并—
  • ¥15 孟德尔随机化怎样画共定位分析图
  • ¥18 模拟电路问题解答有偿速度
  • ¥15 CST仿真别人的模型结果仿真结果S参数完全不对
  • ¥15 误删注册表文件致win10无法开启
  • ¥15 请问在阿里云服务器中怎么利用数据库制作网站
  • ¥60 ESP32怎么烧录自启动程序
  • ¥50 html2canvas超出滚动条不显示
  • ¥15 java业务性能问题求解(sql,业务设计相关)
  • ¥15 52810 尾椎c三个a 写蓝牙地址