LDA模型中阿尔法和贝塔如果不设置有默认值吗

想问一下编辑LDA代码中需要设置阿尔法和贝塔的参数吗，如果需要的话应该写什么代码，不需要的话他们的默认值是多少呢

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

CSDN-Ada助手 CSDN-AI 官方账号 2023-04-16 12:16

关注

你可以看下这个问题的回答https://ask.csdn.net/questions/7412132
我还给你找了一篇非常好的博客，你可以看看是否有帮助，链接：主题模型LDA的实现
除此之外, 这篇博客: 《学术小白的学习之路 09》基于困惑度和余弦相似度确定LDA最优主题数中的 1.2、定义困惑度函数 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:

import math
def perplexity(ldamodel, testset, dictionary, size_dictionary, num_topics):
    print('the info of this ldamodel: \n')
    print('num of topics: %s' % num_topics)
    prep = 0.0
    prob_doc_sum = 0.0
    topic_word_list = [] 
    for topic_id in range(num_topics):
        topic_word = ldamodel.show_topic(topic_id, size_dictionary)
        dic = {}
        for word, probability in topic_word:
            dic[word] = probability
        topic_word_list.append(dic)  
    doc_topics_ist = []  
    for doc in testset:
        doc_topics_ist.append(ldamodel.get_document_topics(doc, minimum_probability=0))
    testset_word_num = 0
    for i in range(len(testset)):
        prob_doc = 0.0  # the probablity of the doc
        doc = testset[i]
        doc_word_num = 0  
        for word_id, num in dict(doc).items():
            prob_word = 0.0  
            doc_word_num += num
            word = dictionary[word_id]
            for topic_id in range(num_topics):
                # cal p(w) : p(w) = sumz(p(z)*p(w|z))
                prob_topic = doc_topics_ist[i][topic_id][1]
                prob_topic_word = topic_word_list[topic_id][word]
                prob_word += prob_topic * prob_topic_word
            prob_doc += math.log(prob_word)  # p(d) = sum(log(p(w)))
        prob_doc_sum += prob_doc
        testset_word_num += doc_word_num
    prep = math.exp(-prob_doc_sum / testset_word_num)  # perplexity = exp(-sum(p(d)/sum(Nd))
    print("模型困惑度的值为 : %s" % prep)
    return prep

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

LDA模型中 阿尔法和贝塔如果不设置有默认值吗 python
2023-04-16 10:03

回答 1 已采纳你可以看下这个问题的回答https://ask.csdn.net/questions/7412132我还给你找了一篇非常好的博客，你可以看看是否有帮助，链接：主题模型LDA的实现除此之外, 这篇博客:
LDA模型运行时报错，如何解决？(语言-python) nlp python 有问必答自然语言处理
2022-03-08 09:36

回答 2 已采纳可能是路径中包含中文，在操作文件的过程中会因为中文字符的原因导致无法找到正常的路径，因此会出现 Users\ + xe6…那些报错。
LDA主题模型中文文本输入问题中文分词机器学习
2023-03-01 16:57

回答 2 已采纳是的，在使用LDA主题模型之前，需要将中文文本进行分词，并将分词后的结果转换为列表形式，然后再进行corpora.Dictionary及dictionary.doc2bow等操作。具体来说，需要经过以
用python计算lda语言模型的困惑度并作图
2022-04-19 19:59

用python计算lda语言模型的困惑度并作图
LDA主题模型输入问题 python 机器学习自然语言处理
2023-02-19 01:28

回答 2 已采纳该回答引用ChatGPT LDA主题模型是一种无监督机器学习方法，可以将文本数据集中的每个文档（例如年报）表示为主题的概率分布，同时将每个主题表示为词汇的概率分布。因此，对于上市公司的年报，我们可以
求解：Python主题模型停用词过滤失效 python 中文分词语言模型
2022-09-06 16:46

回答 1 已采纳直接整篇文章替换字符串，不要先分解成单个汉字你用文章里的单个汉字去跟词典进行比较，当然不一致了
python做LDA模型出现问题 python
2023-02-28 10:49

回答 2 已采纳 css样式没有引入，这儿抛错了，无效的css参数，你仔细检查一下，这个css参数对不对
【项目实战】Python实现基于LDA主题模型进行电商产品评论数据情感分析
2022-02-14 22:58

资料说明：包括数据+代码+文档+代码讲解。前言 2.项目背景 3.分析流程 4.数据预处理 5.评论分词 6.情感分析与建立模型 7.实际应用
gensim得到的LDA主题完全一致(语言-python) python 自然语言处理
2023-02-19 17:45

回答 4 已采纳如果您使用gensim训练LDA模型，但得到的所有主题都完全一致且概率都为0.00，可能有以下几个可能的原因：参数设置不当：LDA模型有许多参数需要调整，如主题数量、迭代次数、alpha和beta等
lda主题模型报错return pd.concat python 深度学习
2023-04-08 00:55

回答 1 已采纳看下这篇博客，也许你就懂了，链接：pd.concat()的用法
Python文本挖掘lda模型可视化后出错怎么改？ python 有问必答
2021-06-09 14:56

回答 4 已采纳提示编码格式错误，你改成utf-8试试
中文自然语言处理--基于 LDA 主题模型进行中文文本中的关键词提取
2021-03-10 21:29

糯米君_的博客语料是一个关于汽车的短文本，下面通过 Gensim 库完成基于 LDA 的关键字提取。整个过程的步骤为：文件加载 -> jieba 分词 -> 去停用词 -> 构建词袋模型 -> LDA 模型训练 -> 结果可视化: # -*- coding...
请问LDA的这段代码，为什么不执行也不报错 python 其他有问必答
2021-03-31 09:35

回答 2 已采纳代码只是给出了几个函数，并没有定义类及实例化对象和对函数的调用,当然不会有结果输出。将这些函数写类中：class wordParse: 在最后用,output=wordParse(),outpu
R语言jiebaR中文分词并做LDA主题建模
2018-03-31 16:47

使用R语言中的jiebaR包，对中文文本进行分词，求词频，做词云图并进行LDA主题建模。
LDA主题模型简介及Python实现
2022-01-09 11:07

阿丢是丢心心的博客 LDA主题模型不关心文档中单词的顺序，通常使用词袋特征（bag-of-word feature）来代表文档。词袋模型介绍可以参考这篇文章：文本向量化表示——词袋模型 - 知乎了解LDA模型，我们需要先了解LDA的生成模型，LDA认为...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 4月30日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 4月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月16日

悬赏问题

¥20 BAPI_PR_CHANGE how to add account assignment information for service line
¥500 火焰左右视图、视差（基于双目相机）
¥100 set_link_state
¥15 虚幻5 UE美术毛发渲染
¥15 CVRP 图论物流运输优化
¥15 Tableau online 嵌入ppt失败
¥100 支付宝网页转账系统不识别账号
¥15 基于单片机的靶位控制系统
¥15 真我手机蓝牙传输进度消息被关闭了，怎么打开？(关键词-消息通知)
¥15 装 pytorch 的时候出了好多问题，遇到这种情况怎么处理？

LDA模型中 阿尔法和贝塔如果不设置有默认值吗

1条回答 默认 最新

问题事件

悬赏问题

LDA模型中阿尔法和贝塔如果不设置有默认值吗

1条回答默认最新