weixin_46712513 2023-04-25 15:15 采纳率: 33.3%
浏览 37
已结题

LDA某主题词下每个词的概率

sklearn-LDA做主题分析,可以做出每个topic下面有若干关键词,怎么确定这些词语的权重呢?权重计算出来在哪里显示,可以导出来么?(或者说可以计算出每个关键词出现的概率么?)

img

  • 写回答

2条回答 默认 最新

  • 肩匣与橘 游戏开发领域新星创作者 2023-04-25 15:52
    关注

    获取LDA模型,并获取每个主题下的前n个关键词

    import numpy as np
    import pandas as pd
    from sklearn.decomposition import LatentDirichletAllocation
    # 假设已经得到了LDA模型lda_model
    # 获取每个主题下的前n个关键词
    def get_top_words(model, feature_names, n_top_words):
        topic_words = []
        for topic_idx, topic in enumerate(model.components_):
            top_features_ind = topic.argsort()[:-n_top_words - 1:-1]
            topic_words.append([feature_names[i] for i in top_features_ind])
        return topic_words
      
    # 获取每个主题下的前10个关键词
    n_top_words = 10
    feature_names = np.array(vectorizer.get_feature_names())
    topic_words = get_top_words(lda_model, feature_names, n_top_words)
    
    

    获取每个topic下每个词的权重

    # 获取每个主题下每个词的权重
    def get_topic_word_weights(model, feature_names):
        topic_word_weights = []
        for topic_idx, topic in enumerate(model.components_):
            word_weights = []
            for word_idx, weight in enumerate(topic):
                word = feature_names[word_idx]
                word_weights.append((word, weight))
            topic_word_weights.append(word_weights)
        return topic_word_weights
    topic_word_weights = get_topic_word_weights(lda_model, feature_names)
    
    

    以上两种方法都可以得到每个topic下面的关键词,第一种方法可以得到每个关键词的排名,第二种方法可以得到每个关键词的权重。根据需求可以选择不同的方法。
    From:肩匣与橘&GPT

    评论

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 4月25日
  • 修改了问题 4月25日
  • 修改了问题 4月25日
  • 创建了问题 4月25日

悬赏问题

  • ¥15 Windows Script Host 无法找到脚本文件"C:\ProgramData\Player800\Cotrl.vbs”
  • ¥15 matlab自定义损失函数
  • ¥15 35114 SVAC视频验签的问题
  • ¥15 impedancepy
  • ¥15 求往届大挑得奖作品(ppt…)
  • ¥15 如何在vue.config.js中读取到public文件夹下window.APP_CONFIG.API_BASE_URL的值
  • ¥50 浦育平台scratch图形化编程
  • ¥20 求这个的原理图 只要原理图
  • ¥15 vue2项目中,如何配置环境,可以在打完包之后修改请求的服务器地址
  • ¥20 微信的店铺小程序如何修改背景图