暗夜苍茫_99 2021-03-16 16:53 采纳率: 0%
浏览 26

运行LDA报错,memoryerror

运行lda时报错memoryerror:不能为XXX分配XX G 空间。我的数据大概几万到几十万条,100MB以内,想问下大家运行大规模数量的lda时怎么解决这个问题?

  • 写回答

1条回答 默认 最新

  • 梦幻编织者 2023-06-09 11:11
    关注

    降低模型的复杂度,比如减少主题数、减少词汇量等。

    使用更高配置的机器,比如增加内存大小、使用GPU等。

    利用分布式计算框架,比如Spark、Hadoop等,将模型分散在多台机器上运行,以减轻单台机器的内存压力。

    采用增量式训练的方式,将数据分批次进行训练,以减少一次性加载所有数据所需的内存。

    评论

报告相同问题?