『六道』 2022-11-24 02:00 采纳率: 0%
浏览 2

如何进行海量文本词频统计

有百万级别篇文章需要进行分词然后统计词频,除了Python有没有,现有的简单工具可以快速搞定。

  • 写回答

1条回答 默认 最新

  • 爱晚乏客游 2022-11-24 09:19
    关注

    excel好像可以,此外就是一些第三方做好的软件之类的,不过这个数据量,我也不知道第三方让不让你白嫖的问题,建议去找找开源项目看下。
    不过除了python外,其他的你得实现分词,如果你是分好词语的话,其他语言都可以,类似java,cpp,没分词的话最好还是python,不然你的自己实现分词,重复造轮子还不一定有python好用。

    评论

报告相同问题?

问题事件

  • 创建了问题 11月24日