aweii18 2019-02-24 22:54 采纳率: 0%
浏览 1290

词频统计小程序(世界各国语言通用)

如题,是否有可以统计日语、西班牙语、葡萄牙语、阿拉伯语、法语等世界各国语言的词频统计小程序/应用推荐;词频统计时首先是分词,然后是计次;因此理想中的词频统计工具可以实现:
1、自由配置/定义词频统计所用语种词库;并且不同语种的词库可以存放为一个个TXT文档
2、词频统计输入文档也能以TXT形式提交
3、词汇间类似于汉语和日语可能需要分词,亦或直接匹配所用词库文档中的词汇进行计次
4、结果以TXT文档导出,左边为词汇,右边为频次,中间以空格隔开
初次在C站提问,如有表述问题,望不吝指出。

  • 写回答

1条回答 默认 最新

  • threenewbee 2019-02-24 23:50
    关注

    不懂阿拉伯语,日语和汉语一样需要分词,但是拉丁语、法语、英语有空格,不需要分词。
    你可以主程序写好统计、语言检测,而针对不同语言的分词作为插件。

    评论

报告相同问题?

悬赏问题

  • ¥15 深度学习根据CNN网络模型,搭建BP模型并训练MNIST数据集
  • ¥15 lammps拉伸应力应变曲线分析
  • ¥15 C++ 头文件/宏冲突问题解决
  • ¥15 用comsol模拟大气湍流通过底部加热(温度不同)的腔体
  • ¥50 安卓adb backup备份子用户应用数据失败
  • ¥20 有人能用聚类分析帮我分析一下文本内容嘛
  • ¥15 请问Lammps做复合材料拉伸模拟,应力应变曲线问题
  • ¥30 python代码,帮调试,帮帮忙吧
  • ¥15 #MATLAB仿真#车辆换道路径规划
  • ¥15 java 操作 elasticsearch 8.1 实现 索引的重建