qq_43397950 2018-10-12 11:15 采纳率: 0%
浏览 368

用Java做,请问有人能提供一下参考代码吗??实在非常感谢

中文词法分析系统

语料库:1998-01-2003版-带音.txt
要求:根据构建的单词词典和双词词典,**用n-gram模型**,或者前向最长匹配,或者后向最长匹配等算法,鼓励用更复杂一些的方法来进行,包括隐马尔科夫模型和条件随机场模型__

  1. 词词典样式(汉子后的数,代表词频):{( < BOS >27180),(< BOS >19980101-01-001-0011),(19980101-01-001-001迈向1),(迈向充满3),(充满希望13),(希望的20),(的新320),(新世纪45),(世纪——1),(——一九九八年1),(一九九八年新年4),(新年讲话4),(讲话(2),((附288),(附图片288),(图片1206),(1张206),(张)289),()1915),(< EOS >23268),}
  2. 单词词典样式:{< BOS > 23269,19980101-01-001-001 1,迈向 33,充满 115,希望 491,的 54148,新 2334,世纪 418,—— 154,一九九八年 39,新年 320,讲话 233,( 4282,附 289,图片 618,1 591,张 1218,) 4282,< EOS > }
  • 写回答

0条回答

    报告相同问题?

    悬赏问题

    • ¥15 如何在scanpy上做差异基因和通路富集?
    • ¥20 关于#硬件工程#的问题,请各位专家解答!
    • ¥15 关于#matlab#的问题:期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707,使系统具有较小的超调量
    • ¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
    • ¥30 截图中的mathematics程序转换成matlab
    • ¥15 动力学代码报错,维度不匹配
    • ¥15 Power query添加列问题
    • ¥50 Kubernetes&Fission&Eleasticsearch
    • ¥15 報錯:Person is not mapped,如何解決?
    • ¥15 c++头文件不能识别CDialog