qq_43397950 2018-10-12 11:15 采纳率: 0%
浏览 368

用Java做,请问有人能提供一下参考代码吗??实在非常感谢

中文词法分析系统

语料库:1998-01-2003版-带音.txt
要求:根据构建的单词词典和双词词典,**用n-gram模型**,或者前向最长匹配,或者后向最长匹配等算法,鼓励用更复杂一些的方法来进行,包括隐马尔科夫模型和条件随机场模型__

  1. 词词典样式(汉子后的数,代表词频):{( < BOS >27180),(< BOS >19980101-01-001-0011),(19980101-01-001-001迈向1),(迈向充满3),(充满希望13),(希望的20),(的新320),(新世纪45),(世纪——1),(——一九九八年1),(一九九八年新年4),(新年讲话4),(讲话(2),((附288),(附图片288),(图片1206),(1张206),(张)289),()1915),(< EOS >23268),}
  2. 单词词典样式:{< BOS > 23269,19980101-01-001-001 1,迈向 33,充满 115,希望 491,的 54148,新 2334,世纪 418,—— 154,一九九八年 39,新年 320,讲话 233,( 4282,附 289,图片 618,1 591,张 1218,) 4282,< EOS > }
  • 写回答

0条回答 默认 最新

    报告相同问题?

    悬赏问题

    • ¥15 Arcgis相交分析无法绘制一个或多个图形
    • ¥15 seatunnel-web使用SQL组件时候后台报错,无法找到表格
    • ¥15 fpga自动售货机数码管(相关搜索:数字时钟)
    • ¥15 用前端向数据库插入数据,通过debug发现数据能走到后端,但是放行之后就会提示错误
    • ¥30 3天&7天&&15天&销量如何统计同一行
    • ¥30 帮我写一段可以读取LD2450数据并计算距离的Arduino代码
    • ¥15 飞机曲面部件如机翼,壁板等具体的孔位模型
    • ¥15 vs2019中数据导出问题
    • ¥20 云服务Linux系统TCP-MSS值修改?
    • ¥20 关于#单片机#的问题:项目:使用模拟iic与ov2640通讯环境:F407问题:读取的ID号总是0xff,自己调了调发现在读从机数据时,SDA线上并未有信号变化(语言-c语言)