weixin_39551993
weixin_39551993
2021-01-12 15:27

「只」的轉換問題

可能由於 OpenCC 的工作原理的原因(沒有分詞機制),在文本轉換中會大量的「只」字會被錯誤地轉換成「隻」,如下例: 「可是只有他才能完成这个任务」會被轉換成「可是隻有他才能完成這個任務」 類似的情況非常多,是由於「是只」→「是隻」、「有只」→「有隻」等轉換詞導致的,希望能考慮一下如何解決這類問題。

该提问来源于开源项目:BYVoid/OpenCC

  • 点赞
  • 写回答
  • 关注问题
  • 收藏
  • 复制链接分享
  • 邀请回答

5条回答

  • weixin_39600291 weixin_39600291 4月前

    之前我使用的时候也遇到类似的问题,当时是有一个 「宏」->「巨集」 的台湾用法,于是「李彦宏」就有了被翻译成「李彥巨集」的尴尬。

    点赞 评论 复制链接分享
  • weixin_39569543 weixin_39569543 4月前

    See: https://github.com/BYVoid/OpenCC/issues/224#issuecomment-283668276

    点赞 评论 复制链接分享
  • weixin_39551993 weixin_39551993 4月前

    那這個會不會跟#224重複了?

    点赞 评论 复制链接分享
  • weixin_39569543 weixin_39569543 4月前

    試著先切再丟給 opencc 吧,你也可以分享一下做法、效果。

    点赞 评论 复制链接分享
  • weixin_39881760 weixin_39881760 4月前

    也許實現內建類似以下可以忽略特定字詞的功能的話也不錯

    https://github.com/compulim/node-opencc/pull/8

    点赞 评论 复制链接分享