manticc 2022-01-11 09:51 采纳率: 50%
浏览 12

如何把分词信息给组合

最近使用讯飞转写功能,发现他的粤语分词效果太差了,经常会出现一个字当做一个词,然后返回了一个时间戳的情况。
我已经和讯飞的客服反馈这个情况了,他们说后续会有升级
但是 我最近用,所以就是用jieba 分词了一下整句, 发现效果还不错,但是肯定没有时间戳信息返回了。
所以想请问下各位,分词时间戳该怎么得到
上面是jieba结果,下面是讯飞的结果。
我自己初步的想法是根据jieba的词然后 按照字来一一匹配,使用第一个字的时间戳和最后一个字的时间戳,这样就可以得到整句话的时间戳了。

img

  • 写回答

1条回答 默认 最新

  • YirongChen 2022-01-12 02:29
    关注

    如果jieba能满足你的分词需求,我觉得实现你的初步想法就可以了。

    评论

报告相同问题?

问题事件

  • 创建了问题 1月11日

悬赏问题

  • ¥20 gitlab 中文路径,无法下载
  • ¥15 用动态规划算法均分纸牌
  • ¥30 udp socket,bind 0.0.0.0 ,如何自动选取用户访问的服务器IP来回复数据
  • ¥15 关于树的路径求解问题
  • ¥15 yolo在训练时候出现File "D:\yolo\yolov5-7.0\train.py"line 638,in <module>
  • ¥30 戴尔inspiron独显直连
  • ¥15 进行一项代码设计遇到问题
  • ¥15 Mutisim中关于74LS192N计数器芯片设计(计数器)
  • ¥50 fastadmin后台无法删除文件
  • ¥15 oracle查询Socket read timed out错误