进阶小白ing 2022-08-05 18:10 采纳率: 85.7%
浏览 101
已结题

python英文文本分句

要把英文文本分成单句子,之前是以“.”为分隔符来分的,但是文本中有“U.S.”这种缩写,会把缩写也分成句子。请问可以用正则表达式分句来避免这种情况吗?或者有没有其他好方法(不考虑将缩写用其他内容替换掉)

  • 写回答

4条回答 默认 最新

  • 快乐小土狗 2022-08-06 13:31
    关注

    提供一个思路哈。
    你缩写,.号两边都是只有一个字母,而句子.号两边都是一串字母。
    那你就可以依次用正则来进行拆分,
    re.split(r'(.{2,}?).','asc.sas.assa.a.a')

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(3条)

报告相同问题?

问题事件

  • 系统已结题 8月24日
  • 已采纳回答 8月16日
  • 修改了问题 8月5日
  • 创建了问题 8月5日