要把英文文本分成单句子,之前是以“.”为分隔符来分的,但是文本中有“U.S.”这种缩写,会把缩写也分成句子。请问可以用正则表达式分句来避免这种情况吗?或者有没有其他好方法(不考虑将缩写用其他内容替换掉)
4条回答 默认 最新
- 快乐小土狗 2022-08-06 13:31关注
提供一个思路哈。
你缩写,.号两边都是只有一个字母,而句子.号两边都是一串字母。
那你就可以依次用正则来进行拆分,
re.split(r'(.{2,}?).','asc.sas.assa.a.a')本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报
悬赏问题
- ¥15 51单片机中C语言怎么做到下面类似的功能的函数(相关搜索:c语言)
- ¥15 seatunnel 怎么配置Elasticsearch
- ¥15 PSCAD安装问题 ERROR: Visual Studio 2013, 2015, 2017 or 2019 is not found in the system.
- ¥15 (标签-MATLAB|关键词-多址)
- ¥15 关于#MATLAB#的问题,如何解决?(相关搜索:信噪比,系统容量)
- ¥500 52810做蓝牙接受端
- ¥15 基于PLC的三轴机械手程序
- ¥15 多址通信方式的抗噪声性能和系统容量对比
- ¥15 winform的chart曲线生成时有凸起
- ¥15 msix packaging tool打包问题