要把英文文本分成单句子,之前是以“.”为分隔符来分的,但是文本中有“U.S.”这种缩写,会把缩写也分成句子。请问可以用正则表达式分句来避免这种情况吗?或者有没有其他好方法(不考虑将缩写用其他内容替换掉)
4条回答 默认 最新
- 快乐小土狗 2022-08-06 13:31关注
提供一个思路哈。
你缩写,.号两边都是只有一个字母,而句子.号两边都是一串字母。
那你就可以依次用正则来进行拆分,
re.split(r'(.{2,}?).','asc.sas.assa.a.a')本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报
悬赏问题
- ¥15 如何在scanpy上做差异基因和通路富集?
- ¥20 关于#硬件工程#的问题,请各位专家解答!
- ¥15 关于#matlab#的问题:期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707,使系统具有较小的超调量
- ¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
- ¥30 截图中的mathematics程序转换成matlab
- ¥15 动力学代码报错,维度不匹配
- ¥15 Power query添加列问题
- ¥50 Kubernetes&Fission&Eleasticsearch
- ¥15 報錯:Person is not mapped,如何解決?
- ¥15 c++头文件不能识别CDialog