进阶小白ing 2022-07-23 23:59 采纳率: 85.7%
浏览 48
已结题

用python将英文短文拆分成句子

想用split()来将英文文章分成句子,但是文章中缩写(如U.S)的“.”会影响句子的切分。
请问有什么方法可以避免缩写中符号的干扰吗?有尝试用nltk包,但是跑不通。有什么方法可以在split()的基础上对代码进行更改吗?

  • 写回答

1条回答 默认 最新

  • 请叫我问哥 Python领域新星创作者 2022-07-24 00:59
    关注

    你看看句子之间除了句号(.)以外,是不是还有一个空格或换行。如果是的话,就根据组合来拆分,比如 split('. ') 或 split('.\n')
    如果还是不行的话,缩写的特征一般都是一个字母加一个点,可以先用正则式找出所以缩写,把缩写之间的点依次替换成其他符号,然后再split

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 8月1日
  • 已采纳回答 7月24日
  • 创建了问题 7月23日

悬赏问题

  • ¥15 Vue3 大型图片数据拖动排序
  • ¥15 划分vlan后不通了
  • ¥15 GDI处理通道视频时总是带有白色锯齿
  • ¥20 用雷电模拟器安装百达屋apk一直闪退
  • ¥15 算能科技20240506咨询(拒绝大模型回答)
  • ¥15 自适应 AR 模型 参数估计Matlab程序
  • ¥100 角动量包络面如何用MATLAB绘制
  • ¥15 merge函数占用内存过大
  • ¥15 使用EMD去噪处理RML2016数据集时候的原理
  • ¥15 神经网络预测均方误差很小 但是图像上看着差别太大