太白山美雪 2021-05-14 22:40 采纳率: 0%
浏览 185

如何用正则表达式匹配英文文章中的英文单词?谢谢^_^

### 题目描述
需求:Java写一个程序,汇总文章中每个英文单词的个数。判断一个单词时,需要考虑前后的空格,换行字符以及连接”-”符号,连接符会将一个词组成一个整体,用正则表达式实现,具体规则如下:
1. 以下当作一个词: 
don't, doesn't, didn't, can't, couldn't, wouldn't, isn't, aren't, wasn't, weren't     
2. 以下当作一个词处理: 
he's, she's, I'm, you're, we're, they're    
3. 以下不计入统计,删除
Shawn's, apple's, Jonas’, what's, 'twas
4. ice-cream    如果不在行尾换行时,当作一个词,但是不能删掉中间连接符

### 题目来源及自己的思路
看了一些资料,写了一个初稿,
(?:she's|he's|they're|we're|you're|I'm|It's)|(?:isn't|aren't|doesn't|don't|didn't|haven't|hadn't|hasn't|can't|couldn't|wasn't|weren't|wouldn't )

测试字符串为:
She's"1.tom:'what's your name.'  Jame's Janes', didn't, character,wasn't,
ice-cream, 

### 相关代码
(?:she's|he's|they're|we're|you're|I'm|It's)|(?:isn't|aren't|doesn't|don't|didn't|haven't|hadn't|hasn't|can't|couldn't|wasn't|weren't|wouldn't )

### 你期待的结果是什么?实际看到的错误信息又是什么?
但是不能正确判断单词、连接符和换行符。

谢谢老司机领路!帮我设计这个正则表达式 ^_^

  • 写回答

2条回答 默认 最新

  • CSDN专家-sinJack 2021-05-14 22:56
    关注

    你说的这些,都感觉没啥规律。你给个测试和预期结果吧

    评论

报告相同问题?

悬赏问题

  • ¥15 系统 24h2 专业工作站版,浏览文件夹的图库,视频,图片之类的怎样删除?
  • ¥15 怎么把512还原为520格式
  • ¥15 MATLAB的动态模态分解出现错误,以CFX非定常模拟结果为快照
  • ¥15 求高通平台Softsim调试经验
  • ¥15 canal如何实现将mysql多张表(月表)采集入库到目标表中(一张表)?
  • ¥15 wpf ScrollViewer实现冻结左侧宽度w范围内的视图
  • ¥15 栅极驱动低侧烧毁MOSFET
  • ¥30 写segy数据时出错3
  • ¥100 linux下qt运行QCefView demo报错
  • ¥50 F1C100S下的红外解码IR_RX驱动问题