dabocaiqq
2020-05-04 15:13
采纳率: 66.6%
浏览 231

Java语言高分悬赏:用正则表达式怎么样将一段小说文本中所有的人名全部提取出来呢?

Java语言高分悬赏:用正则表达式怎么样将一段小说文本中所有的人名全部提取出来呢?

  • 点赞
  • 写回答
  • 关注问题
  • 收藏
  • 邀请回答

1条回答 默认 最新

  • 毕小宝 2020-05-04 17:06
    已采纳

    这里的核心就是写一个匹配汉字的正则:

    public static void regxChinese(){  
           // 要匹配的字符串     
           String source = "<span title='5 星级酒店' class='dx dx5'>";  
           // 将上面要匹配的字符串转换成小写     
          // source = source.toLowerCase();     
           // www.111cn.net 匹配的字符串的正则表达式     
           String reg_charset = "<span[^>]*?title='([0-9]*[\s|\S]*[u4E00-u9FA5]*)'[\s|\S]
    *class='[a-z]*[\s|\S]*[a-z]*[0-9]*'";       
    
           Pattern p = Pattern.compile(reg_charset);     
           Matcher m = p.matcher(source);     
           while (m.find()) {     
            System.out.println(m.group(1));  
           }  
    } 
    
    点赞 评论

相关推荐 更多相似问题