Java语言高分悬赏:用正则表达式怎么样将一段小说文本中所有的人名全部提取出来呢?
1条回答 默认 最新
关注
这里的核心就是写一个匹配汉字的正则:
public static void regxChinese(){ // 要匹配的字符串 String source = "<span title='5 星级酒店' class='dx dx5'>"; // 将上面要匹配的字符串转换成小写 // source = source.toLowerCase(); // www.111cn.net 匹配的字符串的正则表达式 String reg_charset = "<span[^>]*?title='([0-9]*[\s|\S]*[u4E00-u9FA5]*)'[\s|\S] *class='[a-z]*[\s|\S]*[a-z]*[0-9]*'"; Pattern p = Pattern.compile(reg_charset); Matcher m = p.matcher(source); while (m.find()) { System.out.println(m.group(1)); } }
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决评论 打赏 举报无用 1