请教java自带的正则表达式问题

[size=large]需要匹配的字符串是：[/size]
##$a7a-5064-2460-6$b精装$dCNY26.00$z7-313-1037-0

[size=large]具体要求是：[/size]
1、前两位是两个##、两个数字或者一个#，一个数字。
2、后面的每组字符串都是以$符号开头，$后面是字符、数字下划线、汉字组成的字符串。
3、$a、$b、$d的字符串不可重复，出现次数是0或1次；
$z可重复，出现次数不做限制。
4、$a、$b、$d没有顺序限制。

[size=large] 我写出的正则表达式：[/size]
(^[#0-9]{2})([$a]{2}[\w\d-]+)?([$b]{2}[color=blue].*[/color])?([$d]{2}.*)?([$z]{2}[\w\d-]+)?

[size=large]匹配中出现的问题：[/size]
     1、由于上述表达式中蓝色字体的.*能够匹配任意字符，所以如果不写对$d、$z字符串的正则表达式\([$d]{2}.*\)?\([$z]{2}[\\w\\d-]+\)? 也能够匹配到$d、$z的字符串。
     2、正则表达式匹配的时候是按照顺序来匹配的。也就是说在正则表达式中$a在$b的前面，如果匹配字符串中没有$a字符串组或者$a字符串组在$b、$d的后面的话，就不能够匹配成功了。针对这个问题我想到的办法是用正则表达式中的“或  |”来组合条件，但是考虑到匹配字符串中以$开头的字符串组比较多，感觉行不通。

 [size=large]实现中遇到的难点：[/size]
     1、针对由于.*能够匹配任意字符，造成正则表达式中从$d开始，如果不写的话也能够匹配的“$d”和“$z”字符串。应该如何界定$b的结束，从而可以判断出下一组$开头的字符串的开始？
    2、如何能够不限定“$a、$b、$d、$z”这些字符串组的顺序，只判断是否在字符串中出现及出现次数？
     3、java自带的正则表达式中除了“.”可以匹配汉字之外，还有什么方法能够匹配汉字？

[b][color=red][size=medium] 急用，请各位指点。[/size][/color][/b]

[b]问题补充：[/b]
首先谢谢 congjl2002 (高级程序员) 对我提出问题的解答。对于您的疑问我在将我的问题补充一下。

首先说明一下上述需要匹配的字符串：
上述字符串对应一个字段号码，每个字段号码对应的字段内容是由多个子字段组成（子字段即：$a7a-5064-2460-6 或者 $dCNY26.00）。$a、$b是子字段标识符。
1、每条字段内容中，子字段标识符（即$a、$b）不定，$a开始到下个$结束是子字段$a对应的子字段内容。具体每条字段中的子字段标识符有哪些，需求中已提供。
2、$后面的内容字母、数字、下划线、“-”、“.”和汉字都有可能出现。例如下面的字段内容中：
1#$20030113d2003####em#y0实用客户英语$b专著$dD634.31-61$9zhao qing tian$f(清)何道生撰$z199?-2001
[b]问题补充：[/b]
我现在想用正则表达式是想两种功能：
1、正向验证。即页面中输入需要匹配的子字段内容后，使用正则表达式验证是否正确。正确将各个子字段合成一个字段内容。
2、逆向解析。即拿到整条字段内容或者多条字段内容时，使用正则表达式验证是否正确。包括该字段中子字段的标识符（即$a $b $d $z）是否正确，及它们的重复性是否正确。
[b]问题补充：[/b]
congjl2002 (高级程序员) 你给我提供的正则表达式是用于javascript中的正则表达式对吧？验证没有问题
刚刚想到一个问题，由于javascript的正则表达式和java自带的正则表达式有些语法稍微有些区别，因此我们可能要写两套正则表达式。javascript中的正则表达式用于正向的验证，java自带的正则表达式用于逆向的解析。java自带的正则表达式逆向解析时主要是有大量数据，也就是多条字段内容时，验证其中一整条字段内容会方便一些。但是现在想一下感觉后台如果自己来写解析的方法，比用正则表达式解析会更方便。这个想法正在商讨中。
我现在还在尝试用java自带的正则表达式来解析字段内容。对于实现中遇到的难点中的第3条现在仍然是难点。如果正则表达式中用([$b]{2}.*)? .* 来匹配出现汉字的情况的话，当用([$b]{2}.*)? 来匹配整条字段内容的时候，会将$b开始直到最后所有的字符串都匹配上。不想javascript中可以用\w来匹配汉字，不至于把所有字符匹配上。
郁闷啊！！！！！！！
请问有什么方法能够在java自带的正则表达式中准确的匹配出汉字吗？
请指点迷津！
[b]问题补充：[/b]

congjl2002 (高级程序员)

之前没有弄清楚正则表达式在不同的语言之间是否有区别。造成这样的原因是，在开始学习的时候，将教程中的例子在RegexTester 工具中测试正确，放到类中间加上了转义字符结果有时也会有区别；再就是jdk API中提供的java.util.regex.Pattern类中对\w能够匹配字符的说明是   单词字符：[a-zA-Z_0-9]  和你推荐的那篇文章中的说明有所出入（这几天学习正则表达式看的资料就是你提供的那篇文章）。文章中\w 能够匹配的字符是  字母或数字或下划线或汉字    。所以感觉他们之间是有所不同的。

[b]问题补充：[/b]
congjl2002 (高级程序员) 你好

你给我提供的正则表达式 我试过了，在RegexTester工具中测试是好的。但是在java中验证不通过。下面是我写的程序。方便的话测试一下。

public static void main(String[] args) {
String regex = "(^[#0-9]{2})([$a]{2}[\w\d-]+(?!$)?)+([$b]{2}(.?){10}(?!$)?)?([$d]{2}[\w.]*(?!$)?)?([$z]{2}[\w\d-]+(?!$)?)?$";
String matcher = "##$a7a-5064-2460-6$b精装$dCNY26.00$z7-313-1037-0";
find(regex,matcher);

}

/**
 * find 方法扫描输入序列以查找与该模式匹配的下一个子序列。
 * 
 * 通过m.find()方法，是按照指定模式与整条字符串进行匹配的 m.groupCount()可以获取指定模式中的分组数 m.group() ==
 * m.group(0) 即匹配成功的整条字符串
 * 
 * @param p
 * @param m
 */
public static List<String> find(String regex, String matcher) {
    List<String> list = new ArrayList<String>();
    Pattern p = Pattern.compile(regex);// Pattern(模式类);Pattern类是用来表达和陈述所要搜索模式的对象
    Matcher m = p.matcher(matcher);
    boolean finded = m.find();
    StringBuffer sb = new StringBuffer(); // 该对象用于存储匹配出的字符串，用于下面判断匹配出的内容是否是子字段（即是否包含$）

    while (finded) {
        for (int i = 0; i <= m.groupCount(); i++) {
            // 匹配出的第一个结果是整个字符串
            if (i == 0)
                continue;
            sb.append(m.group(i));
            // 匹配出的是指示符 ## 或者 #数字 或者 数字#
            if (i == 1 && m.group(i) != null){
                list.add(m.group(i));
                continue;
            }
            // 判断匹配出的字符串是否是子字段内容,即是否包含$
            if (i != 0 && sb.toString().indexOf("$") == -1)
                continue;
            sb.delete(0, sb.toString().length());

            if(m.group(i) == null) continue;
            list.add(m.group(i));
        }
        finded = m.find();
    }

    for (int i = 0; i < list.size(); i++) {
        System.out.println(i + " " + list.get(i));
    }
    return list;
}

如果把String regex = "^[\#0-9]{2}(\$[abdz][\w-.]*(?!$)?)+$";

运行程序匹配不出任何东西了。帮忙看看！

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
congjl2002 2008-07-10 14:46
关注
[color=red]String regex = "^[\#0-9]{2}(\$[abdz][\w-.]*(?!$)?)+$"; [/color]这个确实应该匹配不出东西，因为你要的是判断整个字符串是否符合规定，并不是要查找，匹配出每个$a这样的组合，所以那个做的就是判断整个字符串是否符合，只要有一组不符合，就什么都查不出来，你值保留[color=red]##$a7a-5064-2460-6[/color]是可以查出来的，因为后面你的代码里还有其他字符,如果jdk里是匹配字母的话，那就把[color=red]\w[/color]改成[color=red][\p{InCJK Unified Ideographs}&&\P{Cn}][/color]吧
参考一下这个帖子
[url]http://topic.csdn.net/u/20080629/00/2f669f44-6e30-4e2e-9cce-08889dba2ae2.html[/url]

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

正则表达式 算法
2017-01-06 14:46

ManLikeTheWind的博客昨天，我的朋友请教我正则表达式。我也好久没有写过正则表达式了，昨天刚好看了下如鹏网创始人杨中科老师关于正则表达式的讲解。使我加深了正则表达式的印像。现我把他总结下：许多语言，包括Perl、PHP、Python...
正则表达式系列（一）
2021-09-20 16:15

ljjliujunjie123的博客再之后多次遇到使用的机会，却苦于不会遗憾收场（有好几次被妹子请教，然后不会...）有很多大佬程序员不屑于正则，随口就是说，“正则不是30分钟随便看看就会了吗？！”，每次听到都对我脆弱的心灵造成难言的伤害...
Python正则表达式指南
2013-11-11 11:31

joakimzhang的博客转自http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html AstralWind ...Python正则表达式指南 ...本文介绍了Python对于正则表达式的支持，包括正则表达式基础以及Python正则表达式标
python正则表达式
2010-11-02 11:28

weixin_33901926的博客 正则表达式是用于处理字符串的强大工具，拥有自己独特的语法以及一个独立的处理引擎，效率上可能不如str自带的方法，但功能十分强大。得益于这一点，在提供了正则表达式的语言里，正则表达式的语法都是一样的，区别...
java知识点汇总
2021-09-15 15:26

Gxbalunn的博客文章目录面试前的工作礼貌常识公司及岗位了解自我介绍充足的知识储备提问环节面试后的总结javaSEjdk1.8新特性java语言的特征如何实现跨平台谈谈你对面向对象的认识理解聊聊面向对象的特征,封装,继承,多态访问权限...
java统一复习
2020-11-03 17:37

&曙光&的博客十二、 Ajax总结三、 Java多态的具体体现４四、 StringBuffer StringBuilder String 区别５五、 Hashtable与HashMap的区别５六、九大隐式对象６七、 Forword(请求转发)与Redirect(重定向) ６八、...
java迭代法求圆周率用梯形_java第二阶段作业总结
2020-12-19 23:16

weixin_39914825的博客第一次作业包含三道题目，第一道题目考查了使用java中的字符串处理类以及正则表达式对输入的字符串数据进行合法性校验及计算，第二道题目考查了使用蒙特卡洛仿真方法求圆周率，第三道题目考查的使用java中的继承来求...
java面试（葵花宝典）
2018-11-03 12:00

搬运工9527的博客 1.（1-20面向对象）基础部分的顺序：基本语法；类相关的语法；内部类的语法；继承相关的语法；异常的语法；线程的语法；集合的语法；io的语法；...java中的保留字，现在没有在java中使用。 3、...
Java超强面试题
2019-08-19 10:14

下雨天__不打伞的博客 Java程序员面试题集（1-50）一、Java基础部分 1、面向对象的特征有哪些方面? 答：面向对象的特征主要有以下几个方面： 1)抽象：抽象是将一类对象的共同特征总结出来构造类的过程，包括数据抽象和行为抽象两方面。...
Java面试整理 -码之狼
2019-11-15 11:24

码之狼的博客 _面试概念整理以及项目逻辑分享注意：( 所有的概念都是...三、 Java多态的具体体现四、 StringBuffer StringBuilder String 区别五、 Hashtable与HashMap的区别六、九大隐式对象七、 Forword(请求转发)与Re...
没有解决我的问题, 去提问

请教java自带的正则表达式问题

4条回答 默认 最新

4条回答默认最新