shmeteor
2017-11-09 12:47
采纳率: 0%
浏览 8.7k

正则表达式 取第n个匹配到的数据

我有一个字符串

 PID|1||PATID1234^5^M11^ADT1^MR^MCM~123456789^^^USSSA^SS|\||JONES^WILLIAM^A^III\\\\\|||19610615|M||C|1200 N ELMSTREET^^GREENSBORO^NC^27401-1020|GL|(919)379-1212|(919)271-3434||S||PATID 12345001^2^M10^ADT1^AN^A|123456789|987654^NC|

现在想取第n个通道符(|)到第(n+1)个通道符之间的内容,能不能仅通过正则表达式一步得出?其中反斜杠表示转义,即反斜杠+通道符仅仅是一个特殊字符,不能看作一个通道符。
我打算取第五个数据,所以写了这样一个正则:

 (?<=PID\|)(.*?[^\\]?\|){4}(.*?)[^\\](?=\|)

但是得到了这样一个结果:
图片说明
所以顺便想问一下有没有办法把一些匹配到的子串隐藏,就是不在返回结果里。
谢谢!

  • 写回答
  • 好问题 提建议
  • 关注问题
  • 收藏
  • 邀请回答

3条回答 默认 最新

  • devmiao 2017-11-09 12:47

    零宽度断言。排除前4个。

    评论
    解决 无用
    打赏 举报
  • Yirujet 2017-11-14 03:32

    如图:这部分是转义符号还是通道符号呢?图片说明

    评论
    解决 无用
    打赏 举报
  • Yirujet 2017-11-14 05:20

    楼主,如下正则符合您的要求,这个正则要求支持回溯并且不会匹配到通道之间为空的内容。
    如果如下图中圈出部分是转义字符的话,就应用这个正则:(?<=|)[^|]*?(?:\|)*[^|]*(?<!\)(?=|)
    https://img-ask.csdn.net/upload/201711/14/1510630364_805524.png
    匹配截图:
    图片说明
    如果圈出部分并不是一个转义字符,而是一个通道的话,就用这个:
    (?<=|)[^|]*?(?:\|)*[^|]*(?=|)
    匹配截图:
    图片说明

    评论
    解决 无用
    打赏 举报

相关推荐 更多相似问题