起名大废废 2021-04-11 09:23 采纳率: 0%
浏览 413

python正则表达式匹配所有有效的python标识符

要匹配所有有效的python标识符,刚开始我就直接用

 pattern = re.compile(r'\b[A-Za-z_]\w*\b')
 line='abc acv_ M abc$'
 re.findall(pattern,line)

可是结果是

['abc', 'acv_', 'M', 'abc']

‘\b’没有其效果吗?

接着我有换了个pattern

pattern = re.compile(r'(?<![^A-Za-z_ ])\b[A-Za-z_]\w*\b(?![^A-Za-z_ ])')
line = 'kdfs !sldkj$ d;slk'
re.findall(pattern,line)

结果是

 ['kdfs']

好像正则表达式没有那么好用啊!

有没有更好的方法呢!

求教大佬。

  • 写回答

3条回答 默认 最新

  • 关注
    import re
    pattern = re.compile(r'(?<![\$!`;])\b[A-Za-z_]\w*\b(?![\$!`;])')
    line='abc+acv_ M 7j !XF abc$'
    a = re.findall(pattern,line)
    print(a)

    主要是\b无法区分哪些特殊字符是标识符中的非法字符,哪些字符是python的运算符。

    与非法字符相连的标识符不是有效的python标识符,

    但与运算符相连的标识符可以是有效的python标识符,

    要用 (?<![\$!`;])和(?![\$!`;]) 来区分标识符前后是不是非法字符

    [\$!`;]中的是非法字符,你可以自行添加

     

     

     

    评论

报告相同问题?

悬赏问题

  • ¥15 安霸cv22 + rtl8211f 千兆,udp传输丢包
  • ¥15 关于区块链和边缘环境搭建的相关问题
  • ¥15 windows远程桌面断卡重连软件卡顿问题
  • ¥30 Unity 实现扫描效果
  • ¥15 HbuilderX检测不到安卓模拟器
  • ¥15 这个main已经在filename.obj中定义是什么错 C语言
  • ¥15 关于#linux#的问题:exsi8.0系统 怎么更改web访问端口,不用80、443
  • ¥15 使用elementor设计样式
  • ¥15 谁能提供一个中文版的推销咨询网站连接?
  • ¥15 springboot项目程序启动报错