对大型正则表达式使用延迟评估（而不仅仅是。*？）

Using the follow regex:

\[\w* \w* \d{2} [\w:]* \d{4}\] \[error\] \[client .*?\] .*? Using HTTP not .*?<br />

I get the following results (where yellow boxes indicate a match):

Sublime Text 2

Raw Text: http://pastebin.com/vSi0mLGv

The bottom two sections are correct. I want all sections that contain: <<<NOTICE>>> Non-Prod Server: Using HTTP not HTTP/S

The top section however, contains the correct string (similar to the bottom two), but also comes with a whole other chunk that I do not want:

[Thu May 10 17:43:48 2012] [error] [client ::1] Current Name:
DashboardBar_projAnnualReview200, referer: http://
localhost/test/pages/TestPage.php<br />`

I know this comes down to regex being greedy, but how can I go about making it do a lazy evaluation for the <br />, if that's even the right way to go about it. I've tried (<br />)*? and others to no avail.

Other Information: I am using Sublime Text 2, and performing a regex search if anyone wanted to recreate the image.

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
duanqu9279 2012-05-11 03:36
关注
Greediness is not the problem, eagerness is. The regex engine starts trying to match at the earliest opportunity, and it doesn't give up until every possibility has been exhausted. Making quantifiers non-greedy doesn't change that, it just changes the order in which the possibilities are tried.

It's not the * in .* that's causing your problem, it's the .. You need to use something more restrictive, because it's allowing the match to start too early. This regex works as desired because I've replaced the .*? with [^][]*, which matches any characters except ] or [:

\[\w* \w* \d{2} [\w:]* \d{4}\] \[error\] \[client [^][]*\] [^][]* Using HTTP not .*?<br />

I don't know what regex flavor SublimeText uses, so you may need to escape the square brackets inside the character class:

\[\w* \w* \d{2} [\w:]* \d{4}\] \[error\] \[client [^\]\[]*\] [^\]\[]* Using HTTP not .*?<br />
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

基于PHP的网站收录查询工具php版.zip
2023-08-28 23:41

6. **API调用限制**：搜索引擎通常对API调用有频率限制，工具可能需要实现延迟机制或使用API密钥进行身份验证。 7. **缓存策略**：为了提高性能和减少对搜索引擎API的依赖，可以使用PHP的缓存机制（如APC、Redis或...
基于PHP的美图爬虫天宇版.zip
2023-08-26 21:59

4. **辅助工具**：如正则表达式文件、数据库连接配置、图片处理库等，帮助爬虫更好地工作。 5. **结果文件**：保存抓取到的图片，可能会按照一定的规则命名和分类。在实际应用中，一个PHP爬虫项目可能还会涉及以下...
nginx 正则结尾配置_了解Nginx
2020-12-03 11:03

姝零的博客微服务、Spring，MyBatis，Netty源码分析的朋友可以加我的Java高级交流：854630135，群里有阿里大牛直播讲解技术，以及Java大型互联网技术的视频免费分享给大家。# 安装C++编译器yum -y install gcc-c++# 下载并安装...
PHP错误日志没人看？用这4步打造主动式告警系统，故障提前15分钟发现
2026-01-04 13:32

codetrick的博客快速实现PHP错误日志的主动监控与告警响应，通过日志采集、服务监控、告警配置与自动化通知四步闭环，精准捕捉异常，故障提前15分钟发现。适用于高并发、微服务等复杂场景，运维效率提升利器，值得收藏。
2024年山东省职业院校技能大赛信息安全管理与评估-理论题答案
2024-12-10 15:43

旺仔Sec的博客需要二三阶段解析环境可联系我（微信方式在文章最下方）应急事件响应和恢复措施的主要目标是最小化事件对业务和系统造成的影响，尽快恢复正常运行状态。保证信息安全是整体的安全目标之一，但不是应急响应和恢复措施...
2024年山东省职业院校技能大赛高职组信息安全管理与评估任务书
2024-12-07 11:45

旺仔Sec的博客本次大赛，各位选手需要完成三个阶段的任务，每个阶段需要按裁判组专门提供的U盘中的“信息安全管理与评估竞赛答题卡-模块X”提交答案。选手首先需要在U盘的根目录下建立一个名为“GWxx”的文件夹(xx用具体的工位号...
全国职业院校技能大赛-“信息安全管理与评估”理论技能
2025-05-24 17:24

Star abuse的博客 A、操作系统的安全B、数据库管理系统层次C、网络系统的安全D、数据库管理员A、即使函数外已经定义了这个变量，函数内部仍然可以定义B、如果一个函数已经定义了name变量，那么其他的函数就不能再定义C、函数...
【神兵利器】——173、SQLMap基础使用
2024-10-16 14:42

FLy_鹏程万里的博客 exclude=.. //用于排除测试参数的正则表达式(例如:"ses") --param-filter=P.. //按位置选择可测试的参数(例如:"POST") --dbms=DBMS //强制后端DBMS使用提供的值 --dbms-cred=DBMS.. //DBMS...
PHP 8.6 JIT性能提升300%？深度解析全新指令优化机制
2025-12-15 12:18

codetrick的博客 PHP 8.6 的 JIT 指令优化显著提升执行效率，通过重构中间代码生成与指令调度策略，优化高频函数调用与循环场景。该机制有效降低运行时开销，实测性能提升最高达300%，尤其适用于复杂Web应用与高并发服务。值得收藏
如何实现毫秒级PHP服务监控？这套数据采集方案让你领先同行
2026-01-04 14:30

DebugLoom的博客掌握毫秒级PHP服务监控秘诀，提升系统稳定性与响应速度。本文深入讲解PHP服务监控数据采集方案，适用于高并发、微服务等场景，通过轻量探针与实时上报实现精准性能追踪。高效、低损耗，助你快速定位瓶颈，值得收藏。
没有解决我的问题, 去提问

对大型正则表达式使用延迟评估（而不仅仅是。*？）

2条回答 默认 最新

2条回答默认最新