dongli5785 2013-11-06 17:21
浏览 50
已采纳

正则表达式排除标题标记之间的内容

What's wrong with this regex to exclude content of title tag?

$plaintext = preg_match('#<title>(.*?)</title>#', $html);

$html has html code of entire page.

  • 写回答

3条回答 默认 最新

  • dongshicuo4844 2014-06-03 01:40
    关注

    It sounds like you never got a working answer. Let's remove the title tags.

    Search: (?s)<title>.*?</title>

    Replace: ""

    Code:

    $regex = "~(?s)<title>.*?</title>~";
    $ replaced = preg_replace($regex,"",$pagecontent);
    

    Explain Regex

    (?s)                     # set flags for this block (with . matching
                             # 
    ) (case-sensitive) (with ^ and $
                             # matching normally) (matching whitespace
                             # and # normally)
    <title>                  # '<title>'
    .*?                      # any character (0 or more times (matching
                             # the least amount possible))
    </title>                 # '</title>'
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

悬赏问题

  • ¥15 vue3加ant-design-vue无法渲染出页面
  • ¥15 matlab(相关搜索:紧聚焦)
  • ¥15 基于51单片机的厨房煤气泄露检测报警系统设计
  • ¥15 路易威登官网 里边的参数逆向
  • ¥15 Arduino无法同时连接多个hx711模块,如何解决?
  • ¥50 需求一个up主付费课程
  • ¥20 模型在y分布之外的数据上预测能力不好如何解决
  • ¥15 processing提取音乐节奏
  • ¥15 gg加速器加速游戏时,提示不是x86架构
  • ¥15 python按要求编写程序