dso89762 2019-04-11 09:50
浏览 103
已采纳

正则表达式根据用户名从href属性中提取URL

I'm trying to extract all the links that comes from after a specific user, But my regex only grab one link:

HTML:

<div class="from_name">
   USERNAME
</div>
<div class="media_wrap clearfix">
   <div class="media clearfix pull_left media_photo">
      <div class="fill pull_left">
      </div>
      <div class="text">
         <a href="https://google.com</a>
      </div>
   </div>
   <div class="text">
      <a href="https://yahoo.com</a>
   </div>
</div>

Codes:

preg_match_all('/USERNAME[\s\S]*?href="(.*?)</', $data, $matches);

print_r($matches);

//output, it's only caputre google.com :

Array
(
    [0] => Array
        (
            [0] => FullCapture

    [1] => Array
        (
            [0] => https://google.com
        )

)
  • 写回答

2条回答 默认 最新

  • dougaodi8895 2019-04-11 15:30
    关注

    Can you use two regex? First to match the entire area with USERNAME and second to match the urls.

    preg_match('/(?<=USERNAME).*(?<=href=").*?</s', $string, $matches);
    
    preg_match_all('/(?<=href=").*?(?=<)/', $matches[0], $newMatches);
    
    var_dump($newMatches);
    

    This gives you:

    array(1) {
      [0]=>
      array(2) {
        [0]=>
        string(18) "https://google.com"
        [1]=>
        string(17) "https://yahoo.com"
      }
    }
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

悬赏问题

  • ¥15 素材场景中光线烘焙后灯光失效
  • ¥15 请教一下各位,为什么我这个没有实现模拟点击
  • ¥15 执行 virtuoso 命令后,界面没有,cadence 启动不起来
  • ¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
  • ¥20 有关区间dp的问题求解
  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置
  • ¥15 有没有研究水声通信方面的帮我改俩matlab代码
  • ¥15 ubuntu子系统密码忘记
  • ¥15 保护模式-系统加载-段寄存器