神秘的产品经理 2016-02-29 07:58 采纳率: 0%
浏览 1323
已结题

php提取页面中域名规则问题!

一套程序中需要在指定的URL页面中提取里面所有的域名,现代码如下:

  $CODE = ......;//这里是获取远程的URL内容
        $temp = "/<a((.|\\n)*?)<\\/a>/i";
        preg_match_all( $temp, $CODE, $Jzz_thlld );
        $Jzz_thlld = $Jzz_thlld[0];
        $temp = "/ href=[\"']?http:\\/\\/www\\.([^>\"' ]+)[\"']?\\s*[^>]*>(.*)<\\/a>/si";

 for ($dos_skipping = 0; $dos_skipping < sizeof( $Jzz_thlld ); $dos_skipping++ )
        {
            preg_match( $temp, $Jzz_thlld[$dos_skipping], $tempurl );
            if ( !( $tempurl[1] != "" ) && !( strpos( $tempurl[1], "?" ) === FALSE ) && !( strpos( $tempurl[1], "&" ) === FALSE ) && !( strpos( $tempurl[1], "#" ) === FALSE ) && !( strpos( $tempurl[1], ":" ) === FALSE ) && !( strpos( $tempurl[1], " " ) === FALSE ) )
            {
                echo '99';
                $url_temp = "www.".$tempurl[1];
                if ( 0 < strpos( $url_temp, "/" ) )
                {
                    $url_arr = explode( "/", $url_temp );
                    $url_temp = $url_arr[0];
                }
                if ( $Jzz_cbgsf == "" )
                {
                    $Jzz_cbgsf = $url_temp;
                }
                else if ( strpos( "||".$Jzz_cbgsf."||", "||".$url_temp."||" ) === FALSE )
                {
                    $Jzz_cbgsf .= "||".$url_temp;
                }
            }
        }

上述代码中不能按照需求获取到所需要的信息,忘各位帮忙看看,改如何修改!!

  • 写回答

1条回答 默认 最新

  • devmiao 2016-02-29 14:15
    关注
    评论

报告相同问题?

悬赏问题

  • ¥60 Python如何后台操作Vmwake虚拟机键鼠
  • ¥15 关于#matlab#的问题:期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707,使系统具有较小的超调量
  • ¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
  • ¥30 截图中的mathematics程序转换成matlab
  • ¥15 动力学代码报错,维度不匹配
  • ¥15 Power query添加列问题
  • ¥50 Kubernetes&Fission&Eleasticsearch
  • ¥15 報錯:Person is not mapped,如何解決?
  • ¥15 c++头文件不能识别CDialog
  • ¥15 Excel发现不可读取的内容