神秘的产品经理 2016-02-29 07:58 采纳率: 0%
浏览 1323
已结题

php提取页面中域名规则问题!

一套程序中需要在指定的URL页面中提取里面所有的域名,现代码如下:

  $CODE = ......;//这里是获取远程的URL内容
        $temp = "/<a((.|\\n)*?)<\\/a>/i";
        preg_match_all( $temp, $CODE, $Jzz_thlld );
        $Jzz_thlld = $Jzz_thlld[0];
        $temp = "/ href=[\"']?http:\\/\\/www\\.([^>\"' ]+)[\"']?\\s*[^>]*>(.*)<\\/a>/si";

 for ($dos_skipping = 0; $dos_skipping < sizeof( $Jzz_thlld ); $dos_skipping++ )
        {
            preg_match( $temp, $Jzz_thlld[$dos_skipping], $tempurl );
            if ( !( $tempurl[1] != "" ) && !( strpos( $tempurl[1], "?" ) === FALSE ) && !( strpos( $tempurl[1], "&" ) === FALSE ) && !( strpos( $tempurl[1], "#" ) === FALSE ) && !( strpos( $tempurl[1], ":" ) === FALSE ) && !( strpos( $tempurl[1], " " ) === FALSE ) )
            {
                echo '99';
                $url_temp = "www.".$tempurl[1];
                if ( 0 < strpos( $url_temp, "/" ) )
                {
                    $url_arr = explode( "/", $url_temp );
                    $url_temp = $url_arr[0];
                }
                if ( $Jzz_cbgsf == "" )
                {
                    $Jzz_cbgsf = $url_temp;
                }
                else if ( strpos( "||".$Jzz_cbgsf."||", "||".$url_temp."||" ) === FALSE )
                {
                    $Jzz_cbgsf .= "||".$url_temp;
                }
            }
        }

上述代码中不能按照需求获取到所需要的信息,忘各位帮忙看看,改如何修改!!

  • 写回答

1条回答

  • devmiao 2016-02-29 14:15
    关注
    评论

报告相同问题?

悬赏问题

  • ¥15 求chat4.0解答一道线性规划题,用lingo编程运行,第一问要求写出数学模型和lingo语言编程模型,第二问第三问解答就行,我的ddl要到了谁来求了
  • ¥15 Ubuntu在安装序列比对软件STAR时出现报错如何解决
  • ¥50 树莓派安卓APK系统签名
  • ¥15 maple软件,用solve求反函数出现rootof,怎么办?
  • ¥65 汇编语言除法溢出问题
  • ¥15 Visual Studio问题
  • ¥20 求一个html代码,有偿
  • ¥100 关于使用MATLAB中copularnd函数的问题
  • ¥20 在虚拟机的pycharm上
  • ¥15 jupyterthemes 设置完毕后没有效果