神秘的产品经理 2016-02-29 07:58 采纳率: 0%
浏览 1323
已结题

php提取页面中域名规则问题!

一套程序中需要在指定的URL页面中提取里面所有的域名,现代码如下:

  $CODE = ......;//这里是获取远程的URL内容
        $temp = "/<a((.|\\n)*?)<\\/a>/i";
        preg_match_all( $temp, $CODE, $Jzz_thlld );
        $Jzz_thlld = $Jzz_thlld[0];
        $temp = "/ href=[\"']?http:\\/\\/www\\.([^>\"' ]+)[\"']?\\s*[^>]*>(.*)<\\/a>/si";

 for ($dos_skipping = 0; $dos_skipping < sizeof( $Jzz_thlld ); $dos_skipping++ )
        {
            preg_match( $temp, $Jzz_thlld[$dos_skipping], $tempurl );
            if ( !( $tempurl[1] != "" ) && !( strpos( $tempurl[1], "?" ) === FALSE ) && !( strpos( $tempurl[1], "&" ) === FALSE ) && !( strpos( $tempurl[1], "#" ) === FALSE ) && !( strpos( $tempurl[1], ":" ) === FALSE ) && !( strpos( $tempurl[1], " " ) === FALSE ) )
            {
                echo '99';
                $url_temp = "www.".$tempurl[1];
                if ( 0 < strpos( $url_temp, "/" ) )
                {
                    $url_arr = explode( "/", $url_temp );
                    $url_temp = $url_arr[0];
                }
                if ( $Jzz_cbgsf == "" )
                {
                    $Jzz_cbgsf = $url_temp;
                }
                else if ( strpos( "||".$Jzz_cbgsf."||", "||".$url_temp."||" ) === FALSE )
                {
                    $Jzz_cbgsf .= "||".$url_temp;
                }
            }
        }

上述代码中不能按照需求获取到所需要的信息,忘各位帮忙看看,改如何修改!!

  • 写回答

1条回答 默认 最新

  • devmiao 2016-02-29 14:15
    关注
    评论

报告相同问题?

悬赏问题

  • ¥15 overleaf中论文编辑,报错`pages' is a missing field, not a string, for entry 4
  • ¥15 vhdl+MODELSIM
  • ¥20 simulink中怎么使用solve函数?
  • ¥30 dspbuilder中使用signalcompiler时报错Error during compilation: Fitter failed,求解决办法
  • ¥15 gwas 分析-数据质控之过滤稀有突变中出现的问题
  • ¥15 没有注册类 (异常来自 HRESULT: 0x80040154 (REGDB_E_CLASSNOTREG))
  • ¥15 知识蒸馏实战博客问题
  • ¥15 用PLC设计纸袋糊底机送料系统
  • ¥15 simulink仿真中dtc控制永磁同步电机如何控制开关频率
  • ¥15 用C语言输入方程怎么