douzhi1972 2016-12-30 05:38
浏览 71
已采纳

Php curl远程页面javascript提取

I have a remote page, below shows its source code,

<!DOCTYPE html>
<html>
<head>
    <title>somethingg blabla</title>
</head>
<body>
<script type="text/javascript">
    function blala( ) { /*** code **/ }
    var sitedata = {
            "count": 1,
            "threads": {
                "38752": {
                    "thread_id": 38752,
                    "node_id": 4,
                    "title": "The ShadyCraft Beta Launch!", 
                    "prefix_id": 19, 
                    "content": {
                        "count": 1,
                        "content": {
                            "226167": {
                                "post_id": 226167

                            }
                        }
                    }
                }
            }
        };
var extra_codes_here = 'blabla';
</script>

<h1>Hello world</h1>
</body>
</html>

I have code for curl this page and i got this source code, but how to get the value var sitedata to php array ,

  • 写回答

1条回答 默认 最新

  • doushun9875 2016-12-30 05:55
    关注
    $doc; // your document
    
    preg_match('/var\ssitedata\s=\s({.*});/s', $doc, $matches);
    $json = $matches[1];
    print_r(json_decode($json, true));
    

    and your json is incorrect.

    "post_id": 226167, 
    

    to

    "post_id": 226167
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥15 素材场景中光线烘焙后灯光失效
  • ¥15 请教一下各位,为什么我这个没有实现模拟点击
  • ¥15 执行 virtuoso 命令后,界面没有,cadence 启动不起来
  • ¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
  • ¥20 有关区间dp的问题求解
  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置
  • ¥15 有没有研究水声通信方面的帮我改俩matlab代码
  • ¥15 ubuntu子系统密码忘记
  • ¥15 保护模式-系统加载-段寄存器