douye2110 2014-03-05 21:03
浏览 10
已采纳

刮掉onclick网址

I want to scrape html with php and retrieve the js onclick url from specific table cells, the cells are always in identical pairs so I only need one url of every pair, for example:

<tr>
<td width='10' class='score' OnClick="window.location='page.99.html'">
<td width='10' class='score' OnClick="window.location='page.99.html'">
</tr>

I want to retrieve page.99.html from either these and carry on for however many pairs there are. I've been using this and can get the cell value but not the onclick propery:

$dom = new DOMDocument();
$res=$dom->loadHTML($html);
$xpath = new DomXPath($dom);
$cells = $xpath->query( '//td[@width="10"]');

foreach($cells as $cell) {
echo $cell->nodeValue;
}

Can anyone please tell me how to access this onclick url for each appropriate cell?

  • 写回答

2条回答 默认 最新

  • dongyu1125 2014-03-05 21:11
    关注

    This should do it :

    $onClicks = array();
    
    $dom->loadHTML($html);
    
    foreach($dom->getElementsByTagName('td') as $td) { 
        if((int)$td->getAttribute('width') == 10) {
            $onClicks[] = $td->getAttribute('OnClick'); 
        }
    } 
    
    foreach($onClicks as $onClick) {
        // do something...
        echo $onClick;
    }
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

悬赏问题

  • ¥15 stm32代码移植没反应
  • ¥15 matlab基于pde算法图像修复,为什么只能对示例图像有效
  • ¥100 连续两帧图像高速减法
  • ¥15 组策略中的计算机配置策略无法下发
  • ¥15 如何绘制动力学系统的相图
  • ¥15 对接wps接口实现获取元数据
  • ¥20 给自己本科IT专业毕业的妹m找个实习工作
  • ¥15 用友U8:向一个无法连接的网络尝试了一个套接字操作,如何解决?
  • ¥30 我的代码按理说完成了模型的搭建、训练、验证测试等工作(标签-网络|关键词-变化检测)
  • ¥50 mac mini外接显示器 画质字体模糊