douyi8760 2014-04-11 12:24
浏览 35
已采纳

Simple Dom Parser - 从结果中剥离链接和特定div

I am trying to parse some content from a specific div and save it to an external file. Although this works, I couldn't manage to do the following

From the div with class league_container

  1. remove all divs with the class bar
  2. strip all links. (leave the text but remove a plus its attributes)

What I have so far is:

   <?php
    include( 'simple_html_dom.php'); 
    $html = file_get_html('https://some.domain.com/');

    $divContents = array();

    foreach ($html->find('div.league_container') as $div) 
    {
        $divContents[] = $div->outertext;
    }       


file_put_contents('parser/est-results.htm', implode(PHP_EOL, $divContents));
?>

Any help would be appreciated.

  • 写回答

1条回答 默认 最新

  • dsstjqsr631426 2014-04-12 05:08
    关注

    use outertext = :

    $div->outertext = '';
    $a->outertext = $a->text();
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥15 使用Jdk8自带的算法,和Jdk11自带的加密结果会一样吗,不一样的话有什么解决方案,Jdk不能升级的情况
  • ¥60 SOL语句中Where查询中的 from to 语句能不能从小到大换成从大到小(标签-SQL)
  • ¥15 画两个图 python或R
  • ¥15 在线请求openmv与pixhawk 实现实时目标跟踪的具体通讯方法
  • ¥15 八路抢答器设计出现故障
  • ¥15 请教一下c语言的代码里有一个地方不懂
  • ¥15 opencv 无法读取视频
  • ¥15 用matlab 实现通信仿真
  • ¥15 按键修改电子时钟,C51单片机
  • ¥60 Java中实现如何实现张量类,并用于图像处理(不运用其他科学计算库和图像处理库))