解析锚标记的html文档

say i have

<a href="www.myurl/point.html" class="l" style="color:#436DBA;" onclick="return rs(this,'8 Stunning Linguistic Miracles of The Holy Quran | Kinetic Typography 144p (Video Only).mp4');">&raquo; Download MP4 &laquo;</a> - <b>144p (Video Only)</b> - <span> 19.1</span> MB<br />

html page like this i wanna parse it with simple dom php parser and i wanna get download mp4 114p 19.1 as out put while i tried this code

foreach($displaybody->find('a ') as $element) {
       // echo $element->innertext . '<br/>';

it returned me download mp4 only how do i parse remaining values download mp4 114p 19.1 please help me out

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

dsgdhtr_43654 2014-11-30 05:48

关注

You can't use the <a> tag anymore since some of the text you're trying to access isn't inside it anymore, target the document itself and then use ->plaintext:

$html = <<<EOT
<a href="www.myurl/point.html" class="l" style="color:#436DBA;" onclick="return rs(this,'8 Stunning Linguistic Miracles of The Holy Quran | Kinetic Typography 144p (Video Only).mp4');">&raquo; Download MP4 &laquo;</a> - <b>144p (Video Only)</b> - <span> 19.1</span> MB<br />
EOT;

$displaybody = str_get_html($html);
echo $displaybody->plaintext;

Here is another way of accessing each row thru DOMDocument with xpath:

// load the sites html page in DOMDocument
$dom = new DOMDocument();
libxml_use_internal_errors(true);
$html_page = file_get_contents('http://www.mohammediatechnologies.in/download/downloadtest.php?name=8KPEiGqDQHg');
$dom->loadHTML(mb_convert_encoding($html_page, 'HTML-ENTITIES', 'UTF-8'));
libxml_clear_errors();
$xpath = new DOMXpath($dom);

$data = array();
// target elements which is inside an anchor and a line break (treat them as each row)
$links = $xpath->query('//*[following-sibling::a and preceding-sibling::br]');

$temp = '';
foreach($links as $link) { // for each rows of the link

    $temp .= $link->textContent . ' '; // get all text contents

    if($link->tagName == 'br') {
        $unit = $xpath->evaluate('string(./preceding-sibling::text()[1])', $link);
        $data[] = $temp . $unit; // push them inside an array
        $temp = '';
    }
}

echo '<pre>';
print_r($data);

Sample Output

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

PHP解析HTML代码库
2019-02-17 20:02

当需要处理或解析HTML代码时，PHP提供了一些库来帮助开发者有效地操作HTML文档。本文将深入探讨"PHP解析HTML代码库"，包括其核心概念、用途以及如何使用。 1. **核心概念**： - **DOM（Document Object Model）**:...
HTML5PHP一个HTML5解析和序列化PHP库
2019-08-07 10:15

HTML5PHP是一个专门为PHP开发者设计的库，它专注于HTML5文档的解析和序列化。这个库使得在PHP环境中处理HTML5文档变得更加方便和高效。HTML5PHP的核心功能是提供了一个强大的接口，允许开发者以编程方式操作HTML5...
PHP文件注释标记及规范小结
2020-12-19 16:53

本文将对PHP文件注释标记及其规范进行详细讲解，以帮助开发者更好地理解并应用这些规则。首先，PHP注释标记主要分为两类：一种是以`@`符号开头的文档注释标记，另一种是内联标记`{@}`。下面分别介绍这两种类型的...
解析PHP正则提取或替换img标记属性
2020-10-27 04:50

PHP是一种广泛使用的服务器端脚本语言，尤其适合Web开发，并能够嵌入HTML中使用。在处理HTML内容时，经常需要对其中的标记（如img标签）...这些解析器能以更结构化的方式处理HTML文档，可以更准确地导航和修改文档树。
PHP基础语法介绍.pdf
2024-12-08 15:08

值得一提的是，PHP的官方文档明确指出，PHP解析器会忽略标记之外的所有内容，这包括了可能不被认为是“有效”的标记，如在HTML标签内直接使用PHP代码。这意味着PHP可以嵌入到几乎任何类型的标记语言中，从而允许...
PHP模板解析类实例
2020-10-23 22:46

PHP模板解析类实例主要涉及了在PHP中如何创建和使用模板解析类，用于将模板文件中的特殊标记进行解析并替换为相应的数据，从而实现动态网页内容的生成。这类技术在Web开发中非常常见，尤其在需要分离业务逻辑和页面...
PHP4和PHP5版本下解析XML文档的操作方法实例分析
2020-10-19 20:04

PHP作为一种流行的服务器端脚本语言，提供了多种解析XML文档的方法，尤其在PHP4和PHP5这两个版本中，解析XML的方式有所不同。在PHP4中，XML解析主要依赖于SAX（Simple API for XML）解析器。SAX是一个事件驱动的...
php解析xml方法实例详解
2020-10-24 06:13

PHP作为一门流行的服务器端脚本语言，支持多种方式来解析XML文件，下面我们将通过实例详解介绍PHP解析XML的方法。首先来看一个XML文件的例子，名为books.xml，该文件包含了一系列书籍的信息。它被定义为XML的格式...
php5新改动之短标记启用方法
2020-10-30 07:23

2. 如果出于特定需求，比如旧系统的兼容性，需要重新启用短标记，可以在PHP的配置文件php.ini中找到short_open_tag参数，并将其值设置为on。修改后需要重启web服务器来使改动生效。修改php.ini文件的操作步骤通常...
php遍历解析xml字符串的方法
2020-12-19 12:06

在PHP中，处理XML数据是常见的任务，尤其在与服务器通信、数据交换或者解析配置文件时。本实例将详细介绍如何使用PHP的SimpleXMLElement类来遍历和解析XML字符串。首先，XML（eXtensible Markup Language）是一种...
没有解决我的问题, 去提问

码龄粉丝数原力等级 --

解析锚标记的html文档

1条回答默认最新

码龄粉丝数原力等级 --

解析锚标记的html文档

1条回答 默认 最新

1条回答默认最新