如何在使用DOMDocument时将文本内容分隔为<BR>

I have a page full of elements Im trying to parse. I want class1 and class2 as seperate text. However, class 2 exists inside class1. So if I do textContent, it retrieves all the text.

Heres the structure...

 <div class='class1'> 
     Name <br/> <span class='class2'>Other Name</span>
  </div>

If I do this...

 $dom = new DOMDocument();
 $dom->loadHTMLFile($url);
 $finder = new DomXPath($dom);
 $classname="class2";
 $nodes = $finder->query("//*[contains(@class, '$classname')]");
 foreach($nodes as $n){
     echo $n->textContent;
 }

I can get the class2 elemtn just fine. But if I do the same for class1. I get the textContent of class1 which also includes the contents of class2.

How can I extract these seperately?

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
dongqian5569 2017-01-12 05:27
关注
In your example, $n contains 5 child nodes:

"Name"

"<br/>"

" "

"<span class='class2'>Other Name</span>"

" "

The property textContent consist of the text of this node and all its descendants. To access the content only of the first child use:

echo $n->firstChild->textContent;
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

掌握PHP中清除HTML标签内容的技巧
2025-08-15 19:58

Bobby陈兴博的博客 strip_tags函数是PHP中用来去除字符串...// 基本用法示例// 输出: Example Other text该函数的返回值为一个字符串，内容是去除了标签之后的结果。如果输入的字符串为空，返回结果也将是空字符串。为了删除strip_tags。
php如何运用,浅谈如何利用PHP访问和操作DOM
2021-04-16 11:53

weixin_39723678的博客 DOM树定义了文档的逻辑结构，以及控制你访问和操作这些文档的方法。使用DOM，开发人员可以创建XML或HTML文档，操作它们的结果，...DOM树节点遵循XML命名规范，如：1、Document节点 -- 表示DOMDocument接口2、Elem...
【叔小生】JavaScript进阶篇
2019-07-30 08:40

掘金-我是哪吒的博客如何插入JS ...document.write( mystr.substring(6) + "<br />"); document.write( mystr.substring(0,5) ); </script> </head> <body> </body> </html> [外链图片转存失败(img-K3XEMn7r-1564447208325)( ...
Web基础01-HTML+CSS
2024-02-14 21:30

辉图的博客 HTML是一门语言，所有的网页都是用HTML这门语言编写出来的HTML(HyperText Markup Lá...例如:使用< img >展示图片W3C标准：网页主要由三部分组成结构：HTML表现：CSS行为：JavaScript学习网站：w3c，菜鸟...Atom。
HTML基础笔记
2025-04-25 17:13

明飞1987的博客 HTML 超文本标记语言——HyperText Markup Language。超越普通文本,具有链接功能 - 通过链接可以把多个网页链接到一起。标签成对出现，开始标签和...<>里面放英文字母（标签名）一般都是小写。结束标签比开始标签多 /
前端 -＞ HTML标签,事件
2020-12-27 20:07

欧皇小德子的博客文章目录HTML ＜html＞,＜head＞,＜title＞,＜body＞,＜p＞,＜h＞标签HTML 实例中文编码HTML ＜table＞,＜tbody＞标签HTML table 标签HTML tbody 标签HTML input 标签HTML script 标签HTML 事件属性全局事件属性窗口...
替换DOM中的文本，并没有那么简单!
2012-10-22 13:26

feliving的博客查找和替换DOM中的文本是个比较棘手的问题，特别是要正确的彻底解决，又不具侵害性（意思就是说最小化DOM侵害，对文本节点不做多余的格式化，比如将分隔的文本节点连接起来）。 update:本文中最后提到问
JavaEE学习第一天（HTML、CSS、js）
2020-01-19 22:39

Itheimapro的博客  浏览器不会显示html标签，而是使用标签来解释页面上的内容.  简单说，html就是用于展示信息【图片，文件，视频，颜色…】的。 3.文件标签 html标签  整个文件都处于<html>标签中.  <HTML>用...
XSS过滤绕过速查表
2021-03-07 17:54

J0hnson666的博客写在前面：第一次翻译长篇文档，如有疏漏还请各位大牛指正。OWASP的这篇速查表虽然时间比较久了，但还在更新，所以还是翻译出来了。翻译完发现里面还是有一些值得借鉴的思路，用来涨知识还是可以的。由于篇幅较长，...
HTML入门教程-黑马
2019-10-16 14:43

山区的花花的博客 <br /> 网页布局 <div></div> 和 <span></span> 1、标题标签【熟记】 <h1><h2>...<h6> <!DOCTYPE html> < html lang = " en " > < head > < meta charset = " UTF-8 " > < title...
没有解决我的问题, 去提问

如何在使用DOMDocument时将文本内容分隔为<BR>

3条回答 默认 最新

3条回答默认最新