如何在<body>中获取<a>标签，但不包括页眉和页脚部分

If I have a webpage like this:

<body>
  <header>
    <a href='http://domain1.com'>link 1 text</a>
  </header>

  <a href='http://domain2.com'>link 2 text</a>

  <footer>
    <a href='http://domain3.com'>link 3 text</a>
  </footer>
</body>

How do I pull the <a> tags out of the <body> but exclude the links from <header> and <footer>?

In the real web page, there will be a lot of <a> tags in the <header> so I'd rather not have to cycle through ALL of them.

I want to pull out the URLs and anchor text from each of the <a> tags that are NOT inside the <header> or <footer> tags.

EDIT: this is how I find links in the header:

$header = $html->find('header',0);
foreach ($header->find('a') as $a){
  do something
}

I would like to do this (note the use of "!")

$foo = $html->find('!header,!footer');
foreach ($foo->find('a') as $a){
  do something
}

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

duanli9591 2016-07-16 23:07

关注

Remove the header and footer from the DOM you are working with before looking for the links.

<?php
    include("simple_html_dom.php");
    $source = <<<EOD
    <body>
        <header>
            <a href='http://domain1.com'>link 1 text</a>
        </header>

        <a href='http://domain2.com'>link 2 text</a>

        <a href='http://domain4.com'>link 4 text</a>

        <footer>
            <a href='http://domain3.com'>link 3 text</a>
        </footer>
    </body>
EOD;

    $html = str_get_html($source);
    foreach ($html->find('header, footer') as $unwanted) {
        $unwanted->outertext = "";
    }
    $html->load($html->save()); 
    $links = $html->find("a");
    foreach ($links as $link) {
        print $link;
};

?>

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(2条)

报告相同问题？

关注问题

HTML中的body及可以再body中出现的标签
2021-01-18 01:02

IT_CREATE的博客需要显示的浏览器网页模块的内容，都必须要定义在body中，<body> 标签，可以说是HTML文件中，最为重要的一块内容。主体标记以<body>开始，以</body>结尾注意：在...
php标签属性大全,史上最全的标签总结大全
2021-04-10 11:15

思维有了模型的博客基本结构标签:,表示该文件为HTML文件---,包含文件的标题,标题出现在浏览器标题栏中,的结束标志,的结束标志,的结束标志其它主要标签,以下所有标志用在中:,链接标志,"…"为链接的文件地址,显示图片标志,"…"为图片的...
HTML标签分类及实践
2024-02-23 18:29

全栈道的博客 html标签是构建网页结构的关键，它的种类繁多，进行一个很好的分类，可以更好的去使用。
前端，google浏览器页眉页脚处理
2022-01-04 20:59

呦丶的博客前端页眉页脚问题
Web基础01-HTML+CSS
2024-02-14 21:30

辉图的博客 HTML是一门语言，所有的网页都是用HTML这门语言编写出来的HTML(HyperText Markup Lá...例如:使用< img >展示图片W3C标准：网页主要由三部分组成结构：HTML表现：CSS行为：JavaScript学习网站：w3c，菜鸟...Atom。
第一周02
2019-08-29 10:28

weixin_42307988的博客理解标签语义化掌握常用的排版标签掌握常用的文本格式化图像链接等标签掌握三种列表标签掌握表格标签掌握表格标签掌握表单标签掌握H5新增表单和表单属性认识网页文字，图像，超链接组成，视频，音频，和...
html的表格标签的页眉属性,HTML标签、属性与对HTML列表、表格、表单理解运用和编程实现-2019年8月31日...
2021-06-12 04:10

cici xiang的博客谈谈你对html标签, 元素与属性的理解, 并举例说明2. 列表有几种, 如何定义?3. 列表与表格的区别与联系?什么时候用列表,什么时候用表格, 为什么?4. 编程实现,用列表制作你的工作计划,要求使用三种类型全部实现一次: ...
web端生成pdf，前端生成pdf导出并自定义页眉页脚
2022-08-01 12:36

喜大普奔⁶⁶⁶的博客前端导出pdf文件，并在页眉页脚加上企业logo或者是企业名称前端导出pdf这里的项目用的 vue-element-admin 的模板，vue 版本是 2.X 1、前端基础 html + css + js 2、vue 3、html2canvas 4、jspdf安装依赖：逻辑 1、...
总结HTML中不经常使用的标签
2017-06-15 16:41

h_opingocean的博客总结HTML4及HTML5中不常使用的标签...
Web前端——HTML中的列表、表格、表单
2020-07-03 16:51

巧克力code的博客列表 <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>列表<...body> <!-- 列表（list） 1、铅笔 2、尺子 3、橡皮在html中
使用 float 创建一个网页页眉、页脚、左边的内容和主要内容。
2022-06-07 22:38

只是六号z的博客 <li><a href="#city" class="active">The City</a></li> <li><a href="#island">The Island</a></li> <li><a href="#food">The Food</a></li> <li><a href="#people">The People</a></li> <li><a href="#history">...
Dompdf终极指南：如何实现自定义页眉页脚与动态内容排版
2025-09-19 08:14

郜毓彬的博客本文将重点介绍如何在Dompdf中实现自定义页眉页脚功能，使用CSS定位技术和PHP动态内容生成技术来创建专业的PDF文档布局。 ## Dompdf页眉页脚基础原理 Dompdf通过CSS的`@page`规则和定位技术来实现页眉页脚功能。在...
HTML 教程（一文彻底搞懂HTML）
2022-06-04 15:55

骑摩托的蜗牛的博客 </p> <ul><li>HTML 标签是由<em>尖括号</em>包围的关键词，比如 <html></li><li>HTML 标签通常是<em>成对出现</em>的，比如 <b> 和 </b></li><li>标签对中的第一个标签是<em>开始标签</em>，第二个标签是<em>结束...
js页面打印去除页眉页脚
2020-01-04 17:30

森大科技的博客然后调用js的print()函数，就打印窗口页面，但是在有些机器上页眉有html里面title的内容打印出来，还有第几页的标识，页脚有该窗口页面的地址打印出来，还有日期，这些信息我都是不需要的，在少数机器上有时就没有.....
HTML页面打印功能js代码,JavaScript_js实现页面打印功能实例代码(附去页眉页脚功能代码)，复制代码代码如下: <html> - phpStudy...
2021-06-14 06:41

weixin_39796533的博客 js实现页面打印功能实例代码(附去页眉页脚功能代码)复制代码代码如下:@media print{.print {display:block;}.notPrint {display:none;}}function preview(){bdhtml=window.document.body.innerHTML;sprnstr="";...
没有解决我的问题, 去提问

码龄粉丝数原力等级 --

如何在<body>中获取<a>标签，但不包括页眉和页脚部分

3条回答默认最新

码龄粉丝数原力等级 --

如何在<body>中获取<a>标签，但不包括页眉和页脚部分

3条回答 默认 最新

3条回答默认最新