问题遇到的现象和发生背景
我需要提取到html中,网页同级标签下的节点
以以下代码为例:
我需要提取到紧跟在h4标签后边的div标签
问题相关代码,请勿粘贴截图
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Title</title>
</head>
<body>
<div id="demo">
<h4>这是第一个h4</h4>
<!--紧跟在h4标签后的div数量不固定-->
<div></div>
<div></div>
<div></div>
<div></div>
<div></div>
<div></div>
<h4>这是第二个h4</h4>
<!--紧跟在h4标签后的div数量不固定-->
<div></div>
<div></div>
<div></div>
<div></div>
<div></div>
<div></div>
<h4>这是第n个h4</h4>
<!--紧跟在h4标签后的div数量不固定-->
<div></div>
<div></div>
<div></div>
<div></div>
<div></div>
<div></div>
</div>
</body>
</html>
我的解答思路和尝试过的方法
我在网络上找过相关的方法,如使用xpath中的following和following-sibling,但是会将h4后边的所有div标签都获取到,如第一个h4标签后边有当前有6个标签,但是follow和following-sibling会将后边的div一起获取到。
我自己尝试用笨办法写了一段代码,勉强能用: