我想取下面代码中所有a标签的内容,准确说是取标签文本"名字:"与标签文本“班级:”之间的所有a标签文本内容,但有几个限制:
①不能逐层去取,因为不同页面的位置不同
②不能通过“名次”来定位,因为有的页面“名次”后面有冒号,有的没有是另起一行前面没有标签
③只能通过//span[text()="名字:"]/following::a来定位,因为名字:是固定的
④班级:也是固定的
<span> class="pl">名字:</span>
"xxxxxxx"
<br>
<span>
<span> class="pl">名次</span>
":"
<a class href="xxxxxxxxx">第一名</a>
"/"
<a class href="xxxxxxxxx">第二名</a>
"/"
<a class href="xxxxxxxxx">第三名</a>
"/"
<a class href="xxxxxxxxx">第四名</a>
"/"
<a class href="xxxxxxxxx">第五名</a>
</span>
<br>
<span class="pl">班级:</span>