zhouxn921031
zhouxn921031
2021-01-20 12:49

正则式提取网页标签内容

  • 正则表达式
<tr>
<th class="a-color-secondary a-size-base prodDetSectionEntry">
Amazon 売れ筋ランキング
</th>
<td>
<span>

<span> - 104位パソコン・周辺機器 (<a href='/gp/bestsellers/computers/ref=pd_zg_ts_computers'>の売れ筋ランキングを見るパソコン・周辺機器</a>)</span>
<br>

<span> - 6位<a href='/gp/bestsellers/computers/2151978051/ref=pd_zg_hrsr_computers'>マウス</a></span>
<br>

</span>
</td>
</tr>

 想要提取到里面的 “104位パソコン・周辺機器” 。所以尝试找一个特定文本开头的span标签来提取。

我自己写的正则式是:  ^売れ筋ランキング(.*?)$<a 

提取不到想要的内容,请问应该怎么写呢

  • 点赞
  • 回答
  • 收藏
  • 复制链接分享

4条回答