例如我写了一个正则,可以匹配百度上面所有的a标签
public static void main(String[] args)
{
String baiduHtml = getUrlString();
System.out.println(baiduHtml);
Pattern pattern = Pattern.compile("<a(.*?)>(.*?)</a>");
Matcher matcher = pattern.matcher(baiduHtml);
if (matcher.find()) {
System.out.println(matcher.group());
}
}
输出结果
<a href=http://news.baidu.com name=tj_trnews class=mnav>新闻</a>