dwa4821 2016-06-27 08:14 采纳率: 71.4%
浏览 2675

正则表达式获取a标签里的title

现在是直接获取整个a标签里,然后遍历输出item.groups["title"].value;
希望能修改正则表达式,直接获取title,然后输出item.value

static void Main(string[] args)
{
string resultHtml = getHtml("http://bbs.csdn.net/topics/391047173");
//获取a标签中href
//string regexHref = @"(?is)[^'""]*)[^<]*";
//获取a标签中title
string regexHrefTitleInA2 = @"(?is)<a[^>]+?title=(['""]?)(?

[^'""\s>]+)\1[^>]*>((?:(?!</?a\b).)*)</a>";
var matches = Regex.Matches(resultHtml, regexHrefTitleInA2);
foreach (Match item in matches)
{
if (item.Success)
{
Console.WriteLine(item.Groups["title"].Value);
}
Console.WriteLine();
}
Console.Read();
}
///
/// 获取指定网址内容
///
/// 网址
/// 网页内容字符串
private static string getHtml(string url)
{
HttpWebRequest request = (HttpWebRequest)WebRequest.Create(url);
HttpWebResponse response = (HttpWebResponse)request.GetResponse();
        Stream stream = response.GetResponseStream();
        StreamReader sr = new StreamReader(stream,Encoding.GetEncoding(response.CharacterSet));
        string html = sr.ReadToEnd();
        sr.Close();
        return html;
    }
  • 写回答

1条回答

  • threenewbee 2016-06-27 14:47
    关注
    评论

报告相同问题?

悬赏问题

  • ¥15 对于相关问题的求解与代码
  • ¥15 ubuntu子系统密码忘记
  • ¥15 信号傅里叶变换在matlab上遇到的小问题请求帮助
  • ¥15 保护模式-系统加载-段寄存器
  • ¥15 电脑桌面设定一个区域禁止鼠标操作
  • ¥15 求NPF226060磁芯的详细资料
  • ¥15 使用R语言marginaleffects包进行边际效应图绘制
  • ¥20 usb设备兼容性问题
  • ¥15 错误(10048): “调用exui内部功能”库命令的参数“参数4”不能接受空数据。怎么解决啊
  • ¥15 安装svn网络有问题怎么办