字符串去掉HTML标签但是保留样式(主要是换行样式),怎么实现,或者说在什么上面输出可以实现

字符串去掉HTML标签但是保留样式(主要是换行样式),怎么实现,或者说在什么上面输出可以实现
最好用C#实现

2个回答


    private  string RemoveHtml(Match m)
    {
        if (m.Groups[1].Value.ToLower() == "br") return "<br>";

        return "";
    }
    public string RemoveHtml(string s)
    {
        s = Regex.Replace(s, @"</?([a-z\d]+)[^>]*>", RemoveHtml, RegexOptions.IgnoreCase);
        return s;
    }



   Response.Write( RemoveHtml("<div>a<br>b<b style='color:red'>c</b></div>"));//a<br>bc

如果想获取网页内容的话,可以尝试截取<,这样就取出了每个标签的内容,然后再做相应的判断,如果是块级的话,加换行就行,不造是不是你想要的思路

立即提问
相关内容推荐