用java字符串方法去除HTML代码标签的问题

比如有这样的html代码：
[code="java"]

情感美容

[/code]
想要实现把、

等标签中的“target”、“href”、"id"、"style"等信息去除，只留下单纯的、

形式。我用了java字符串匹配替换的方法：

[code="java"]
private static String removeInTag(String a) {
StringBuffer aaa = new StringBuffer();
aaa.append(a);
int BeginIndex = 0;
while(BeginIndex != -1){
BeginIndex = aaa.indexOf("<",BeginIndex);
int StarIndex = aaa.indexOf(" ", BeginIndex);
int EndIndex = aaa.indexOf(">", BeginIndex);
int PreventErr = aaa.indexOf("<", BeginIndex);
if ((PreventErr > EndIndex) && (StarIndex > StarIndex)){

aaa.replace(StarIndex, EndIndex, "");
}
}
return aaa.toString();
}
[/code]
但出现了死循环，死循环的原因何在？
同时由于本人初学java，所以这个方法可能不是最好方法，有没有更高效、更不易出错的方法呢？谢谢！

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

10条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
拽拽的初行者 2010-05-12 16:13
关注
[b]试试吧：[/b]

[code="java"] String aaa = "
情感美容
";
System.out.println(aaa.replaceAll("<(/?\\S+)\\s*?[^<]*?(/?)>","<$1$2>")); // <div><li> <a>情感</a></li><li> <a>美容</a></li></div>[/code]
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(9条)

报告相同问题？

关注问题

用java字符串方法去除HTML代码标签的问题
2010-05-12 11:13

回答 10 已采纳 [b]试试吧：[/b] [code="java"] String aaa = " 情感美容"; System.out.println(aaa.replaceAll("","")
java向构造方法传递字符串的问题 java 后端
2021-10-23 16:02

回答 1 已采纳 Scanner sc=new Scanner(System.in);这一句出现的问题，你的参数来自于标准输入，你可以理解为来自控制台，你还没有输入呢，兄弟Scanner sc=new Scanner
java处理隐藏字符串的问题，识别清除非法字符 java javascript
2017-12-27 09:40

回答 17 已采纳如果针对手机号，可以用正则匹配下，去掉数字以外的字符,str.replaceAll("[^0-9]", "")
java 使用html标签_用java字符串方法去除HTML代码标签的问题
2021-02-13 00:46

知然789的博客比如有这样的html代码：情感比如有这样的html代码：情感美容想要实现把、等...我用了java字符串匹配替换的方法：private static String removeInTag(String a) {StringBuffer aaa = new StringBuffer();aaa.append(a...
Java 给字符串加转义符号 java
2022-12-07 15:32

回答 3 已采纳在idea 里面你定义一个字符串，他可以自动转换的。比如你先定义String s = ""; 然后你把要粘贴的内容粘贴到双引号里面，就会自动转义的
请问java如何去掉字符串中的数字和特殊符号？ intellij-idea java
2021-06-29 18:32

回答 2 已采纳 package test; import java.util.Scanner; public class Test { public static void main(String[]
Java字符串相加遇到的问题 java
2022-08-13 20:45

回答 2 已采纳 str += 12，会将12视为字符串str += 12 + '1';会先执行 12+'1'，会将两个数当作整数计算。字符'1'的ASCII码是49，加上12是61，str+=61，将61当作字符，所
java代码-正则去除HTML代码中的A标签
2021-07-15 04:40

java代码-正则去除HTML代码中的A标签
java字符串比较，求助有没有好的方法
2017-01-23 06:22

回答 6 已采纳不知道具体数据格式是啥，给出的"流量10"，是字符串？还是{"流量":10}，这种key-value形式的内容。如果是"流量10",那用linkedList，插入前比较字符串，选择插入点。如果
Java从字符串中提取key和value java
2022-05-25 22:20

回答 2 已采纳参考下不懂问我，有用采纳一手 String data = "name=刘小溪&sport=篮球&sport=逛街&sex=女&fruit=苹果&fruit=梨子&fruit=杏";
关于html字符串拼接的问题 html5 javascript
2018-05-08 14:20

回答 4 已采纳主要是为了便于查看方便，一下就知道html标签结构，后期维护方便（添加、删除等更容易）。js 的es6支持模板字符串，可以用一下方式试试： let tmpl = `
java代码-正则去除HTML代码中的SCRIPT标签
2021-07-15 04:39

java代码-正则去除HTML代码中的SCRIPT标签
java 字符串反转无法打印出反转后的字符串 java
2022-03-12 16:55

回答 2 已采纳 for里面的条件写错了，改为i>=0
Java如何去除字符串中的HTML标签
2022-01-19 11:27

Javaの甘乃迪的博客去除字符串中的HTML标签
java代码-正则去除HTML代码中的IMG标签
2021-07-15 04:39

java代码-正则去除HTML代码中的IMG标签
没有解决我的问题, 去提问

悬赏问题

¥35 平滑拟合曲线该如何生成
¥100 c语言，请帮蒟蒻写一个题的范例作参考
¥15 名为“Product”的列已属于此 DataTable
¥15 安卓adb backup备份应用数据失败
¥15 eclipse运行项目时遇到的问题
¥15 关于#c##的问题：最近需要用CAT工具Trados进行一些开发
¥15 南大pa1 小游戏没有界面，并且报了如下错误，尝试过换显卡驱动，但是好像不行
¥15 自己瞎改改，结果现在又运行不了了
¥15 链式存储应该如何解决
¥15 没有证书，nginx怎么反向代理到只能接受https的公网网站

用java字符串方法去除HTML代码标签的问题

10条回答 默认 最新

悬赏问题

10条回答默认最新