如何用htmlparser修改html中标签的内容

刚接触htmlparser,想用htmlparser解析字符串

测试文本一<input name="text1" type="text" value="text1">

测试文本二

Stirng sText="测试文本一<input name="\&amp;quot;text1\&quot;/" type="\&amp;quot;text\&quot;" value="\&amp;quot;text1\&quot;">
测试文本二其他数据;\";
Parser parser = new Parser();   // parser.setURL
parser.setInputHTML(sText);
parser.setEncoding(parser.getEncoding());
NodeFilter filter = new NodeClassFilter(Span.class);
NodeList list = parser.extractAllNodesThatMatch(filter);
for (int i = 0; i < list.size(); i++) {
         if (list.elementAt(i) instanceof Span) {
                Span spanTag = (Span ) list.elementAt(i);
    textnode.setAttributeEx(textnode.getAttributeEx("name"));
                if(spanTag .getAttribute("name").equals("first")){
                     spanTag .setAttribute("value", "bbb");
           }         }
}

我已经用span过滤掉了其他内容,部分源码如上,我现在想将上面文本中的标签中的name="first"的value值改为"bbb",然后返回所有文本即改过的(sText),但是不能用sText.replace()方法,因为原文本中可能有多个value="aaa"的值.

大家有什么好的建议,最好是直接可以用htmlparser处理的.谢谢

问题补充：
非常感谢大家的帮忙,尤其是lzj0470和ferreousbox,上面的问题已经解决,

如果现在我想将字符串
"

测试文本一<input name="text1/" type="text" value="text1">

测试文本二其他数据;"
中的"测试文本二"替换成"此处已经被替换";即返回的字符串为:
"

测试文本一<input name="text1/" type="text" value="text1">

此处已经被替换其他数据;"

这样该怎么实现,因为span标签中还含有等标签,而我对正则表达式又不熟,所以,sText.replace()方法实现不了,还是要请教大家了,谢谢哈

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
iteye_8101 2008-11-06 22:46
关注
楼上的代码是正解，可以解决这个问题，但是返回的结果如果span元素还有parent元素的话就不正确了，当然前提是不知道要解析的html代码是什么样的，所以应该这样做：
public String parse(String text) {
String tmp = "
" + text + "</html";
NodeList list = Parser.createParser(tmp, "GB2312").parse(new TagNameFilter("body"));
Node body = tmp.elementAt(0);
body.accept(new NodeVisitor() {
public void visitTag(Tag tag) {
if (tag.getClass() != Span.clss) return;
// replace attribute here,i ignore the code
......
}
});
return body.toHtml();
}

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(4条)

报告相同问题？

关注问题

htmlparser修改html,如何用htmlparser修改html中标签的内容
2021-06-10 17:41

连接虚拟与现实的博客 /** * @param args * @throws ParserException */ public static void... } sText_new = list.toHtml(); } System.out.println("sText_new="+sText_new); } 结果是sText_new=测试文本一测试文本二 2008年11月06日 17:43
htmlparser修改html,HTML Parser
2021-06-10 17:43

吃瓜少年藤井水的博客 HTML ParserHTML Parser is a Java library used to parse HTML in either a linear or nested fashion.Primarily used for transformation or extraction, it features filters, visitors,custom tags and easy to ...
基于Java的HTML文档解析器 HTMLParser.zip
2023-06-15 00:59

4. **自动化测试**：在Web应用自动化测试中，可以使用HTMLParser验证网页的预期结构和内容。 5. **内容管理系统**：在构建内容管理系统时，HTMLParser可以帮助处理用户输入的HTML，确保安全性和一致性。 **...
htmlparser 中修改 HTML 内容的方法
2009-08-24 16:03

iteye_5425的博客 htmlparser（HTML ...它可以解析 HTML 页面，用来抽取或修改其内容，通过过滤器、访问者来访问程序关心的标签（Tag）。 htmlparser 写道 HTML Parser is a Java library used to parse HTML in either a ...
HTML文档解析器 HTMLParser.7z
2022-07-06 10:18

8. **API接口**：HTMLParser库通常提供API接口，允许开发者注册事件处理器来响应解析过程中的特定事件，如遇到标签开始、结束、文本内容等。这样可以定制化解析行为，实现更精细的控制。 9. **DOM遍历**：解析后的...
JAVA源码HTML文档解析器HTMLParser
2024-10-09 16:42

此外，HTMLParser还支持各种HTML标签的扩展，开发者可以很方便地为HTMLParser添加对新标签或属性的支持，这为HTMLParser的灵活性提供了保障。当然，这一切的扩展都是在保持与原有解析器兼容性的前提下进行的，确保了...
基于Java的源码-HTML文档解析器 HTMLParser.zip
2023-07-15 11:45

6. **兼容性**：HTMLParser兼容多种版本的Java，可以在各种Java运行环境中使用。 7. **示例和文档**：HTMLParser项目通常会提供详细的API文档和示例代码，帮助开发者快速上手。在实际应用中，你可以使用...
Html解析助手htmlparser.jar
2018-01-09 17:39

3. **事件驱动解析**：`htmlparser.jar`支持事件驱动的解析模式，当遇到特定的HTML标签或事件时，会触发回调函数，这种方式对内存使用友好，适用于处理大型HTML文档。 4. **灵活性**：这个库允许用户自定义解析规则...
htmlparser补全HTML,htmlparser
2021-06-23 10:15

weixin_39878698的博客源程序代码我们的 C# 程序中经常会产生一些数据，这些数据可以使用 Html 表格进行展现。现在让我们开始写相关的 C# 程序吧。下面就是 HtmlMaker.cs：01:usingSystem;02:usingSystem.IO;03:usingSystem.Net;04:...
解析得到除去标签的txt内容
2021-01-20 14:20

在这个例子中，它被用来从HTML文档中提取特定标签内的文本，去除HTML标签，以便获取纯文本内容。首先，`NodeList body_nodes = this.getParser().parse(body_filter);`这一行代码创建了一个`NodeList`对象，该对象...
python中html.parser_python模块之HTMLParser简介
2021-01-29 03:59

耷耷的博客当你feed给它一个类似HTML格式的字符串时，它会调用goahead方法向前迭代各个标签，并调用对应的parse_xxxx方法提取start_tag, tag, attrs data comment和end_tag等等标签信息和数据，然后调用对应的方法对这些抽取...
python修改 html 标签,python去除html标签
2021-06-11 07:58

桔梗一身骄傲的博客 python去除html标签，自己写的，若有不足请指正：#! /usr/bin/env python#coding=utf-8# blueel 2013-01-19from HTMLParser import HTMLParserclass MLStripper(HTMLParser):def __init__(self):self.reset()self....
HtmlParser:解析HTML元素
2021-05-26 18:02

HTMLParser提供了一种结构化的方式来解析HTML文档，它能够识别HTML标签、属性、文本内容等，并将其转化为易于处理的数据结构。这个库特别适用于那些需要处理非标准或者不完全符合HTML规范的网页，因为它有较强的容错...
html解析工具htmllexer+htmlparser-2.1
2018-08-26 15:54

`htmlparser`可以将HTML文档解析成一个DOM（Document Object Model）树，使得开发者可以像操作XML文档一样遍历和修改HTML结构。DOM是一种与平台和语言无关的标准，它将HTML或XML文档表示为一棵节点树，每个节点代表...
HtmlParser:HTML解析器
2021-07-09 12:20

1. 错误处理：HTML文档可能不规范，解析器需要具备处理不完整或错误的HTML标签的能力。 2. 性能优化：如果需要处理大量HTML，解析速度是个关键因素。选择性能优越的解析器可以提高效率。 3. 兼容性：确保所选解析器...
基于Java的实例开发源码-HTML文档解析器 HTMLParser.zip
2023-06-17 15:28

5. **实例开发**：提供的源码示例可以帮助开发者了解如何使用HTMLParser库来解析HTML文档，包括创建解析器对象、注册事件处理器、处理HTML标签和属性等步骤。这对于初学者来说是非常有价值的教育资源。 6. **标签...
基于java的HTML文档解析器 HTMLParser.zip
2023-05-27 10:27

在实际开发中，HTMLParser常被用在以下场景： - **网页抓取**：从HTML页面中提取结构化数据，如新闻标题、评论等。 - **Web应用**：解析用户提交的HTML内容，如博客文章、论坛帖子，确保安全性并进行格式化。 - **...
java 标题过滤_用HTMLParser过滤掉html中所有标签,留下标题正文等内容，java
2021-03-08 20:03

weixin_39604983的博客 } } 这个是我们的代码，但是处理结果只能去掉标签，还留下一大堆的东西，怎样做修改能说只提取HTML里的标题和正文呢。我们针对的新浪里的新闻，我知道理论上来说是提取与，与之间的内容，大神啊具体我不会写代码...
jsoup 获取html中body内容_Jsoup解析Html中文文档
2020-12-22 02:00

weixin_39705069的博客 jsoup 简介Java 程序在解析 HTML 文档时，相信大家都接触过 htmlparser 这个开源项目，我曾经在 IBM DW 上发表过两篇关于 htmlparser 的文章，分别是：从 HTML 中攫取你所需的信息和扩展 HTMLParser 对自定义标签的...
没有解决我的问题, 去提问

如何用htmlparser修改html中标签的内容

5条回答 默认 最新

5条回答默认最新