vslimit 2008-11-06 12:21
浏览 281
已采纳

如何用htmlparser修改html中标签的内容

刚接触htmlparser,想用htmlparser解析字符串

测试文本一<input name="text1" type="text" value="text1">

测试文本二

Stirng sText="

测试文本一<input name="\&amp;quot;text1\&quot;/" type="\&amp;quot;text\&quot;" value="\&amp;quot;text1\&quot;">

测试文本二其他数据;\"; Parser parser = new Parser(); // parser.setURL parser.setInputHTML(sText); parser.setEncoding(parser.getEncoding()); NodeFilter filter = new NodeClassFilter(Span.class); NodeList list = parser.extractAllNodesThatMatch(filter); for (int i = 0; i < list.size(); i++) { if (list.elementAt(i) instanceof Span) { Span spanTag = (Span ) list.elementAt(i); textnode.setAttributeEx(textnode.getAttributeEx("name"));        if(spanTag .getAttribute("name").equals("first")){         spanTag .setAttribute("value", "bbb");       } } }

我已经用span过滤掉了其他内容,部分源码如上,我现在想将上面文本中的标签中的name="first"的value值改为"bbb",然后返回所有文本即改过的(sText),但是不能用sText.replace()方法,因为原文本中可能有多个value="aaa"的值.

 

大家有什么好的建议,最好是直接可以用htmlparser处理的.谢谢


问题补充:
非常感谢大家的帮忙,尤其是lzj0470和ferreousbox,上面的问题已经解决,

如果现在我想将字符串
"

测试文本一<input name="text1/" type="text" value="text1">

测试文本二其他数据;"
中的"测试文本二"替换成"此处已经被替换";即返回的字符串为:
"

测试文本一<input name="text1/" type="text" value="text1">

此处已经被替换其他数据;"

这样该怎么实现,因为span标签中还含有等标签,而我对正则表达式又不熟,所以,sText.replace()方法实现不了,还是要请教大家了,谢谢哈

  • 写回答

5条回答 默认 最新

  • iteye_8101 2008-11-06 22:46
    关注

    楼上的代码是正解,可以解决这个问题,但是返回的结果如果span元素还有parent元素的话就不正确了,当然前提是不知道要解析的html代码是什么样的,所以应该这样做:
    public String parse(String text) {
    String tmp = "

    " + text + "</html";
    NodeList list = Parser.createParser(tmp, "GB2312").parse(new TagNameFilter("body"));
    Node body = tmp.elementAt(0);
    body.accept(new NodeVisitor() {
    public void visitTag(Tag tag) {
    if (tag.getClass() != Span.clss) return;
    // replace attribute here,i ignore the code
    ......
    }
    });
    return body.toHtml();
    }
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(4条)

报告相同问题?

悬赏问题

  • ¥15 oracle集群安装出bug
  • ¥15 关于#python#的问题:自动化测试
  • ¥20 问题请教!vue项目关于Nginx配置nonce安全策略的问题
  • ¥15 教务系统账号被盗号如何追溯设备
  • ¥20 delta降尺度方法,未来数据怎么降尺度
  • ¥15 c# 使用NPOI快速将datatable数据导入excel中指定sheet,要求快速高效
  • ¥15 再不同版本的系统上,TCP传输速度不一致
  • ¥15 高德地图2.0 版本点聚合中Marker的位置无法实时更新,如何解决呢?
  • ¥15 DIFY API Endpoint 问题。
  • ¥20 sub地址DHCP问题