2 u011413463 u011413463 于 2016.04.19 21:57 提问

java如何解析含有html内容的xml文件

是这样的,现在有个xml文件,实际上是个只有头部是xml标签的文件,内容主体是html写成的,现在想要解析这个xml文件,提取其中的数据,不知该用何种方法。
试过dom4j和jsoup,这两个一个适合用来解析纯xml文件,一个适合解析纯html文件,但是不知如何解析嵌套在xml文件里的html文件。这是我要解析的xml文件截图一部分:
图片说明

这是xml文件的一部分:
<?xml version="1.0"?>

-

-


……


请各路大神指点迷津。

5个回答

CSDNXIAOD
CSDNXIAOD   2016.04.19 22:02

java解析xml文件获取节点内容
----------------------biu~biu~biu~~~在下问答机器人小D,这是我依靠自己的聪明才智给出的答案,如果不正确,你来咬我啊!

devmiao
devmiao   Ds   Rxr 2016.04.20 05:52
baidu_33497625
baidu_33497625   2016.04.20 11:26

这个有好几种方法的,可以用dom4j,可以用sax,也可以用jdom;这几种方式各种特点,你需要根据业务去判断用哪个

w172087242
w172087242   Ds   Rxr 2016.04.20 14:34

需要先从html的整体文本中正则捕获出xml文件,然后才能选用dom4j之类的解析器进行解析

kyomiang
kyomiang   2016.04.20 15:05

Elements urlem = dom.getElementsByTag("model")
e.select("[salesnum=14609]").attr("date")
jsoup 不知道行不行。

Csdn user default icon
上传中...
上传图片
插入图片
准确详细的回答,更有利于被提问者采纳,从而获得C币。复制、灌水、广告等回答会被删除,是时候展现真正的技术了!