leisibian
2009-12-22 12:03
浏览 237
已采纳

dom4j解析xml的问题

xml存放的图片如下:

<?xml version="1.0" encoding="utf-8"?>
   <datas>
     <data>
       <value>
          ????&#0;&#16;JFIF&#0;&#1;&#1;&#1;&#0;&amp;#0;&#0;&#0;??           &#0;C&#0;&#3;&#2;&#2;&#3;&#2;&#2;&#3;&#3;&#3;&#3;&#4;&#3;&#3;&#4;&&#17;&#0;&#2;&#1;&#2;&#4;&#4;&#3;&#4;&#7;&#5;&#4;&#4;&#0;&#1;&#2;w&#0;&#1;&#2;&#3;&#17;&#4;&#5;!1&#6;&#18;AQ&#7;aq&#19;"2?&#8;&#20;B???? #3R?&#21;br?
&#22;$4?%?&#23;&#24;&#25;&#26;&amp;'()*56789:CDEFGHIJSTUVWXYZcdefghijstuvwxyz??????????????????????????????????????????????????????????????????????????&#0;&#12;&#3;&#1;&#0;&#2;&#17;&#3;&#17;&#0;?&#0;?S???/
?V&#11;o?/?N5?&#16;K
????pYO?&#11;?m&#18;???SI?[??-?a?*m??&#1;@???&#16;RRm?????6?&#5;8??k+?)~???^#&#23;?O?^???,??b?S????:sEmo?\-?????;??F&amp;#0;?Vg&amp;#28;??[Z??&amp;#23;??&amp;#14;?B????g{?Ou&amp;#29;?????p???S&amp;#2;&amp;#24;?&amp;#26;?^&amp;lt;m81?&amp;#5;?C? o+?????N???O?m??<br />?v?????&amp;#0;?-?T???_?V??&amp;#26;V?i?O&amp;#16;j6:??6?k?@l????&amp;#19;??&amp;#21;??g&amp;#11;&amp;#23;?nw&amp;#19;&amp;#23;?????&amp;amp;?o?j?&amp;#3;???&amp;#0;?O?&amp;#31;??????_???????&amp;lt;??}?????&amp;#0;w?????|??RXj?h??&amp;#0;_???&amp;#14;???K?&amp;#0;^~[??E&amp;#20;W1?&amp;#20;QE&amp;#0;&amp;#20;QE&amp;#0;&amp;#20;QE&amp;#0;&amp;#20;QE&amp;#0;&amp;#20;QE&amp;#0;&amp;#20;QE&amp;#0;&amp;#21;?????????????OY???&amp;#27;X4????W?&amp;#8;?Kx$???&amp;#11;??|??m???0A?L??????QAI5{???L??V4???????O?????&amp;#18;jZ<br />???&amp;#31;&amp;#16;H??&amp;#30;(??%??Q?F&amp;lt;?fT?b?wmh?BA$??????&amp;#14;??on5&amp;#8;?&amp;#27;&amp;#29;&amp;#31;]?l???z&amp;#15;&amp;#17;&amp;#22;??&amp;#19;?????"???&amp;#22;[?1,??A&amp;#28;(&amp;lt;?V&amp;#8;??7?&amp;#30;????&amp;gt;??vz???&amp;#0;?????v???????N???7???&amp;gt;1?k?&amp;gt;&amp;#17;??Z??? ??&amp;#27;?R??O?=?s&amp;#27;???U2&amp;#11;e@?[?K?EP-?@?=&amp;#7;???:???n??ko ??\??g?&amp;#0;<br />?[}D??/u4_jh?^[K+??{?&amp;#17;&amp;#29;???(?&amp;#30;?S??{??_?Y51???:[u???P?????#i?&amp;#0;??h?????#i?&amp;#0;??h???&amp;#5;????&amp;#8;????IC?L?&amp;#0;?????&amp;#0;_???L?&amp;#0;?????&amp;#0;_???<br />????k-???Z?D???g&amp;#8;???$?&amp;#5;&amp;#0;V?????#i?&amp;#0;??h?????#i?&amp;#0;??k???i??z$?&amp;#21;???1N<br />??????&amp;#26;?g?W|$??$^:?&amp;#21;???/&amp;#16;??@??QN???GG??5~G?3?????&amp;#8;????&amp;#0;&amp;#26;?????&amp;#8;????&amp;#0;&amp;#26;???)??[c??&amp;#19;U???3?:?u?A??T?&amp;#31;j???M]&amp;#24;4??(o???&amp;#17;??&amp;#0;???4o???&amp;#17;??&amp;#0;???5~?k?&amp;#0;?&amp;#2;???O?&amp;#4;?&amp;#17;~?(?&amp;#2;?(?&amp;#2;?(?&amp;#2;?(?&amp;#2;?(?<br />&amp;#26;&amp;#7;????????&amp;#0;A&amp;#21;~?h&amp;#31;?&amp;#2;??????&amp;#4;T^)??K???y&amp;#21;?&amp;#22;-o&amp;#3;?n?#2G<br />??r???&amp;#25;;r3?dg4??M????G?|l??&amp;#31;??6?o?.??s\7?e???&amp;#25;??1?6&amp;#4;!I??&amp;#25;'??x???g_??&amp;#26;l^???&amp;#4;?;O&amp;#6;?&amp;gt;?PC?@X?dS?&amp;#27;?@?8?O??&amp;#30;???&amp;#3;????&amp;#19;????W??G&amp;#29;?^@???J?T?&amp;#2;DY<br />&amp;#16;??&amp;#21;w&amp;#1;?_,??????~8???z??I5?+T??????n???&amp;#20;1D6?IB$;?|?&amp;#4;??R??2??^mE???i???&amp;#7;?U?G-??B ?Z????m??P????Y?k?&amp;#27;<br />^?{+?_?Cp?a??#!?? ?Y&amp;#30;&amp;#18;????u?{&amp;#27;He?I\"?&amp;#2;&amp;#23;?C??Q?&amp;amp;???_?=C????u]w??&amp;#27;?&amp;#24;?&amp;#11;S??ugQ????X?&amp;#15;v+)&amp;#7;?h???5??0kz7??&amp;#0;??&amp;#0;&amp;#17;&amp;gt;2j?t??~&amp;#31;{{&amp;#8;m??&#3;?~k)&lt;&#2;|??x?[??Y???)a??z????j&#25;?e?x?&#29;V???&#0;"???c???&#16;?kz$?C?&#12;ghMO?????;}&gt;Vo?+??&#24;???$??V?&#25;???&gt;&#31;&#22;v?L?v?????S?K!&#7;??&#0;y ??????Y????&#17;?-?&#15;?WZ??q???Wz????Y&#11;??UU?&#12;cw??~:(5??&#0;&#15;&gt;(j????p&lt;g?97?????zq?S???"a
?G??? =?=?&#22;"???'???a???Z{4??x????**&#24;?/{D??????v?&#17;]??&lt;.??"?GS???&#8;???&#0;???&#31;????&#0;A5??
?&#30;?????^?????&#14;?Z????0e??D??? ????&#7;&#3;?e??&#0;?&#11;Q?&#0;?i??&#19;^?)????Tx&#21;i?S?&#31;F_??+S ??(&#0;??(&#0;??(&#0;??(&#2;???&#0; -;????&#0;?EY???&#22;????)e $?(Ol?Um&#3;?@Zw?{G?&#0;???@l~~Z??H?U????O?????7?v???7?
K??-?y&#3;? ??FH;NN??&#29;[? q?&#27;?bK?
?I?~???}???wn??&#23;_?&#17;YK&#1;??&#31;?k????&#21;???m? ?r??uM2&#31;#S??r?&#22;??d&#0;uh?s?i?LW?pO&#21;?&#7;B&#27;???Ic*???&#7;&#27;?u????&#14;?i&#8;?R????&gt;?????&#4;?&#28;?????I'????SQ?omd???1?7&gt;P????j???T??gg?&#12;?&#20;?&#31;??&#25;q???xc? ??{&#24;??9O??O&#24;bv02&#21;??(??&#2;?A?G??U?]??&#7;{?&#6;W???&#28;?&#15;W????&#28;`??????
     </value>
   </data>
</datas>
因为里面包含特殊字符:&#0

加载xml

SAXReader saxReader = new SAXReader();  
Document document = saxReader.read(new File("F://2.xml"));

报如下错误:

[Fatal Error] 2.xml:2:29: Character reference "&#0" is an invalid XML character.
Exception in thread "main" org.xml.sax.SAXParseException: Character reference "&#0" is an invalid XML character.
at org.apache.xerces.parsers.DOMParser.parse(Unknown Source)
at org.apache.xerces.jaxp.DocumentBuilderImpl.parse(Unknown Source)
at javax.xml.parsers.DocumentBuilder.parse(DocumentBuilder.java:172)
at test.Test.main(Test.java:51)

有谁碰到过,谢谢帮我解答

问题补充
网上找了好久 也没解决方案 sax碰到像 &#0的字符 就解析不了,哎

  • 写回答
  • 关注问题
  • 收藏
  • 邀请回答

3条回答 默认 最新

  • iteye_5785 2009-12-22 12:03
    已采纳

    内容部分用base64编码一下看看,就不会有特殊字符了

    已采纳该答案
    打赏 评论
  • 山月无涯 2009-12-22 14:39

    xml里乱码可以用CDATA,也可以把内容部分用URLEncoder.encode(String,"UTF-8")处理一下,使用端比如flash和js都只要unescape()一下就可以用了,其他程序也是一个decode就可以了。

    xml里存放图片?不是图片的url链接地址?

    打赏 评论
  • iteye_5215 2009-12-22 16:45

    首先你确定你的xml源字符是不是有问题, 有些字符问题用文本方式是查看不到的, 而这些字符确实在xml中存在, 还有为什么不用jaxb呢?dom4j你的level是多少? 小心有问题哦, 而且还会和jdk里面的冲突

    打赏 评论

相关推荐 更多相似问题