iteye_5267
iteye_5267
2009-07-15 12:02

请教JAVA PARSE NETSCAPE BOOKMARK.HTML 的问题

已采纳

请问如何把NETSCAPE BOOKMARK.HTML 解释并把书签目录和书签转换成JAVA OBJECT呢?

请有例子程序的共享一下,谢谢了

请有心人士加我QQ,知道一下也可以.

QQ:41567494
[b]问题补充:[/b]
还有就是BOOKMARK里面是有父子关系的,请问怎么把当前的ENTRY的父亲找出来呢?
[b]问题补充:[/b]
pJun:

我已经写了PARSE BOOKMARK.HTML的代码了.

现在就卡在父子结构这个难题上.

我是
1.用SWING的HTML PARSER直接PARSE的.
2.用LINKEDLIST储存获得的VALUE.
3.ENTRY的层次和PARENT ID,这两个VALUE我真的不知道怎么计算了...想了一晚.

  • 点赞
  • 写回答
  • 关注问题
  • 收藏
  • 复制链接分享
  • 邀请回答

5条回答

  • pjuneye pjuneye 12年前

    我查看了一下到处的Bookmark Html格式,他是通过
    [code="html"]


    帮助和教程
    自定义 Firefox
    我也要参与
    关于我们

    [/code]

    通过DL/DT的层次结构可以找出父子关系,不过这个关系上面没有类似于Pid的标示. :?
    应该在转换成XML后,解析XML加上一个标示,或者在XML转JAVA对象的时候加上个标示.

    点赞 评论 复制链接分享
  • wanghaolovezlq wanghaolovezlq 12年前

    自己定义一个数据结构嘛

    class entry
    {
    string parentid;
    string value;
    string id;

    }

    点赞 评论 复制链接分享
  • pjuneye pjuneye 12年前

    :D 还有要注意的是 DL/DT嵌套可以出现多层.

    点赞 评论 复制链接分享
  • pjuneye pjuneye 12年前

    我的思路是这样的
    html->xml->JavaObject

    html--> xml : 利用tidy组件来处理.
    xml-->Javaobject : 利用Digester组件来搞定

    参考在这里

    [quote]
    用 HTML Tidy 将 HTML 转换成 XML
    http://www.ibm.com/developerworks/cn/xml/x-tiptidy/index.html
    [/quote]
    [quote]
    利用Digester把XML转换为Java对象
    http://www.cnblogs.com/bjzhanghao/archive/2005/03/25/125747.html
    [/quote]

    点赞 评论 复制链接分享
  • wanghaolovezlq wanghaolovezlq 12年前

    自己用xml或html解析组件去解析嘛,

    应该不难,jdom,htmlparser等

    点赞 评论 复制链接分享

相关推荐