hdhsvygh123
2011-12-22 20:33
浏览 166
已采纳

关于htmlparser读取问题

我抓取的网页里面有这么一段:
[quote]

2011-12-22

Every drop you drink makes your life tastier!

点点滴滴,生活更美!——美汁源

2011-12-21

A good plan today is better than a perfect plan tomorrow.--Wag the Dog

今天的好计划胜过明天的完美计划。--《摇尾狗》

2011-12-17

We are what we repeatedly do. Excellence, then, is not an act, but a habit.

重复的行为造就了我们;因此,卓越不是一种举动,而是一种习惯。

2011-12-16

There is no elevator to success. You have to take the stairs.

成功没有电梯,只有一步一个脚印的楼梯。

2011-12-15

What we know or what we believe is, in the end, of little consequence. The only consequence is what we do.

我们知道的或相信的,本质上并不重要。唯一重要的是:我们做的。

[/quote]

现在我要读取成列表的形式。请问怎么读取呢?

日期 英文 中文
2011-12-22 Every drop you drink makes your life tastier! 点点滴滴,生活更美!——美汁源
2011-12-21 A good plan today is better than a perfect plan tomorrow.--Wag the Dog 今天的好计划胜过明天的完美计划。--《摇尾狗》

  • 写回答
  • 关注问题
  • 收藏
  • 邀请回答

3条回答 默认 最新

  • 爱上一条鱼 2011-12-30 21:18
    已采纳

    或者你换个思路

    TagNode应该是有getChildren()的方法获得及标签节点,tagNode.getChildren();
    还有nextNode()方法获取相邻节点

    你可以先获得

    的node
    然后getChildren()得到的节点以及
    的node
    然后同样的道理 获得
    的children节点
    已采纳该答案
    打赏 评论
  • 爱上一条鱼 2011-12-23 08:24

    可以用htmlparser处理的
    其实主要是这么两个类 一个是
    [code="java"]
    NodeFilter exampleFilter = new HasAttributeFilter("class", "example english");
    NodeFilter senFilter = new HasAttributeFilter("class", "sen");[/code]
    可以获取class为example english的标签类
    另一个是OrFilter 或者是 AndFilter
    [code="java"]Parser parser;
    OrFilter orFilter = new OrFilter();
    orFilter.setPredicates(new NodeFilter[] { exampleFilter , senFilter});
    NodeList nodelist = parser.parse(orFilter ); //获取class为example english和sen的标签[/code]

    打赏 评论
  • 爱上一条鱼 2011-12-23 08:28

    [code="java"]parser = Parser.createParser(htmlStr, "utf8");
    OrFilter orFilter = new OrFilter();
    orFilter.setPredicates(new NodeFilter[] { exampleFilter , senFilter});
    NodeList nodelist = parser.parse(orFilter ); //获取class为example english和sen的标签[/code]
    在给你个例子
    [url]http://hi.baidu.com/bi2000yi/blog/item/b2ca7110c40f97f5c3ce790c.html[/url]
    网上还有很多可以搜一下htmlparser例子参考一下

    打赏 评论

相关推荐 更多相似问题