2 urartu urartu 于 2014.02.21 16:16 提问

htmlparser怎样获取标签中的部分文字

各位大神,我想用java写个小工具,可以把论坛中连载的帖子中楼主发言的部分转为txt保存,目前在处理网页时遇到了点问题。

网页中部分代码:

<div class="lz">
楼主帖子内容
<div class="pinglun">
本楼的回复内容
</div>
</div>

我想获取楼主帖子内容内容怎么办?我可以单独获取整个div节点中的文字,但是这样就需要剔除本楼的回复内容,怎样可以直接获取楼主帖子内容?或者怎样剔除也行。

Csdn user default icon
上传中...
上传图片
插入图片