2 urartu urartu 于 2014.02.21 16:16 提问

htmlparser怎样获取标签中的部分文字

各位大神,我想用java写个小工具,可以把论坛中连载的帖子中楼主发言的部分转为txt保存,目前在处理网页时遇到了点问题。

网页中部分代码:

<div class="lz">
楼主帖子内容
<div class="pinglun">
本楼的回复内容
</div>
</div>

我想获取楼主帖子内容内容怎么办?我可以单独获取整个div节点中的文字,但是这样就需要剔除本楼的回复内容,怎样可以直接获取楼主帖子内容?或者怎样剔除也行。

Csdn user default icon
上传中...
上传图片
插入图片
准确详细的回答,更有利于被提问者采纳,从而获得C币。复制、灌水、广告等回答会被删除,是时候展现真正的技术了!