例如:e.baidu.com我想取得那对标签之间的那个内容,即:e.baidu.com,请问该怎么进行操作?
1条回答 默认 最新
- oyj7454103 2010-07-28 13:28关注
这个不难吧!!
Parser parser;
try {
parser = new Parser("你腰抓取的url");
} catch (ParserException e) {
return null;
}
PrototypicalNodeFactory p = new PrototypicalNodeFactory();
p.registerTag(new Font());
parser.setNodeFactory(p);
NodeFilter filter = new NodeClassFilter(Font.class);
NodeList nodelist;然后 遍历这个 nodelist 就OK了! 细节问题可以参考下 API
// 抓取 指点标签的内容 font
class Font extends CompositeTag {
private static final long serialVersionUID = 1L;
private static final String mIds[] = { "font" };
private static final String mEndTagEnders[] = { "font" };public Font() { } public String[] getIds() { return mIds; } public String[] getEndTagEnders() { return mEndTagEnders; }
}
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报
悬赏问题
- ¥15 2020长安杯与连接网探
- ¥15 关于#matlab#的问题:在模糊控制器中选出线路信息,在simulink中根据线路信息生成速度时间目标曲线(初速度为20m/s,15秒后减为0的速度时间图像)我想问线路信息是什么
- ¥15 banner广告展示设置多少时间不怎么会消耗用户价值
- ¥16 mybatis的代理对象无法通过@Autowired装填
- ¥15 可见光定位matlab仿真
- ¥15 arduino 四自由度机械臂
- ¥15 wordpress 产品图片 GIF 没法显示
- ¥15 求三国群英传pl国战时间的修改方法
- ¥15 matlab代码代写,需写出详细代码,代价私
- ¥15 ROS系统搭建请教(跨境电商用途)