iteye_14321 2008-06-30 18:50
浏览 232
已采纳

对不规范的HTML如何使用XPath查询

刚接触ruby,目前需要用ruby做bot,遇到个棘手的问题

我发现REXML不能直接处理不规范的HTML (或者说非XHTML),
我做java的时候都是用htmlcleaner解决这个问题的,但是ruby就没啥概念了。

关于HTML的parser, 现在google下来也有好几个工具了

rubyful_soap
ymHtml
hTree

不过还是想问问各位都在用哪个开发包呢?

  • 写回答

1条回答 默认 最新

  • book_martinx 2008-07-01 09:41
    关注
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥15 调用transformers库
  • ¥100 c++集成继承python解析器遇到问题
  • ¥15 由于导出的数据名字中带有/,导致Matlab打不开,怎么办?
  • ¥15 新硬盘安装的程序总是崩溃,提示遇到错误
  • ¥15 openpcdet自制数据集评估bev精度和3d精度相同
  • ¥15 excel 上下按钮 显示行
  • ¥20 云卓h12pro 数传问题
  • ¥20 请问有人知道怎么用工艺库里面的sdb文件通过virtuoso导出来library里面每个cell的symbol吗?
  • ¥20 海思 nnie 编译 报错
  • ¥50 决策面并仿真,要求有仿真结果图