wangjia1110 2010-01-12 20:16
浏览 240
已采纳

局域网web应用搜索引擎选哪种架构好呢?????

[size=medium]请教一下大家,我想做一个系统页面抓取系统,这个功能就是可以把我这内网局域网的

其他正运行着的web系统的某个链接得到以后可以把该页面的显示的表格等数据内容抓取出来并显示在我的

系统页面上,相当于可以是个系统功能结果的汇集吧。

不知道采取什么样的技术实现,需要用到搜索引擎的爬虫技术吗??望有经验者赐教!感谢![/size]
[b]问题补充:[/b]
[size=small]我只是想知道我这样的需求,是否需要采用搜索引擎技术?还是单独获取每个页面的HTML然后解析HTML就可以呢?[/size]
[b]问题补充:[/b]
[size=medium]MASHUP需要每个需要柔和的系统提供相应的API,我这里还有一些老系统,难道要对每个系统都进行适应性的改造吗?不太现实啊,可能我需要的只是每个系统页面的结果HTML信息提取再重新重组吧,如何实现呢?[/size]

  • 写回答

5条回答 默认 最新

  • wanghaolovezlq 2010-01-14 10:34
    关注

    没必要用搜索引擎技术,
    单独获取每个页面的HTML然后解析HTML就可以了
    这就是mashup的变体而已,

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(4条)

报告相同问题?

悬赏问题

  • ¥30 软件自定义无线电该怎样使用
  • ¥15 R语言mediation包做中介分析,直接效应和间接效应都很小,为什么?
  • ¥15 Jenkins+k8s部署slave节点offline
  • ¥15 微信小游戏反编译后,出现找不到分包的情况
  • ¥15 如何实现从tello无人机上获取实时传输的视频流,然后将获取的视频通过yolov5进行检测
  • ¥15 WPF使用Canvas绘制矢量图问题
  • ¥15 用三极管设计一个单管共射放大电路
  • ¥15 孟德尔随机化r语言运行问题
  • ¥15 pyinstaller编译的时候出现No module named 'imp'
  • ¥15 nirs_kit中打码怎么看(打码文件是csv格式)