LY丶Smile 2015-12-14 06:37 采纳率: 0%
浏览 1540

关于网络爬虫的一些问题(java)

爬虫的功能需求
1.需要爬取海量数据
2.爬取过程可能需要很久,几个月甚至一年
3.将爬取的数据保存起来作为语料库使用
4.需要提取网页中特定的信息,比如百度百科中的关于股票的所有词条信息或者其他网站的股票信息

问题:
选取什么样的爬虫比较合适,存放地点是选择mysql数据库好还是其他

  • 写回答

3条回答 默认 最新

  • 云霏阳 2015-12-14 06:56
    关注

    1.可以考虑使用python来实现爬虫;
    2.存储如果不考虑效率的话,可以使用数据库。

    评论

报告相同问题?

悬赏问题

  • ¥15 k8s部署jupyterlab,jupyterlab保存不了文件
  • ¥15 ubuntu虚拟机打包apk错误
  • ¥199 rust编程架构设计的方案 有偿
  • ¥15 回答4f系统的像差计算
  • ¥15 java如何提取出pdf里的文字?
  • ¥100 求三轴之间相互配合画圆以及直线的算法
  • ¥100 c语言,请帮蒟蒻写一个题的范例作参考
  • ¥15 名为“Product”的列已属于此 DataTable
  • ¥15 安卓adb backup备份应用数据失败
  • ¥15 eclipse运行项目时遇到的问题