webmagic如何批量爬取很多网站??(希望大神能够看问题详情在回答,谢谢各位大神了)

使用webmagic,怎么批量爬取一些网站(网站数量大概有100多个)??爬取的网站,爬出来的东西比较固定,大都是时间.内容,标题等等 ....难道要每个网站都手写一个类??有没有比较通用的方法,比如配置文件等方法解决???

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
让我摆渡吧 2016-06-02 09:13
关注
可以通过配置文件解决

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

java爬虫WebMagic框架爬取图片
2018-06-02 20:16

星尘Pro的博客 2.在使用之前，您需要了解正则表达式和XPath，大神请忽略二.下面是实现代码和分析 2.1添加maven依赖不知道maven的童鞋请参考https://my.oschina.net/huangyong/blog/194583 <dependency&g...
WebMagic爬取网站内容
2017-11-29 15:45

剑侠_紫藤萝瀑布的博客 WebMagic爬取网站内容一、WebMagic介绍 WebMagic是一个开源的Java爬虫框架，目标是简化爬虫的开发流程让开发者专注于逻辑功能的开发 WebMagic采用完全模块化的设计，功能覆盖整个爬虫的生命周期(链接提取、页面...
单片机、嵌入式的大神都平时浏览什么网站？
2022-10-27 20:12

嵌入式基地的博客单片机、嵌入式的大神都平时浏览什么网站？
有哪些网站用爬虫爬取能得到很有价值的数据？
2019-05-05 17:47

BC_COM的博客回顾2016年，我用爬虫做了很多事情。 1、微信好友的爬虫，了解一下你的好友全国分布，男女比例，听起来似乎是一个不错的想法，当然你还可以识别一下你的好友有多少人是用自己照片作为头像的，详细的内容可以点击...
网易大神app ios和android,网易大神app是干嘛的？网易大神有什么用？
2021-06-06 17:36

偃鼠的博客网易大神app是网易最近刚推出的一个玩家社区软件，让小伙伴在这个软件中交流的一个软件，很多小伙伴不是很清楚的这个软件是干嘛的。今天小编就为大家详细的介绍下这个软件的具体情况！网易大神是什么？「网易大神」...
使用webmagic爬取新浪微博热榜
2018-01-31 17:28

tcoding的博客这里没用用新浪微博给的官方api，直接使用webmagic爬取，网页版的有反爬虫策略，爬起来困难，这里爬取的是移动版本。经过分析微博的请求找到请求进行爬取。这里写的爬取热榜前30页的数据。 package usable; ...
Java爬虫-基于WebMagic爬取某豆瓣电影评论
2021-01-15 10:05

Victor.Chang的博客目的搭建爬虫平台，爬取某豆瓣电影的评论信息。准备 webmagic是一个开源的Java垂直爬虫框架，目标是简化爬虫的开发流程，让开发者专注于逻辑功能的开发...搭建好后打开项目，在us.codecraft.webmagic.processo...
面试指南（三）:想跳槽，这些问题你会了吗？
2021-12-18 21:17

当年的春天的博客郑重声明:这些面试问题并不是为了让大家在面试前进行突击，而是通过这些问题去检验自己面试前的准备，做到查漏补缺。面试指南系列面试指南（一）:想跳槽，你真的做好准备了吗？面试指南（二）:想跳槽，这些技术...
绝不误人子弟！零基础应该选择学习Java、PHP，还是前端？
2021-05-27 13:31

沉默王二的博客首先来说说 PHP，Web 蛮荒的年代，PHP 真的是王者姿态，连 Java 可能都要礼让三分，但近些年，PHP 只能做一些速成型的外包项目了，如果想增加更多的业务，想在性能上有所改善，PHP 就真的很难了！所以，本着不...
【粉丝福利社】30年经典助力！程序员如何在人工智能时代弯道超车？
2025-03-16 14:09

愚公搬代码的博客美国人工智能教育研究非营利机构TeachAI 联合计算机科学教师协会(CSTA)发布的《人工智能时代计算机科学教育未来指南》明确提出：“在人工智能时代，计算机科学比以往任何时候都更加重要。”计算机科学基础知识对于...
没有解决我的问题, 去提问

webmagic如何批量爬取很多网站??(希望大神能够看问题详情在回答,谢谢各位大神了)

3条回答 默认 最新

3条回答默认最新