scraperwiki：为什么我的刮刀适用于1个网址而不是另一个？

This is my first scraper https://scraperwiki.com/scrapers/my_first_scraper_1/

I managed to scrape google.com but not this page.

http://subeta.net/pet_extra.php?act=read&petid=1014561

any reasons why?

I have followed the documentation from here.

https://scraperwiki.com/docs/php/php_intro_tutorial/

And there is no reason why the code should not work.

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
doulei8475 2013-03-02 06:15
关注
It looks like you are specifying to find a specific element. Elements change dependent on the site you are scraping. So if it doesn't find the element you are looking for you get no return. Also I would look into creating your own scraping/spidering tool with curl. Not only will you learn a lot but you will find out a lot about how to scrape sites.

Also a side not you might want to consider abiding by the robots.txt file on the website you are scraping from or ask permission before scraping as it is considered impolite.

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

修复php图像刮刀代码，以便在不同情况下更灵活 php
2017-06-10 14:56

回答 1 已采纳 Using XPath is always a lot more flexible (although probably slower than other solutions). Using
如何执行PHP蜘蛛/刮刀但没有超时 php
2009-02-25 12:52

回答 4 已采纳 "nothing is displayed in the browser until the PHP execute is completed" You can use flush()
scrapy:我在 Elixir 中写的一个通用的刮刀，为了好玩
2021-06-24 18:15

刮痧一个用来爬东西的游戏爬虫
EasyHighTibia:一个带有刮刀的烧瓶项目，旨在帮助我的Tibia团队取得较高的排名
2021-04-04 12:21

EasyHighTibia EasyHigh是一种工具，可帮助分析胫骨战队中的玩家活动。考虑使用Tibia公会Zenobra Pune时就已经完成了。通过对玩家的TeamSpeak描述进行搜索，EasyHigh在不同来源中搜索有关所有玩家角色的数据，并将...
MultithreadedScraper:我需要一个研究项目的快速刮刀。我想出了一个高度多线程的 Java 抓取工具
2021-07-03 00:20

这个简短的 README 将涵盖以下几个方面：如何使用实施细则如何使用假设使用 Java（使用 JRE 1.6 测试），您可以使用以下命令开始抓取： // The first argument to the JAR is the URL// The second argument is ...
scraper-one:第一个仅使用 Java 的刮刀项目
2021-05-30 23:07

我花了一整天来解决这个问题:( jdk 1.7.0_51 上的 UTC+3 不正确使用 bash 运行 scraper-1.0-SNAPSHOT.jar 时遇到 java.lang.UnsupportedClassVersionError: Bad version number in .class file。在 Windows 上使用...
coursera_scraper:这是一个可以抓取的迷你coursera刮刀
2021-06-22 18:24

想看看 Coursera 提供什么？希望 Coursera 不会改变他们的页面结构，否则这个出色的程序将抓取的组织、作者、标题、开始日期和持续时间。项目信息 coursera 刮板有几个组件（见下文）。此抓取工具通过模仿浏览器...
SimpleScraper:只是另一个项目
2021-06-18 14:29

简单的 IMDB 刮刀这是一个非常基本的抓取工具，使用 Node.js 中的 Express、Cheerio 和 Request 库创建，用于学习网络抓取。给定一个电影 IMDB 页面的 URL，它检索有关电影名称、发行年份的信息， rating 及其主管...
教育科研-学习工具-一种壁纸刮刀.zip
2021-08-12 04:36

教育科研-学习工具-一种壁纸刮刀.zip
行业文档-设计装置-一种刮刀涂布纸生产装置.zip
2021-09-01 07:10

行业文档-设计装置-一种刮刀涂布纸生产装置.zip
行业资料-交通装置-一种刚性刮刀正反印小车装置.exe
2021-08-13 03:41

行业资料-交通装置-一种刚性刮刀正反印小车装置.exe
java提取网页源码表格数据-scrapers:来自网络的刮刀列表
2021-06-18 19:02

来自网络的刮刀列表。使用 . 它将展示整个列表，轻松导航到他们的优缺点，同时还提供指向各自网站的链接。请通过添加链接、添加优点/缺点、标题或其他任何您认为有帮助的内容来做出贡献！请帮助保持字母顺序。 ...
WebWallpaperCollector:一组墙纸刮刀实用程序，用于从 rss 提要不起作用的最喜欢的网站中提取图像
2021-07-04 07:05

网络壁纸收藏家一组墙纸刮刀实用程序，用于从 rss 提要不起作用的最喜欢的网站中提取图像。状态：开发中...
image-scrape:一个简单的图像抓取器，用于获取任何提供的 URL 中最大图像的 URL
2021-06-22 23:06

这里的 $client 对象是一个 Guzzle 客户端实例，而 $logger 位于与刮板相同的命名空间中。要获取任何 URL 上最大图像的来源： $scraper->getLargestImageUrl($url);脚本首先发出 head 请求。如果 'imageLinksOnly'...
crimescrape:小型 DC 犯罪刮刀
2021-07-09 20:37

犯罪爬虫这是一个非常简单的、单一用例的 DC ...####将 Xvfb 的显示编号设置为要使用的一个不同点（在这种情况下为：98）： $ Xvfb :98 -ac ####将环境显示编号设置为 98： $ export DISPLAY=:98 现在 selenium 脚
kvasir:葡萄酒专卖刮刀
2021-06-21 04:38

克瓦西尔葡萄酒专卖刮刀
捕鱼java源码-scrapert:一个通用的Web内容抓取工具，为自动收报机滚动条提供文本数据
2021-06-06 13:51

这是一个内容聚合器，用于为我计划构建的 LED 矩阵滚动自动收报机硬件项目提供输入。代码按原样提供，不提供任何保证和责任。代码、堆栈和架构可能会在我构建股票代码项目的过程中发生变化，恕不另行通知，因此...
thecoverproject-scraper:封面项目的刮刀
2021-05-31 11:59

封面项目刮板刮板示例用法抓取 Nintendo 64 (N64) 的 URL 包括： node . > n64.json
Movie Central:一个很棒的电影收藏经理-开源
2021-04-28 16:43

Movie Central是个人电影收藏经理。它是一个免费的桌面应用程序，用于创建和搜索个人电影收藏。以最简单的方式在PC中管理电影。它具有非常简单的UI，... 一个非常准确和快速的刮刀工具。您无需等待数小时即可完成。
行业分类-设备装置-一种宽幅壁纸涂布刮刀装置.zip
2021-08-21 12:46

行业分类-设备装置-一种宽幅壁纸涂布刮刀装置.zip
没有解决我的问题, 去提问

悬赏问题

¥17 pro*C预编译“闪回查询”报错SCN不能识别
¥15 微信会员卡接入微信支付商户号收款
¥15 如何获取烟草零售终端数据
¥15 数学建模招标中位数问题
¥15 phython路径名过长报错不知道什么问题
¥15 深度学习中模型转换该怎么实现
¥15 HLs设计手写数字识别程序编译通不过
¥15 Stata外部命令安装问题求帮助！
¥15 从键盘随机输入A-H中的一串字符串，用七段数码管方法进行绘制。提交代码及运行截图。
¥15 TYPCE母转母，插入认方向

scraperwiki：为什么我的刮刀适用于1个网址而不是另一个？

1条回答 默认 最新

悬赏问题

1条回答默认最新