无法刮掉谷歌

I'm trying to scrape google for reverse image search results using Goutte (its basically a wrapper around Guzzle + Symfony DOM parser).

I'm doing:

$googleURL = "https://www.google.com/searchbyimage?&image_url=".$imageURL;

$crawler = $client->request('GET', $googleURL);
$client->followRedirects(true);
print_r($crawler,1);

.. and the output (https://paste.ee/p/spfYA) contains the correct URL but the body (HTML) is of the default search page, the one without results.

What should I do to get the search results as HTML.

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
doujiene2845 2015-02-08 08:02
关注
All I had to do was set the user-agent:

$client->setHeader('User-Agent', 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/40.0.2214.111 Safari/537.36');
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

无法刮掉谷歌 php symfony
2015-02-08 06:59

回答 1 已采纳 All I had to do was set the user-agent: $client->setHeader('User-Agent', 'Mozilla/5.0 (Macinto
PHP CURL - 当你只知道id时刮掉seo url php
2018-08-10 10:52

回答 2 已采纳 Curl provides the option CURLOPT_FOLLOWLOCATION. curl_setopt($curl, CURLOPT_FOLLOWLOCATION, true)
刮动态内容PHP php
2019-07-01 14:04

回答 1 已采纳 When you click the Info button new ajax call occurs. You can see that in dev tools (inspect) -&gt
openwrt路由器php-cli,【在openwrt无线路由器上部署freeswitch+fusionpbx (原帖恩山论坛)】-网关论坛-ZOL中关村在线...
2021-04-15 16:17

周陆啦的博客前言：freeswitch是目前开源最火的软交换系统，fusionpbx则是其gui管理界面（只有E文版本），同样也是开源。freeswitch相比asterisk功能和性能都要强大很多，毕竟...稳定版本二、安装应用 php部分 opkg install ...
用PHP刮取页面 php
2019-01-08 10:14

回答 1 已采纳 A very quick look at the page https://www.soccerstats.com/matches.asp showed that what the "cookie
刮掉onclick网址 php
2014-03-05 21:03

回答 2 已采纳 This should do it : $onClicks = array(); $dom->loadHTML($html); foreach($dom->getElements
如何用PHP刮掉SERP（适用于小项目） php
2013-11-15 22:10

回答 2 已采纳 There's three main ways to do this. Firstly, use the official API for the search engine you're usi
10 种网页抓取而不会被阻止的方法
2023-08-06 14:52

无水先生的博客让我们回顾一下我们在这篇文章中看到的反块技巧：防刮板块解决方法由 ZenRows 支持请求数受 IP 限制轮换代理 ✅ 数据中心 IP 被阻止高级代理 ✅ Cloudflare 和其他反僵尸系统避免可疑请求和逆向工程 ...
使用PHP刮掉完整的图像src php
2009-07-21 23:00

回答 2 已采纳 You don't need a regex... just some patience. I don't really want to write the code for you, but j
刮google图像结果php php
2011-01-13 01:00

回答 2 已采纳 Google provides an image search api: http://code.google.com/apis/imagesearch/. You should try to u
PHP str_replace使用通配符刮取内容？ php
2018-08-17 20:23

回答 3 已采纳 Well maybe my question wasn't that good written. I had a table which I needed to scrape from a web
谷歌招聘机制
2016-04-21 14:56

brain_ning的博客　关于校招，如何得到Google的工作机会?谷歌已经说的很清楚了。但还有另一条途径：学生还可以通过「实习+转正」获得Google的工作机会，并且这个途径与直接申请全职相比过程要简单一些，录取几率也相对大一些。　·...
PHP Dom刮取大量数据 php
2013-07-10 07:26

回答 1 已采纳 Fatal is thrown probably because $html or $row is not an object, it becames null. You should alway
word中将空格替换为_以编程方式在网页中将Microsoft Word文档显示为图像
2020-07-18 22:42

cunchi8090的博客刮掉docs.google.com作为docid参数 (1. Scrape docs.google.com for the docid parameter) Download the PHP Simple ...
selenium 解析网页_用Selenium进行网页搜刮
2020-08-08 09:57

weixin_26713521的博客在上面的示例中，该终止过程已被注释掉，以在浏览器窗口中显示输出。并且，如果终止，浏览器窗口也将关闭，阅读器将无法看到输出。示例2 —从OpenAQ收集污染数据 (Example 2 — Scraping Pollution data from ...
传来自南开BBS食品工程学学生爆的内幕（未考证）
2009-01-04 09:03

nlslzf的博客本文来源于冰山上的播客 http://xinsync.xju.edu.cn , 原文地址：http://xinsync.xju.edu.cn/index.php/archives/3721 作为一个食品专业的本科生我对我们专业是彻底失望了想当初系主任展望我们专业的美好...
完美实现刮刮乐抽奖（该有的都有），html+css+jquery实现
2022-10-17 18:05

低价多销的博客 div> label> div> *收货信息一经提交无法修改div> div> <div class="updata-btn"> 提交 div> div> div> 4.源码下载 5.题外话，demo 采用了画布实现 canvas HTML5新增标签 Canvas API（画布）是在HTML5中新增的标签...
一根网线发起的攻击，大学趣事，当上项目经理才知道
2024-04-19 05:52

2301_78398209的博客立即找来一根网线，减掉一边的水晶头，刮掉外皮，然后把对应的四股两两粘上。果然，附近的寝室开始传来 —— 不，先是寂静了几秒，接着陆续传来的尖叫声，吼声。“卡了！”，“谁掉了？“，什么情况？”，“靠，...
前端面试笔记随笔---kalrry
2022-04-05 17:37

kalrry的博客面试笔记---kalrry第一部分：HTML5+CSS31、父元素和子元素宽高不固定，如何实现水平垂直居中2、分别实现骰子中的'一点' 和 '三点' 的布局。3、简述选择器~和+的区别。4、简述box-sizing的有效值以及所对应的盒模型...
2万字软件测试面试题干货带答案，反手我就一个收藏
2022-06-14 15:12

测试小扎的博客需求分析、编写测试用例、评审测试用例、搭建环境、等待程序开发包、部署程序开发包、冒烟测试、执行具体的测试用例细节、Bug 跟踪处理回归测试、N 轮之后满足需求，测试结束第一类标准：测试超过了预定时间，则停止...
没有解决我的问题, 去提问

悬赏问题

¥15 基于卷积神经网络的声纹识别
¥15 Python中的request，如何使用ssr节点，通过代理requests网页。本人在泰国，需要用大陆ip才能玩网页游戏，合法合规。
¥100 为什么这个恒流源电路不能恒流？
¥15 有偿求跨组件数据流路径图
¥15 写一个方法checkPerson，入参实体类Person，出参布尔值
¥15 我想咨询一下路面纹理三维点云数据处理的一些问题，上传的坐标文件里是怎么对无序点进行编号的，以及xy坐标在处理的时候是进行整体模型分片处理的吗
¥15 CSAPPattacklab
¥15 一直显示正在等待HID—ISP
¥15 Python turtle 画图
¥15 stm32开发clion时遇到的编译问题

无法刮掉谷歌

1条回答 默认 最新

悬赏问题

1条回答默认最新