如何停止谷歌抓取未来页面

When I was developing my site. I made a typo in one place, for example, all my pages are dir1/dir2/page.htm/par1-par2, but my typo was dir1/dir2/page/par1-par2 (note: without .htm).

It was in production for 1 day only, but Google is keep crawling those links. How to stop Google doing that?

By the way, that's not 1 page, but hundreds or thousands of pages.

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
doujia3441 2012-07-15 03:35
关注
Try use robots.txt to deny access to this page (url)

http://www.robotstxt.org/robotstxt.html

http://support.google.com/webmasters/bin/answer.py?hl=en&answer=156449

test robots.txt here : http://www.frobee.com/robots-txt-check/

patterns must begin with / because robots.txt patterns always match absolute URLs. * matches zero or more of any character. $ at the end of a pattern matches the end of the URL; elsewhere $ matches itself. * at the end of a pattern is redundant, because robots.txt patterns always match any URL which begins with the pattern.
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

如何停止谷歌抓取未来页面 php
2012-07-15 03:21

回答 3 已采纳 Try use robots.txt to deny access to this page (url) http://www.robotstxt.org/robotstxt.html htt
关于谷歌抓取php页面 php
2012-06-23 01:19

回答 1 已采纳 Sign up to Google Webmaster Tools: http://www.google.com/webmasters/ So you will know better what
PHP循环抓取多个URL页面时，抓着抓着就停止了，该怎么办？ php
2019-04-02 19:59

回答 3 已采纳 set_time_limit(0); 加上这个可以循环完
Google PageRank 的过去、现在和未来
2021-11-27 10:44

海拥✘的博客 Google PageRank 的过去、现在和未来PageRank的过去原始 PageRank 公式PageRank 操纵漏洞和 Google 对链接垃圾邮件的战争PageRank的存在今天是否应用了 PageRank 算法？PageRank 的随机冲浪者与合理冲浪者模型链接位
抓取header.php的页面名称 php
2014-05-07 21:09

回答 2 已采纳 Your page should define its own title. But, if you really want to do it this way, here's a possib
求教大神！我抓取到一个页面，但是我想得到这个页面中的值，该怎么办？ java
2017-03-14 08:35

回答 1 已采纳 getElementsByClassName() 这个函数可以，你可以查查用法
php使用curl爬取页面,json数据获取不完整 json php 有问必答
2021-08-02 16:03

回答 2 已采纳你访问的是同一个url?你爬取的是列表内容。并没有去请求详细内容
百度搜索关键字抓取_如何做搜索引擎优化？这十大细节必看
2020-11-27 03:11

weixin_39872334的博客 DIV+CSS技术能更好的控制页面布局，表现和内容分离，大大缩减页面代码，浏览速度快，使“蜘蛛”更轻易的抓取内容并增加收录。DIV+CSS技术应用相对灵活，甚至可以用标签制作菜单和图片列表，且自适应技术能完全满足...
从当前页面抓取子文件夹和文件名 php
2017-10-22 08:22

回答 1 已采纳 You can use $_SERVER['PHP_SELF'] and cut filename extension and leading slash, so resulted express
使用php从谷歌财务中抓取数据 php
2014-06-15 18:49

回答 1 已采纳 I would use a DOM parser and XPath to select the content of that span tag. Like this: $url = 'htt
php curl 抓取taobao评价出现中文乱码 php 阿里云
2018-11-23 09:32

回答 1 已采纳是不是数据库传输的数据乱码？如果是的话在链接的时候加上charset=utf8
php数据库redios_PHP开发者应了解的24个库
2021-01-12 11:51

珞珈Carlos的博客作为一个PHP开发者，现在是一个令人激动的时刻。每天有许许多多有用的库分发出来，在Github上很容易发现和使用这些库。下面是收集整理的24个库。大家一起来看看吧。1. Dispatch：微框架Dispatch是一个PHP小框架。它...
PHP抓取内容 - 电子邮件 php
2015-12-21 01:50

回答 1 已采纳 there's a problem in the logic of your code, I think this will solve your problem: <?php ses
宋登高 php,HDwiki百科建站讲座第一期
2021-05-08 06:22

weixin_40008339的博客演讲题目：回顾过去，展望未来——HDwiki产品发展历程演讲嘉宾：宋登高大家好，我是负责开源HDwiki的技术人员，今天我来给大家分享下HDwiki的历史还有我们真实的想法。HDwiki产品历史介绍：互动百科系统(HDwiki)...
PHP开发者应了解的24个库
2016-06-28 14:20

GISEarth的博客作为一个PHP开发者，现在是一个令人激动的时刻。每天有许许多多有用的库分发出来，在Github上很容易发现和使用这些库。下面是我曾经遇到过最酷的24个库。你最喜欢的库没有在这个列表里面？那就在评论中分享吧！ 1...
没有解决我的问题, 去提问

悬赏问题

¥100 set_link_state
¥15 虚幻5 UE美术毛发渲染
¥15 CVRP 图论物流运输优化
¥15 Tableau online 嵌入ppt失败
¥100 支付宝网页转账系统不识别账号
¥15 基于单片机的靶位控制系统
¥15 真我手机蓝牙传输进度消息被关闭了，怎么打开？(关键词-消息通知)
¥15 装 pytorch 的时候出了好多问题，遇到这种情况怎么处理？
¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
¥15 手机接入宽带网线，如何释放宽带全部速度

如何停止谷歌抓取未来页面

3条回答 默认 最新

悬赏问题

3条回答默认最新