如何阻止spyder / Nutch-2等爬虫访问特定页面？

I have a Windows client application that consumes a php page hosted in a shared commercial webserver.

In this php page I am returning an encrypted json. Also in this page I have a piece of code to keep track of which IPs are visiting this php page, and I have noticed that there is a spyder/Nutch-2 crawler visiting this page.

I am wandering how is possible that a crawler could find a page that is not published in any search engines. I there a way to block crawlers from visiting this specific page?

Shall I use .htaccess file to configure it?

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
douzhongqiu5032 2014-04-15 13:13
关注
You can indeed use a .htaccess. robots.txt is another option but some crawlers will ignore this. You can also block specific user agent strings. (They differ from crawler to crawler)

robots.txt:

User-agent: * Disallow: /

This example tells all robots to stay out of the website: You can block specific directories

Disallow: /demo/

More information about robots.txt
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python/spyder/pygame python 有问必答
2021-07-27 18:19

回答 1 已采纳可以的。使用pygame可以制作一些小游戏
如何用Spyder，字典内值的比较？(语言-python) python 有问必答
2022-03-16 16:26

回答 3 已采纳 dic = {'zhang': 180, 'wang': 160, 'Li': 175, 'zhao': 170, 'ding': 165} for k, v in dic.items():
python 中jieba安装成功，但是为什么spyder里运行不起 python 有问必答
2022-10-13 09:11

回答 3 已采纳题主电脑中有多个版本的python，安装jieba的python根据路径显示的是python3.9，而运行脚本的python版本是3.8.8 Python 3.8.8(default, Apr 13
the following arguments are required: -i/--images, -o/--output错误解决方法
2021-07-19 15:25

电子信息er的博客最近在学习利用OpenCv和Python实现图像拼接，操作的环境时Anaconda下的Spyder编译器，参考资料为博主@W_Toetoise所翻译的英文博客《使用OpenCV和Python拼接图像》，教程写的很翔实，很有启发性，但是对于新手来说，...
anaconda-navigator以及附属jupyter及spyder无法打开？ python
2021-05-15 13:57

回答 1 已采纳已解决，依据中间代码： Python runtime state: initialized File "D:\anaconda\lib\site.py", line 87 USER_SI
Spyder一用input之类的就提示遇到一个内部错误，如何解决？(语言-python) python 有问必答
2022-04-08 19:37

回答 2 已采纳可尝试卸载后重新安装，从此处下载安装：https://github.com/spyder-ide/spyder/releases/tag/v5.0.3
spyder显示目录名称无效怎么办啊 python
2022-05-24 12:27

回答 1 已采纳 os.chdir()方法是改变工作路径吧，你这里D:\m2.txt不是一个可用的文件夹路径
spyder 导入模块/库--以jieba为例
2021-03-31 21:05

木木酱子-的博客之前学过给python导入所需模块/库，操作步骤为：打开命令提示符–>...在电脑上搜索Anaconda Prompt，之后输入pip install jieba，等待安装，安装完成后在spyder正常导入就没问题啦。 import jieba ...
为什么安装Anaconda后，打不开Spyder，一直闪退？ python
2022-04-16 11:01

回答 1 已采纳 https://blog.csdn.net/m0_49197030/article/details/123382751https://blog.csdn.net/qq_43102225/article
Spyder用input方法提示遇到一个内部错误，应该如何解决呢？(python) python
2022-05-22 11:00

回答 1 已采纳解决方法： 1、使用spyder的 Mac 安装程序，您可以在https://github.com/spyder-ide/spyder/releases找到。 2、在anaconda里创建一个新环境命
spyder中点运行文件时，在控制器里只能出现“runfile wdir” python
2022-03-16 10:08

回答 2 已采纳你选中所有代码，鼠标右键点击Run Cell运行
python-python3错误（: /usr/local/lib/python3.6/site-packages/cv2.so: undefined symbol: PyCObject_Type）
2019-10-08 11:10

这是一个图像的博客１、在spyder3中import cv2，运行时报错No module named ‘cv2’ 然后参考这篇博主的文章https://blog.csdn.net/mieleizhi0522/article/details/79123638 在命令行输入find / -name “cv2.so” 找到cv2.so文件复制到...
spyder有一个输出错误为什么不会继续运行下面的？ python
2022-07-03 22:06

回答 2 已采纳 pycharm里抛出异常，之后的语句也不会继续执行
好工具推荐系列：Python IDE之PyCharm/Spyder/Jupyter/Eric
2020-06-13 16:35

利白的博客 IDE流行度 ...Spyder，27% Visual Studio Code，21% Sublime Text，12% IDE用途如果是web开发或大工程，建议使用PyCharm；如果是数据处理，建议Spyder；Spyder是使用PyQt开发的GUI。而Jupyter.
spyder:python中的另一个自制的爬虫类
2021-05-01 00:34

Spyder-简单的python网站搜寻器Spyder是python中的另一个简单的搜寻器。蜘蛛的子类，您拥有自己的搜寻器。 from spyder import Scraper# exampleif __name__ == "__main__": sp = Scraper("http://mywebsite.com/")...
Python爬虫-使用Jupyter爬虫
2021-06-25 20:41

18岁攻城师皮蛋的博客爬取方式，通过　右键【‘检查’】　该数字，可以查看到跳转页面的ａ标签下的href，然后通过爬取该标签下的信息来获取网址和套数。这里有个问题，在我使用soup = BeatuifulSoup(data, “html.parser”)，...
使用spyder编写爬虫_CodingPark编程公园
2020-05-09 19:09

TEAM-AG的博客本文主要讲述了利用Anaconda spyder进行爬虫编写
没有解决我的问题, 去提问

悬赏问题

¥15 Python爬取指定微博话题下的内容，保存为txt
¥15 vue2登录调用后端接口如何实现
¥65 永磁型步进电机PID算法
¥15 sqlite 附加（attach database）加密数据库时，返回26是什么原因呢？
¥88 找成都本地经验丰富懂小程序开发的技术大咖
¥15 如何处理复杂数据表格的除法运算
¥15 如何用stc8h1k08的片子做485数据透传的功能？(关键词-串口)
¥15 有兄弟姐妹会用word插图功能制作类似citespace的图片吗？
¥15 latex怎么处理论文引理引用参考文献
¥15 请教：如何用postman调用本地虚拟机区块链接上的合约？

如何阻止spyder / Nutch-2等爬虫访问特定页面？

5条回答 默认 最新

悬赏问题

5条回答默认最新