在python爬虫爬网站的时候返回Access denied怎么办

#coding=utf-8
import urllib
import re

def getHtml(url):
page = urllib.urlopen(url)
html = page.read()
return html
html = getHtml("http://www.xxx.com/ ")
f = file('html.txt','w')
f.write(html)
f.close()

返回的Access denied。。查了以下是浏览器不被支持。但是在爬虫下要怎么写？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
save4me 2014-11-19 05:09
关注
浏览器不被支持，那什么设备可以访问？可以试一下修改User-Agent头文件。如果还是不行，尝试抓取可以访问的时候的请求文件头，包括cookie等，然后模拟抓取应该就可以了。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python爬虫中http.client.HTTPSConnection与request的使用 python 有问必答爬虫
2021-12-26 11:25

回答 2 已采纳用它的API啊，这样就省得怕被反爬了 https://docs.opensea.io/reference/api-overview
Permission denied Python读取 python
2023-03-29 10:14

回答 3 已采纳 json是个文件夹呀，不要open一个文件夹只能open里面的文件如果你需要里面所有的文件，那要先遍历文件夹
Python安装库失败 python
2022-10-11 19:23

回答 3 已采纳更新下pip试试呢或者pip3 insatll xxx 试试再或者 pip install xxxx --use-deprecated=legacy-resolver
python发送post请求返回access denied_python使用scrapy发送post请求的坑
2020-12-23 18:25

就是七七的博客但是，超级坑的一点来了，今天折腾了一下午，使用这种方法发送请求，怎么发都会出问题，返回的数据一直都不是我想要的 return scrapy.FormRequest(url, formdata=(payload)) 在网上找了很久，最终找到一种方法，...
为什么出现PermissionError: [Errno 13] Permission denied: 'gongzi25.csv' python 爬虫
2022-10-01 15:39

回答 1 已采纳你得是这个文件打开的情况下你运行代码啊要关闭文件再运行你的代码
Access denied error code 1020，该如何解决？前端网络
2022-09-13 16:28

回答 3 已采纳感谢邀请，用下边的办法试试清除缓存和 Cookie检查您的服务器配置，如果之前可以用，那么看是否域名的ip更改而Cloudflare没有及时更改，进入Cloudflare然后点击服务器看是否和域名ip
Android爬虫遇到了权限问题怎么办？ android 爬虫
2016-01-21 02:53

回答 3 已采纳 [Android网络爬虫程序（基于Jsoup）](http://www.verydemo.com/demo_c131_i118728.html "Android网络爬虫程序（基于Jsoup）")
Python爬虫的scrapy的学习（学习于b站尚硅谷）
2023-08-19 20:18

知乎云烟的博客本文是本人在b站上学习尚硅谷的Python爬虫教程小白零基础速通的，关于爬虫部分后记录的笔记。
navicat premium报错：Access denied for user 'root'@'10.10.1. 无法连接数据库 mysql python 数据库
2021-12-06 14:20

回答 2 已采纳 IP错了服务被关闭了你的账号没有连接该数据库的权限
关于#python#的问题：如何开启安卓网络权限操作在配置buildozer上实现 android python 其他
2022-11-03 09:57

回答 1 已采纳问题已解决
为什么geany无法保存文件(语言-python) python
2022-07-13 14:07

回答 2 已采纳以管理员身份运行试试
谈谈爬虫遇到的 Access denied Error code 1020
2023-03-05 16:33

码龄3年审核中的博客这里打个“小广告”，我老师往pypi库里在很多年前写过一个自动 fake 一个 user_agent 的模块，让代码变得非常的简洁，省事好用，推荐给大家。看到这里，就严重的说明，你的目标地址正确，但却没有得到你想要的页面，...
git clone项目报错remote: HTTP Basic: Access denied git http 前端
2021-11-09 15:38

回答 3 已采纳用户失败账户密码都输入对了吗。密钥要配置对了吗
Python爬虫QQ空间
2018-07-22 17:02

流萤__的博客目录一、前言 ... 三、破解空间加密参数g_tk 四、在个人QQ空间好友栏获取好友列表 ...玩了这么多年QQ，学了爬虫当然要爬一下啦，肯定有大佬要说爬个QQ空间还要多线程吗，人家只是刚看了多线程方面的知...
UN Comtrade python爬虫实现，多线程动态ip
2023-01-26 11:41

谷峡的博客 python爬虫，爬取联合国贸易数据
当爬虫被拒绝时(Access Denied)
2017-06-21 11:42

程序员会武功的博客结果在爬了大约3万个页面的时候，对方发回Access Denied。等一段时间后再启动爬虫，结果还是Access Denied。这时才明白这样的想法太天真了，当初就应该找其它方法来避免才对。而本文则记述了这些其它方法。 1. ...
python 爬虫之登录和反盗链
2022-09-28 11:48

xingxiliang的博客 python 爬虫
python 爬虫代理_python 爬虫使用代理的问题
2020-12-06 02:09

weixin_39760967的博客刚刚在使用Python写爬虫，但是由于我在公司没有上网权限，所以借别人的账号用(opera 浏览器代理可有上网)，我将代理信息写在python脚本里面但是出现了下面的错误.代码:import urllib2proxy_info = {'user' : 'xxx' ...
Python 爬虫学习入门阶段小结（心得+python爬虫遇到的所有错误集合）
2018-09-09 20:45

一颗橡树的博客 bilibili嵩天教授网课 + 个人练习 — 《python网络爬虫从入门到实践》，前后一共1个半月左右中间出现的无数次问题找度娘解决了，自学确实比较艰辛，因为一个问题经常想一两天都解决不了。再来谈谈我看过的...
python增量爬虫_python增量爬虫pyspider
2020-12-16 07:57

weixin_39916355的博客 1.为了能够将爬取到的数据存入本地数据库，现在本地创建一个MySQL数据库example，然后在数据库中建立一张表格test，示例如下：DROP TABLE IF EXISTS `test`;CREATE TABLE `douban_db` (`id` int(11) NOT NULL AUTO_...
没有解决我的问题, 去提问

悬赏问题

¥15 不同系统编译兼容问题
¥100 三相直流充电模块对数字电源芯片在物理上它必须具备哪些功能和性能？
¥30 数字电源对DSP芯片的具体要求
¥20 antv g6 折线边如何变为钝角
¥30 如何在Matlab或Python中设置饼图的高度
¥15 nginx中的CORS策略应该如何配置
¥30 信号与系统实验：采样定理分析
¥100 我想找人帮我写Python 的股票分析代码，有意请加mathtao
¥20 Vite 打包的 Vue3 组件库，图标无法显示
¥15 php 同步电商平台多个店铺增量订单和订单状态