使用Python爬取安居客房产网站的网页数据需要绕过下面的反爬机制，关于#python#的问题，请各位专家解答！（相关搜索：python爬虫）

我已经添加了headers跟cookies，现在还是爬不了，只要一刷新就会需要验证


```python
import requests
from lxml import etree
url='https://cd.fang.anjuke.com/?from=AF_Home_switchcity'
cook={'Cookie':
'aQQ_ajkguid=A5732A3A-F490-A6B9-C29A-867BE43A63FA;'
' ajk-appVersion=; id58=CrIcnGVUbVG0LwRCOBJkAg==; isp=true;'
' 58tj_uuid=72b4c361-41de-43f5-8c45-8a89d8d4505c; als=0;'
' sessid=C89D1AED-C4B2-E71D-870F-SX1125123403; obtain_by=2;'
' twe=2; init_refer=https%253A%252F%252Fcn.bing.com%252F;'
' new_uv=2; ctid=15; new_session=0'}
header={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) '
                     'AppleWebKit/537.36 (KHTML, like Gecko)'
                     ' Chrome/119.0.0.0 Safari/537.36 Edg/119.0.0.0'}
refer={'https://chengdu.anjuke.com/?from=HomePage_City'}
# proxy = {
#     'https':'https://182.46.113.194:9999',
#     'https':'https://112.85.150.220:9999'
# }
res=requests.get(url,headers=header,cookies=cook)
html=etree.HTML(res.text)
title=html.xpath('//*[@class="infos"]//a/span/text()')
print(res.status_code)
print(res.text)

```

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
DTcode7 前端领域优质创作者 2024-05-15 15:09
关注
答案引用自chatgpt生成，望对题主有所帮助/启发；若有帮助，还望采纳！

要使用Python爬取安居客房产网站的网页数据并绕过反爬机制，可以采用以下方法：

设置User-Agent：模拟浏览器访问，避免被识别为爬虫。
使用代理IP：避免因访问频率过高而被封IP。
设置请求头：添加Referer、Accept等字段，增加请求的合法性。
使用cookie：登录后获取cookie，保持会话状态。
使用动态加载技术：如Selenium、PhantomJS等，模拟浏览器行为。

以下是一个简单的示例代码：

import requests from bs4 import BeautifulSoup headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3', 'Referer': 'https://www.anjuke.com/', 'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8', } url = 'https://www.anjuke.com/fangjia/' response = requests.get(url, headers=headers) soup = BeautifulSoup(response.text, 'html.parser') # 解析网页数据，提取所需信息 # ...

注意：以上代码仅作为示例，实际操作时需要根据具体需求进行调整。同时，爬虫可能会对网站造成压力，请合理使用。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容