爬东方财富网遇到的ip代理问题
我使用快代理的限时6小时的免费ip去代理请求爬虫
我测试过先对
进行访问,返回的ip信息确实是代理ip,而非本地ip。
但是随后对东方财富网进行爬虫,没过一会还是被封了,封的还是我的本地ip,然后我继续用代理ip请求返回的结果又是变成了403。
它到底是怎么获取到我的本地ip的?
这是一段重点代码:
import random
import requests
from bs4 import BeautifulSoup
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.69 Safari/537.36'
}
response = requests.get(
'快代理的api链接',
headers=headers, timeout=1) #
if response.status_code == 200:
pp = response.text.split('\r\n')
www = random.choice(pp)
req2 = requests.get('https://caifuhao.eastmoney.com/news/20230827185253791253180',
headers=headers, proxies={'http': 'http://'+www})
ipconfig = requests.get('http://icanhazip.com/',
headers=headers, proxies={'http': 'http://'+www})
print(pp)
print(www)
print(ipconfig.status_code,ipconfig.text)
print(req2)