cup319 2020-06-27 22:44 采纳率: 100%
浏览 478
已结题

python爬网页,实际能打开,但是爬过来的居然还是网址。

import requests

url='http://www.iwencai.com/stockpick/load-data?w=%E5%B9%B3%E5%8F%B0%E7%AA%81%E7%A0%B4%EF%BC%8C%E7%AD%B9%E7%A0%81%E9%9B%86%E4%B8%AD%EF%BC%8C%E5%89%8D2%E5%90%8D'

headers = {
  "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36"
}


r = requests.get(url,headers=headers)
demo = r.text

print(r.text)

爬过来的是

<html><body>
    <script type="text/javascript" src="//s.thsi.cn/js/chameleon/chameleon.min.1593268.js"></script> <script src="//s.thsi.cn/js/chameleon/chameleon.min.1593268.js" type="text/javascript"></script>
    <script language="javascript" type="text/javascript">
    window.location.href="http://www.iwencai.com/stockpick/load-data?w=%E5%B9%B3%E5%8F%B0%E7%AA%81%E7%A0%B4%EF%BC%8C%E7%AD%B9%E7%A0%81%E9%9B%86%E4%B8%AD%EF%BC%8C%E5%89%8D2%E5%90%8D";
    </script>
    </body></html>

实际打开是能看到内容的。

  • 写回答

1条回答 默认 最新

  • knightjsh 2020-06-28 10:01
    关注

    原网址是怎样的?是不是带有中文字符,能不能直接把url发我看看,代码里这个是编码过的了

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥15 eclipse运行项目时遇到的问题
  • ¥15 关于#c##的问题:最近需要用CAT工具Trados进行一些开发
  • ¥15 南大pa1 小游戏没有界面,并且报了如下错误,尝试过换显卡驱动,但是好像不行
  • ¥15 没有证书,nginx怎么反向代理到只能接受https的公网网站
  • ¥50 成都蓉城足球俱乐部小程序抢票
  • ¥15 yolov7训练自己的数据集
  • ¥15 esp8266与51单片机连接问题(标签-单片机|关键词-串口)(相关搜索:51单片机|单片机|测试代码)
  • ¥15 电力市场出清matlab yalmip kkt 双层优化问题
  • ¥30 ros小车路径规划实现不了,如何解决?(操作系统-ubuntu)
  • ¥20 matlab yalmip kkt 双层优化问题