自学python的新人 2022-07-17 23:03 采纳率: 88.9%
浏览 43
已结题

爬虫基础访问页面失败 无效标头

问题遇到的现象和发生背景
问题相关代码,请勿粘贴截图
运行结果及报错内容
我的解答思路和尝试过的方法
我想要达到的结果
import urllib.request

url = 'https://weibo.cn/6543875713/info'

headers = {
# ':authority':' weibo.cn',
# ':method':' GET',
# ':path':' /6543875713/info',
# ':scheme':' https',
'accept':' text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3',
#'accept-encoding':' gzip, deflate, br',
'accept-language':' zh-CN,zh;q=0.9',
'cache-control':' max-age=0',
'cookie':' _T_WM=97537cddb6b9372bb7cc7f52fdc76b9b; SCF=AqL1oCWI4guZx3smWyY8gt4RjJJway9lF75jEzSQn3n7WW_HwaQF1LEQWnI-vFIkbE_wfJJfC4fF0_s4IWrNvIw.; SUB=_2A25P0G-DDeRhGeBL71EZ9yvLyj-IHXVtO3HLrDV6PUJbkdCOLWmskW1NRxsmyRw2gXUTJs0XRzgTW-sQkWRgwqGV; SSOLoginState=1658068947',
'referer: https':'//weibo.cn/',
'upgrade-insecure-requests':' 1',
'user-agent':' Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36',
}

usl = urllib.request.Request(url=url,headers=headers)

we = urllib.request.urlopen(usl)
bc = we.read().decode('utf-8')


with open('weibo.html','w',encoding='gb2312')as fp:
    fp.write(bc)

img

  • 写回答

4条回答 默认 最新

  • 亖夕 Python领域新星创作者 2022-07-17 23:43
    关注

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(3条)

报告相同问题?

问题事件

  • 系统已结题 7月26日
  • 已采纳回答 7月18日
  • 创建了问题 7月17日

悬赏问题

  • ¥15 关于#windows#的问题:怎么用WIN 11系统的电脑 克隆WIN NT3.51-4.0系统的硬盘
  • ¥15 matlab有关常微分方程的问题求解决
  • ¥15 perl MISA分析p3_in脚本出错
  • ¥15 k8s部署jupyterlab,jupyterlab保存不了文件
  • ¥15 ubuntu虚拟机打包apk错误
  • ¥199 rust编程架构设计的方案 有偿
  • ¥15 回答4f系统的像差计算
  • ¥15 java如何提取出pdf里的文字?
  • ¥100 求三轴之间相互配合画圆以及直线的算法
  • ¥100 c语言,请帮蒟蒻写一个题的范例作参考