Python requests 爬取网页源码问题

python requests爬取网页内容出现

500 Server Error

An internal server error occured.

怎么解决

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
resolvewang 2016-07-12 03:29
关注
这个属于服务器内部错误了，requests库可以返回http状态码： requests.get('http://www.baidu.com').status_code 。通过它捕捉异常即可。记住一点，
爬虫能获取的数据是用户能看到的，如果你自己手动输入网址访问也出现500，那肯定是目标服务器出错了。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python爬取网页题库如何将选项一一对应 python
2022-10-06 15:37

回答 1 已采纳拿去 import requests from bs4 import BeautifulSoup url_list = [] option_one = [] option_two = [] op =
Python的requests.get()获取不到正确的网页源码 python 有问必答
2021-06-21 14:46

回答 2 已采纳需要添加headers。 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36
Python爬虫requests反还内容与网页内容不相同 python 有问必答
2022-03-08 22:50

回答 2 已采纳 requests.get得到的是源代码，ajax动态加载或者js动态生成的html代码获取不到，需要直接请求接口获取数据或者从源代码中找到js数据源进行解析。截图中右边块的数据接口为下面这个，直接re
求助，python 解析爬取的网页源码中的json部分
2016-03-11 08:31

回答 2 已采纳 sum: 其实方法一直就在那，只是自己懒，怕麻烦不去尝试。。。。上面知道是json又不敢确定的时候，只用了json.load(html.text)尝试，提示没有json object就一直再乱搜
python爬取二手房信息的问题 python
2023-03-26 10:47

回答 3 已采纳根据您提供的代码和报错信息，问题出现在 title=li.xpath('./div/div[2]/div[1]/div/a/text()')[0] 这一行，数组越界了。这可能是由于某些 li 标签没有
python爬取码市导入excel中导入结果只导入最后一条的问题 python 数据分析爬虫
2021-08-15 19:24

回答 3 已采纳修改了一下程序，有帮助的话，望采纳！ #!/usr/bin/python # -*- coding: UTF-8 -*- """ @author: Roc-xb """ import requ
Python爬取网页数据
2018-08-29 17:20

你缺少想象力的博客爬取数据，基本都是通过网页的URL得到这个网页的源代码，根据源代码筛选出需要的信息准备 IDE：pyCharm 库：requests、lxml 大概介绍一下，这俩库主要为我们做什么服务的 requests：获取网页源代码 lxml：...
python数据爬取求帮助！急！ python 爬虫
2023-04-03 11:12

回答 3 已采纳 from selenium import webdriver from lxml import etree driver = webdriver.Edge() url='https://so.szl
Python爬虫 requests.post爬取json内容失败 ajax html5 json python
2020-12-25 10:40

回答 3 已采纳 res = requests.post(url,headers=headers,json=payload)
python的requests爬虫返回了与原网页内容不符的javascript，如何解决？ python
2021-03-29 11:19

回答 3 已采纳异步加载的问题, 可以使用selenium 工具包进行爬取, 可参考: import pandas as pd import numpy as np import time from seleni
python爬取视频源代码
2019-03-19 11:25

利用python中的re和requests模块，实现对网站中的视频进行爬取，对于图片和文字的爬取也是同样的原理，重点是学会就网页html标签的正确正则就能获取到我们需要的数据，这里是用的单线程爬取
python爬虫 爬取网页图片
2022-12-22 18:05

chenruhan_QAQ_的博客 python爬虫爬取网页上的图片
python爬网页源码_python爬虫爬取网页的内容和网页源码不同？
2020-12-03 06:54

weixin_39551188的博客可以看到这里id为k_total的元素值不同，爬出来是1，网页源码是55。附还未完成的代码：import requestsfrom bs4 import BeautifulSoupimport rehead={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) Apple...
Python应用开发——爬取网页图片
2022-09-06 19:00

柒壹漆的博客当我们需要从网页上面下载很多图片的时候，一个一个手动保存实在是太累人了。那么有没有批量下载的办法呢？答案是有的，Python爬虫就可以完美的做到这一点，而且作为一个Python的初学者，我可以很负责任的告诉你，...
没有解决我的问题, 去提问

悬赏问题

¥20 delta降尺度方法，未来数据怎么降尺度
¥15 c# 使用NPOI快速将datatable数据导入excel中指定sheet，要求快速高效
¥15 高德地图点聚合中Marker的位置无法实时更新
¥15 DIFY API Endpoint 问题。
¥20 sub地址DHCP问题
¥15 delta降尺度计算的一些细节，有偿
¥15 Arduino红外遥控代码有问题
¥15 数值计算离散正交多项式
¥30 数值计算均差系数编程
¥15 redis-full-check比较两个集群的数据出错

Python requests 爬取网页源码问题

500 Server Error

1条回答 默认 最新

悬赏问题

1条回答默认最新