想从用urlretrieve下载mp3，但是每次都被跳转另一个mp3？

我写了简单程序想从http://www.ting89.com/下载mp3

_opener = urllib.request.build_opener()
_opener.addheaders = [("User-agent", "Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; Touch; rv:11.0) like Gecko")]

url = urllib.parse.quote(_url_link, safe='/:?=')
try:
    _opener.open(url)
    
    urlretrieve(url, _path_local, cbk)

    
except Exception as e:
    print(e)

结果每次都只能下载一个网站自己的mp3，手动下载可以下载真正的mp3，是被反爬虫了吗？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
slience_me 新星创作者: 人工智能技术领域 2024-01-11 14:17
关注
你的问题可能是由于网站对爬虫采取了一些反爬虫机制。这些机制可能包括检测用户代理（User-Agent）、设置 cookie、JavaScript 渲染等。你已经设置了一个基本的用户代理，但仍然可能需要更多的处理。

以下是一些可能帮助你解决问题的方法：

设置更真实的用户代理： 有些网站可能只接受特定浏览器的请求。你可以尝试使用真实浏览器的用户代理，例如 Chrome 或 Firefox。

_opener.addheaders = [("User-agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36")]

处理 JavaScript 渲染： 如果网站使用了 JavaScript 动态加载内容，urllib 可能无法执行 JavaScript，导致无法获取到真正的下载链接。考虑使用带有 JavaScript 渲染功能的库，如 selenium，来模拟浏览器行为。

from selenium import webdriver # 创建一个模拟浏览器 driver = webdriver.Chrome() # 使用模拟浏览器打开网页 driver.get(_url_link) # 获取真正的下载链接 real_download_link = driver.find_element_by_xpath("your_xpath_expression").get_attribute("href") # 关闭模拟浏览器 driver.quit()

处理重定向： 有时，网站会通过重定向将你导向其他链接。你可以使用库中的函数来获取最终的重定向链接，然后再进行下载。

import requests response = requests.get(_url_link, allow_redirects=False) real_download_link = response.headers['Location']

请注意，爬取网站内容时，请遵守该网站的使用条款和规定。如果网站有robots.txt文件，请遵循其中的规定。非法的爬取行为可能导致你被封禁或面临法律责任。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python spider 爬虫之 urllib系列 urlretrieve下载照片、视频网页
2023-06-21 17:28

Ares-Wang的博客 python 中集成了 urllib。
【Python】爬虫——urlretrieve下载不完整问题且避免用时过长
2020-03-02 18:26

zou_albert的博客我们使用urllib.urlretrieve(url,filename)时经常遇到下载到一半时，出现urllib.ContentTooShortError错误。这是因为文件下载不完全导致的错误。 urllib.urlretrieve(url,filename)等待时间过长，导致程序死循环或者...
用python和Beautiful Soup来做一个图片下载器（优化版）
2023-12-20 09:33

机构师的博客这是一个使用python和beautifulsoup4编写的图片下载程序，主要支持视觉中国网站，可以获取当前网址网页的图片列表，有3种图片下载方式，全部下载、单张下载以及任意张下载。本例是在之前的一篇博文的基础上，进行了...
python每天一个小程序_24小时从0到1开发阴阳师小程序
2020-11-26 01:11

weixin_39950764的博客 0.序玩阴阳师的肝帝们都知道，每天早上5点和下午...而每次使用搜索引擎查找又十分不方便，所以笔者决定写一个查询阴阳师妖怪分布的小程序，力求做到使用快捷体验更快捷，把更多的时间留给狗粮和御魂。恰好上周末有两...
[Python从零到壹] 四.网络爬虫之入门基础及正则表达式抓取博客案例
2020-09-30 21:07

Eastmount的博客欢迎大家来到“Python从零到壹”，在这里我将分享约200篇Python系列文章，带大家一起去学习和玩耍，看看Python这个有趣的世界。所有文章都将结合案例、代码和作者的经验讲解，真心想把自己近十年的编程经验分享给...
如何利用Python实现简单的图片下载?
2022-12-26 15:27

老男孩IT教育的博客大家在上网冲浪的时候，看到喜欢的图片都想要保存下来，有的时候可以直接右键图片另存为，但有的时候图片是无法下载的，甚至需要跳转到其他的网页去，非常麻烦。通过for循环获得所有符合条件的图片网址，并采用...
如何通过Python进行图片批量下载？
2022-11-14 15:23

老男孩IT教育的博客大家在上网冲浪的时候，看到喜欢的图片都想要保存下来，有的时候可以直接右键图片另存为，但有的时候图片是无法下载的，甚至需要跳转到其他的网页去，非常麻烦。通过for循环获得所有符合条件的图片网址，并采用...
使用python Request Module自动下载网站数据
2022-12-12 23:17

QSX1997的博客【代码】使用python Request Module自动下载网站数据。
【Python从入门到进阶】42、使用requests的Cookie登录古诗文网站
2023-11-19 16:56

光仔December的博客上一篇我们介绍了requests代理的基本使用，本篇我们来学习如何利用requests的Cookie登录古诗文网。
python爬虫之爬取案例网页ajax请求的数据2之跳转url下载图片
2022-05-07 16:15

水w的博客在前文的基础上，我们已经爬取到了第一个ajax请求下我们想要爬取的logo生成url地址，接下来我想要爬取所有的ajax请求下我们想要爬取的logo生成url地址，并且下载这些图片。
python下载音乐代码_使用python3下载网易云音乐歌单歌曲，附源代码
2021-01-14 08:24

SeuPaiHaMuit的博客 1 """23 用selenium+PhantomJS配合，不需要进行逆向工程4 python 3下的selenium不能默认安装，需要指定版本2.48.05 """6 from selenium importwebdriver7 importos,requests891011 url = '...id=884698131'#网易云音乐...
看漫画学python下载_Python下载漫画
2020-11-23 14:48

weixin_39747293的博客一个一个点太麻烦，于是花了点时间用python写了个demo，把爱漫画的漫画下载下来，这样就可以随时随地看了。这也是我首次尝试用python写不是数据处理的东西，还是很开心的。做的具体思路就是利用python提供的urllib,...
python下载文件加上日期_如何用Python下载并整理上千张表
2020-11-23 12:40

weixin_39658474的博客但转念一想，不对呀，销售数据笔者已经有了，但是每个产品的访客数据还没有，要去天猫后台下载，进去一看我傻眼了，数据一次只能下载一天的数据。粗略一算，若时间是从今年1月1号到昨天3月17号，一共要下载77次，...
Python爬虫批量下载文献
2021-11-26 17:10

程序员-夏天的博客最近在看NeurIPS的文章，但是一篇篇下载太繁琐，希望能快速批量下载下来。于是想到了之前一直听说的python爬虫，初次学着弄一下。参考了python爬虫入门教程：Python爬虫入门教程：超级简单的Python爬虫教程; 用到...
python 自动下载文件_【Py大法系列--03】Python如何自动下载文件
2020-11-20 21:15

weixin_39640157的博客解决方法一般情况下，Python下载文件的方式有以下几种：利用urllib、urllib2，即Python爬虫用的最多的库；import urllibimport urllib2import requestsurl = "你的下载链接"urllib.urlretrieve(url, demo.zip)urllib...
python保存至对应目录_Python根据URL地址下载文件并保存至对应目录的实现
2020-11-22 11:50

weixin_39946657的博客本文以Github中Alexander Kim提供的图片分类数据集为例，下载其提供的图片样本并分类保存Python 3.6.5，Anaconda， VSCode1. 下载数据集文件建立项目文件夹，下载上述Github项目中的raw_data文件夹，并保存至项目...
python自动下载文件_【Py大法系列--03】Python如何自动下载文件
2020-11-21 02:18

weixin_39768645的博客解决方法一般情况下，Python下载文件的方式有以下几种：利用urllib、urllib2，即Python爬虫用的最多的库；import urllibimport urllib2import requestsurl = "你的下载链接"urllib.urlretrieve(url, demo.zip)urllib...
python之批量下载网页数据
2021-09-16 13:33

weixin_45850145的博客要下载如下网页所示数据，一个一个点下载繁琐，我们用python代码来批量下载。 python代码： import urllib.request # url request import re # regular expression import os # dirs import time ''' url 下载网址 ...
python 自动打开网页并下载
2024-07-06 06:33

2401_85975385的博客大家好，今天我们要解答，python登录网站自动下载文件 python自动从网页下载文件，现在让我们一起来看看吧！大家好，给大家分享一下python登录网站自动下载文件，很多人还不知道这一点。保存后就可以正常启动mysql...
【Python】面试官喜欢问的100个面试问题
2022-06-08 14:49

蚂蚁爱Python的博客毕业季又到了，相信有很多的小伙伴都在找工作。如果你在寻找python工作，那你的面试...1）python是一种解释型语言，因此在使用python时不需要进行编译2）声明变量和类似变量时，不需要重复声明变量的类型；3）Python
没有解决我的问题, 去提问

想从用urlretrieve下载mp3，但是每次都被跳转另一个mp3？

1条回答 默认 最新

1条回答默认最新