学习pythone爬虫爬取免费简历为什么下载到文件夹的文件不是rar格式

本来现在pythone爬虫，学习的一个案例中爬取某网站免费简历模版，自己写的代码如下


```python
import requests
from lxml import etree
import os

url = 'https://sc.chinaz.com/jianli/free.html'
headers = {'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36'}

page_text = requests.get(url=url,headers=headers).text
tree = etree.HTML(page_text)
# with open('./jianli.html','w',encoding='utf-8') as fp:
#  fp.write(page_text)
a_list = tree.xpath('//div[@id="container"]/div/a')
if not os.path.exists('./resume'):
    os.mkdir('resume')

resume_list = []
for a in a_list:
    resume_src = 'http:'+a.xpath('./@href')[0]
    resume_name = a.xpath('./img/@alt')[0]
    resume_name = resume_name.encode('iso-8859-1').decode('utf-8')
    download_resume_src = resume_src+'#down'
    #print(resume_name,resume_src)
    resume_list.append(download_resume_src)
    #print(download_resume_src)
    download_text = requests.get(url=download_resume_src,headers=headers).text
    tree = etree.HTML(download_text)
    download_list = tree.xpath('.//div[@id="down"]/div[2]/ul/li/a/@href')[0]
    print(download_list)
    download_data = requests.get(url=download_list,headers=headers).content
    resume_path = 'resume/'+ resume_name
    with open(resume_path,'wb') as fp:
     fp.write(download_data)
    print(resume_name,'下载成功！')


运行结果显示：

![img](https://img-mid.csdnimg.cn/release/static/image/mid/ask/212653367046156.png "#left")

![img](https://img-mid.csdnimg.cn/release/static/image/mid/ask/024883367046193.png "#left")

原网站简历下载格式为.rar，但我执行后文件夹下保存的下载文件不是rar格式。
请教大家给予指点！感谢！

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-showbo 2021-12-29 15:45
关注
resume_path = 'resume/'+ resume_name+".rar"#后缀加上
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

python作业：爬虫爬取京东评论
2024-07-07 09:57

Python作业：爬虫爬取京东评论；Python作业：爬虫爬取京东评论；Python作业：爬虫爬取京东评论；Python作业：爬虫爬取京东评论；Python作业：爬虫爬取京东评论；Python作业：爬虫爬取京东评论；Python作业：爬虫爬取...
Python爬虫，实现爬取CSDN文章，并保存到本地为MarkDown 格式
2023-11-22 17:32

Python爬虫，实现爬取CSDN文章，并保存到本地为MarkDown 格式，也能够直接保存到 Mysql 数据库中，涉及到 py_mysql、BeautifulSoup、requests、html2text、parsel、etree、unescape 实现
python爬虫爬取汽车网站图片并下载
2023-07-06 15:08

python爬虫爬取汽车网站图片并将图片下载到本地进行保存，图片以uuid字符重新命名。代码文件有详细注释说明。使用BeautifulSoup、requests、uuid 库，支持python2 和python 3 .直接运行即可，图片会下载到脚本代码...
python爬虫爬取超清壁纸代码实例
2020-09-18 19:31

在实际应用中，通过编写Python爬虫来爬取超清壁纸，不仅可以达到满足个人使用需求的目的，同时也是一个练习编写爬虫代码和学习网络数据处理的绝佳机会。通过上述知识点的掌握和应用，可以实现更高效、功能更强大的...
Python3爬虫学习-爬取图片批量下载 XPATH
2021-01-21 17:06

最近在研究爬虫，爬取好多网站的数据，下面就以爬取图片网站照片为例，来让大家学习，希望大家多交流。总的来说爬虫不难，会python的简单语法，会xpath提取网页需要的信息，就可以很快的爬取网站的图片，同时也希望...
python 爬虫爬取简历
2019-01-08 13:20

至于压缩包里的文件，`b966f213db07bd13c8d0.docx`可能是一个下载的简历模板示例，`resume.py`可能是实现爬虫功能的Python脚本，`test.zip`可能是进一步的压缩文件，`.idea`目录是IDE（如PyCharm）的配置文件，`test...
Python3爬虫学习之将爬取的信息保存到本地的方法详解
2021-01-21 17:37

本文实例讲述了Python3爬虫学习之将爬取的信息保存到本地的方法。分享给大家供大家参考，具体如下：将爬取的信息存储到本地之前我们都是将爬取的数据直接打印到了控制台上，这样显然不利于我们对数据的分析利用，...
Python爬虫爬取 Instagram 博主照片视频.zip
2023-12-01 21:20

python爬虫Python爬虫爬取 Instagram 博主照片视频Python爬虫爬取 Instagram 一个博主所有图片视频用法：在代码中加上自己的cookie, 修改图片保存路径, 在命令行运行 python instagram.py user_name # 这里的user_...
python爬虫.rar_python_python爬取图片_python爬虫_爬虫
2022-07-14 03:46

指定一个网站，从该网站上爬取全部匹配的图片到任意指定的文件夹当中，关键是正则表达式的使用
喜马拉雅音频文件爬取python
2024-02-25 18:19

能学到什么：①python爬取喜马拉雅音频文件，修改专辑id即可。②循环依赖都是如何设计和实现的。阅读建议：此资源不仅是代码编写实现也更注重内容上的需求分析和方案设计，所以在学习的过程要结合这些内容一起来...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月8日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月31日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月29日

学习pythone爬虫爬取免费简历为什么下载到文件夹的文件不是rar格式

2条回答 默认 最新

问题事件

2条回答默认最新