南归a 2020-03-21 10:48 采纳率: 100%

浏览 1542

已结题

Python 爬虫爬取一个网站的时候成功，但爬取多个网站就404

图片说明

第一张图我是把txt文件中第一个网址拿出来，然后保存图片成功，但是当我读取txt文件，准备开始批量爬取的时候（图二），状态码为404，单独爬取一个网站的时候没问题，一放在多个网站中就报错，怎么办？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
竟然有高手 2020-03-31 10:50
关注
你读取的时候会在每个链接末尾添加换行符\n,所以请求url的时候就会因为末尾有换行符导致失败

['https://456\n', 'https://123']

就像这样
读取的时候要加一条

for url in urls: print(url.replace('\n',''))

把换行符去掉就没问题了
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

悬赏问题

¥100 求三轴之间相互配合画圆以及直线的算法
¥100 c语言，请帮蒟蒻写一个题的范例作参考
¥15 名为“Product”的列已属于此 DataTable
¥15 安卓adb backup备份应用数据失败
¥15 eclipse运行项目时遇到的问题
¥15 关于#c##的问题：最近需要用CAT工具Trados进行一些开发
¥15 南大pa1 小游戏没有界面，并且报了如下错误，尝试过换显卡驱动，但是好像不行
¥15 自己瞎改改，结果现在又运行不了了
¥15 链式存储应该如何解决
¥15 没有证书，nginx怎么反向代理到只能接受https的公网网站