关于#爬虫#的问题，如何解决？

```python

import requests
from bs4 import BeautifulSoup
import time

url = "https://www.umei.cc/bizhitupian/weimeibizhi/"
resp = requests.get(url)
resp.encoding = 'utf-8' # 处理乱码

print(resp.text)

把源代码交给bs

main_page = BeautifulSoup(resp.text, "html.parser")
alist = main_page.find("div", class_="TypeList").find_all("a")
#print(alist)
for a in alist:
href=a.get('href') # 直接通过get就可以拿到属性的值
# 拿到子页面的源代码
child_page_resp = requests.get(href)
child_page_resp.encoding = 'utf-8'
child_page_text = child_page_resp.text
# 从子页面中拿到图片的下载路径
child_page = BeautifulSoup(child_page_text, "html.parser")
child_page.find("P", class_="ListDesc")
img = p.find("img")
src = img.get("src")
# 下载图片
img_resp = requests.get(src)
# img_resp.content #这里拿到的是字节
img_name = src.split("/")[-1] # 拿到url中的最后一个/以后的内容
with open(img_name, mode="wb", encoding="utf-8") as f:
f.writer("img/" + img_resp, content) # 图片内容写入文件
print("over!!!", img_name)
time.sleep(1)
print("all over!")

```No schema supplied. Perhaps you meant运行后是这个结果，该怎么解决？
中间两行黑体字是注释

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
陈.py 2021-12-28 11:35
关注
网站不是都404了吗，怎么爬

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

关于#python#的问题，如何解决？ python 爬虫
2023-03-07 17:40

回答 3 已采纳 “Devil组”引证GPT后的撰写：这个错误是由于文件写入时使用的默认编码为 'gbk'，而 p.text 中含有无法被 'gbk' 编码的字符。可以将文件的编码格式改为 'utf-8'，这样就可以处
关于#pythonscrapy#的问题，如何解决？ python 开发语言爬虫
2023-04-02 16:26

回答 2 已采纳好问题！！抱歉我也不太懂，你问问chatGPT吧：https://new.quke123.com/ 或者其他Python群友：https://app.yinxiang.com
关于#天猫反爬虫#的问题，如何解决？ python 爬虫
2022-08-15 18:55

回答 2 已采纳你这样去爬天猫肯定是要被反爬的，代理都不加上，如果数据量小，可以加上代理跑一跑，但是如果数据量比较大的话，你是绕不开滑块验证码的，而出不出现验证码是根据你的cookie来决定的，提供一个大批量跑的思路
解决Python 爬虫URL中存在中文或特殊符号无法请求的问题
2020-12-24 19:16

这种问题，初学者应该都会遇到，分享给大家做个参考！ from urllib.parse import quote ... 您可能感兴趣的文章:Python 爬虫之超链接 url中含有中文出错及解决办法解决python爬虫中有中文的url问题Py
关于#scrapy#的问题，如何解决？ python 爬虫
2023-03-07 18:36

回答 2 已采纳从代码看，你的爬虫似乎只是爬取了起始页面上第一个标题链接的数据。这可能是因为在parse函数中只获取了第一个数据块，而没有对其他数据块进行处理。你可以尝试使用循环迭代数据块，以便对每个数据块进行相同
关于#xpath#的问题，如何解决？ python 爬虫
2022-12-30 17:31

回答 1 已采纳应该是你get这个网页里面没有这个数据，需要二次加载
关于#selenium#的问题，如何解决？ python
2022-08-31 12:52

回答 4 已采纳你的代码问题是没有定位到这个id： “nc_2_n1z”，检查一下页面，是否id写错了： span = web.find_element(By.ID,'nc_2_n1z')
解决python爬虫假死问题(程序偷停问题)
2024-01-31 10:09

红目香薰的博客解决python爬虫假死问题(程序偷停问题)
关于python爬虫的问题，如何解决？ python 爬虫
2022-09-24 14:13

回答 1 已采纳可以看下python参考手册中的 python- 接下来？
如何解决python爬虫问题？ python 人工智能爬虫
2022-08-15 09:11

回答 1 已采纳应该是css选择器里面的规则不够明确，可改成href = selectors.css('div.container div div div ul li a::attr(href)').getall()
关于#python#的问题：python爬虫爬取百度图片 python 有问必答爬虫
2021-11-27 22:00

回答 2 已采纳你检查下这个网页中的内容是不是通过js代码读取外部json数据来动态更新的。requests只能获取网页的静态源代码，动态更新的内容取不到。对于动态更新的内容要用selenium 来爬取。或者是通
python爬虫数据可视化分析大作业.zip
2020-06-12 15:39

在本项目中，"python爬虫数据可视化分析大作业.zip" 是一个综合性的学习资源，主要涉及了Python编程中的两个重要领域：网络爬虫（Web Scraping）和数据可视化（Data Visualization）。通过这个作业，我们可以深入...
基于Python网络爬虫毕业论文.doc
2020-05-12 16:17

### 基于Python网络爬虫毕业论文的关键知识点解析 #### 一、网络爬虫概述网络爬虫（Web Crawler），又称网络蜘蛛或网络机器人，是一种按照一定规则自动抓取互联网上的信息的程序或者脚本。在大数据时代背景下，...
python爬虫的概要介绍与分析
2024-05-22 02:33

- **Reddit的r/learnprogramming**：一个学习编程的好地方，有许多关于Python爬虫的经验分享和建议。 - **CSDN**：中国最大的IT技术交流平台之一，提供了丰富的Python爬虫教程和案例分享。 - **V2EX**：一个讨论技术...
Python如何正确解决爬虫过程中的Cookie失效问题？
2023-07-26 10:03

写python的鑫哥的博客本文是该专栏的第54篇，后面会持续分享python爬虫干货知识，记得关注。在python爬虫项目中，Cookie是一种用于在客户端和服务器之间传递信息的技术。在爬取某些网站的时候，可能会需要登录才能正常获取到数据，这个...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 12月25日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 12月25日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月25日

悬赏问题

¥30 基于信创PC发布的QT应用如何跨用户启动后输入中文
¥20 非root手机，如何精准控制手机流量消耗的大小，如20M
¥15 远程安装一下vasp
¥15 自己做的代码上传图片时，报错
¥15 Lingo线性规划模型怎么搭建
¥15 关于#python#的问题，请各位专家解答！区间型正向化
¥15 unity从3D升级到urp管线，打包ab包后，材质全部变紫色
¥50 comsol温度场仿真无法模拟微米级激光光斑
¥15 上传图片时提交的存储类型
¥15 VB.NET如何绘制倾斜的椭圆