stringbalance 2021-12-25 17:24 采纳率: 33.3%
浏览 23

关于#爬虫#的问题,如何解决?

```python

import requests
from bs4 import BeautifulSoup
import time

url = "https://www.umei.cc/bizhitupian/weimeibizhi/"
resp = requests.get(url)
resp.encoding = 'utf-8' # 处理乱码

print(resp.text)

把源代码交给bs

main_page = BeautifulSoup(resp.text, "html.parser")
alist = main_page.find("div", class_="TypeList").find_all("a")
#print(alist)
for a in alist:
href=a.get('href') # 直接通过get就可以拿到属性的值
# 拿到子页面的源代码
child_page_resp = requests.get(href)
child_page_resp.encoding = 'utf-8'
child_page_text = child_page_resp.text
# 从子页面中拿到图片的下载路径
child_page = BeautifulSoup(child_page_text, "html.parser")
child_page.find("P", class_="ListDesc")
img = p.find("img")
src = img.get("src")
# 下载图片
img_resp = requests.get(src)
# img_resp.content #这里拿到的是字节
img_name = src.split("/")[-1] # 拿到url中的最后一个/以后的内容
with open(img_name, mode="wb", encoding="utf-8") as f:
f.writer("img/" + img_resp, content) # 图片内容写入文件
print("over!!!", img_name)
time.sleep(1)
print("all over!")

```No schema supplied. Perhaps you meant运行后是这个结果,该怎么解决?
中间两行黑体字是注释

  • 写回答

1条回答 默认 最新

  • 陈.py 2021-12-28 11:35
    关注

    网站不是都404了吗,怎么爬

    评论

报告相同问题?

问题事件

  • 修改了问题 12月25日
  • 修改了问题 12月25日
  • 创建了问题 12月25日

悬赏问题

  • ¥30 基于信创PC发布的QT应用如何跨用户启动后输入中文
  • ¥20 非root手机,如何精准控制手机流量消耗的大小,如20M
  • ¥15 远程安装一下vasp
  • ¥15 自己做的代码上传图片时,报错
  • ¥15 Lingo线性规划模型怎么搭建
  • ¥15 关于#python#的问题,请各位专家解答!区间型正向化
  • ¥15 unity从3D升级到urp管线,打包ab包后,材质全部变紫色
  • ¥50 comsol温度场仿真无法模拟微米级激光光斑
  • ¥15 上传图片时提交的存储类型
  • ¥15 VB.NET如何绘制倾斜的椭圆