关于#网站#的问题，如何解决？

import requests
from bs4 import BeautifulSoup
from lxml import etree
import time

爬取网站图片

lj = "

404 https://www.chenbie.com/%22

url = "

404 https://www.chenbie.com/mm/%22

resp0 = requests.get(url)
resp0.encoding = "utf-8"
#print(resp.text)
tp_list = []
img_list = BeautifulSoup(resp0.text, "html.parser")
#print(img_list)
imgs = img_list.find("ul", id="pins").find_all("a")
for img in imgs:
img_href = lj+img.get("href") # 拼接成网址
tp_list.append(img_href) # 将网址放在列表中
#print(img_href)
#print(tp_list)
for i in tp_list:
resp1 = requests.get(i) # 用循环依次去访问网站
resp1.encoding = "utf-8"
tree = etree.HTML(resp1.text)
divs = tree.xpath("/html/body/div[3]/div[1]/div[3]/p/a/img/@src")
print(divs)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-HGJ 2021-09-30 22:18
关注
1.网址错误，应该分别是：
lj = "https://www.chenbie.com"
url = "
404 https://www.chenbie.com/mm%22

2.解析器选择不正确，img_list = BeautifulSoup(resp0.text, "html.parser")改成
img_list = BeautifulSoup(resp0.text, "lxml")
完整代码：

import requests from bs4 import BeautifulSoup url = "https://www.chenbie.com/mm/" resp0 = requests.get(url, headers={ 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/93.0.4577.63 Safari/537.36 Edg/93.0.961.38'}) resp0.encoding = "utf-8" img_list = BeautifulSoup(resp0.text, "lxml") #print(img_list) imgs = [x['data-original'] for x in img_list.select('#pins li a img')] print(imgs)

['https://pic.chenbie.com/d/file/titlepic/2021/03/24/11/65b53534a3.jpg', 'https://pic.chenbie.com/d/file/titlepic/2021/03/24/11/9f4a3cf03a_副本.jpg', ...]

如有帮助，请点采纳。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

关于Jupyter Notebook没有python3的问题解决
2024-03-19 18:15

白霜ya的博客 jupyter没有Python3的解决方案，仅供参考
python解决跨域问题_Python学习————跨域问题及解决
2020-12-04 14:09

weixin_39716088的博客跨域问题及解决# xss：跨站脚本攻击，cors：跨域资源共享，csrf：跨站请求伪造# 1 同源策略：请求的url地址,必须与浏览器上的url地址处于同域上,也就是域名,端口,协议相同.# 2 CORS：跨域资源共享，允许不同的域来我...
Python可以解决哪些生活中的小问题
2022-05-07 21:43

「已注销」的博客但大多数人对于Java、C/C++技术还比较熟悉，对于新兴的Python还不是很了解，其实Python的应用还是挺广的，能够解决不少我们生活中的小问题，一起跟随南京小码王Python培训班老师是怎么说的。 1、植树问题 total...
使用Python解决迷宫问题
2021-10-12 12:43

Pumpk1n?的博客 # 向上 r-1,c # 向右 r,c+1 # 向下 r+1,c # 向左 r,c-1 起点与终点的设置 start=(1,1) end=(7,7) 开始核心代码这里选用栈来解决问题 #先创建一个列表，同时放入起点的坐标 lst=[start] #建立一个while循环，条件当...
如何用Python解决最优化问题？
2019-05-29 08:00

Sim1480的博客以下用Python来完成对该线性规划问题的求解，比较常用的两个模块是： scipy.optimize.linprog https://docs.scipy.org/doc/scipy/reference/generated/scipy.optimize.linprog.html PuLP ...
彻底解决Python包下载慢问题
2022-10-27 16:48

与物为春的博客彻底解决Python包下载慢问题 Pycharm中修改库下载源 python默认使用的是国外镜像，有时候下载非常慢，最快的办法就是在下载命令中增加国内源：
npm解决node-sass python环境问题
2022-09-14 19:17

Yx0629的博客 -production windows-build-tools 对于非python玩家，建议方式二安装python环境，该方式，node会为你匹配对应node版本的python，这样将避免后续使用中的版本过高或过低造成的编译失败问题，比如node16+在python2.x下...
Python——解决百元买百鸡问题
2023-05-14 11:23

A秃头大叔的博客 #使用循环方法求解百钱买百鸡问题。假设公鸡5元一只，母鸡3元一只，小鸡1元三只#三种鸡每种鸡至少要有1只#现有100元钱想买100只鸡，编程打印所有买鸡的方案（按照公鸡母鸡小鸡的顺序打印）#并打印有多少种买法？
python中unicode编码问题解决方法
2022-08-16 09:04

一丨丿丶7的博客 python中unicode编码问题解决方法
关于Python实现汉诺塔问题
2022-05-04 21:46

王业强的博客简单讲解Python实现汉诺塔问题
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 11月3日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月26日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月30日

关于#网站#的问题，如何解决？

爬取网站图片

3条回答 默认 最新

问题事件

3条回答默认最新