我写出来的代码只能爬取网页的图标,而且一个网页只能爬取一个,求大家告知,如果可以的话把代码发一下
4条回答 默认 最新
檀越@新空间 2024-03-03 20:38关注2301_80636058 晚上好🌙🌙🌙
本答案参考ChatGPT-3.5你可以使用
BeautifulSoup库来解析网页内容,并使用requests库发送HTTP请求。以下是一个示例代码,用于爬取Excel文档中链接网页的图片链接,并保存到另一个Excel文档中:import requests from bs4 import BeautifulSoup import openpyxl # 加载Excel文档 workbook = openpyxl.load_workbook('input.xlsx') sheet = workbook.active # 创建新的Excel文档 new_workbook = openpyxl.Workbook() new_sheet = new_workbook.active # 遍历Excel文档中的每一行 for row in sheet.iter_rows(values_only=True): # 获取链接 url = row[0] # 发送HTTP请求并解析网页内容 response = requests.get(url) soup = BeautifulSoup(response.text, 'html.parser') # 查找所有图片标签 images = soup.find_all('img') # 遍历图片标签,获取图片链接并保存到新的Excel文档中 for image in images: image_url = image['src'] new_sheet.append([image_url]) # 保存新的Excel文档 new_workbook.save('output.xlsx')此代码假设Excel文档中的链接位于第一列,保存图片链接的Excel文档将保存为
output.xlsx。你需要根据自己的需求进行适当的修改。解决 无用评论 打赏 举报