2301_80636058 2024-03-03 20:38 采纳率: 0%
浏览 6

怎么用Python爬取一个Excel文档里面链接的网页里面的图片链接,然后保存到另一个Excel文档里面

我写出来的代码只能爬取网页的图标,而且一个网页只能爬取一个,求大家告知,如果可以的话把代码发一下

  • 写回答

4条回答 默认 最新

  • 檀越@新空间 2024-03-03 20:38
    关注

    2301_80636058 晚上好🌙🌙🌙
    本答案参考ChatGPT-3.5

    你可以使用BeautifulSoup库来解析网页内容,并使用requests库发送HTTP请求。以下是一个示例代码,用于爬取Excel文档中链接网页的图片链接,并保存到另一个Excel文档中:

    import requests
    from bs4 import BeautifulSoup
    import openpyxl
    
    # 加载Excel文档
    workbook = openpyxl.load_workbook('input.xlsx')
    sheet = workbook.active
    
    # 创建新的Excel文档
    new_workbook = openpyxl.Workbook()
    new_sheet = new_workbook.active
    
    # 遍历Excel文档中的每一行
    for row in sheet.iter_rows(values_only=True):
        # 获取链接
        url = row[0]
    
        # 发送HTTP请求并解析网页内容
        response = requests.get(url)
        soup = BeautifulSoup(response.text, 'html.parser')
    
        # 查找所有图片标签
        images = soup.find_all('img')
    
        # 遍历图片标签,获取图片链接并保存到新的Excel文档中
        for image in images:
            image_url = image['src']
            new_sheet.append([image_url])
    
    # 保存新的Excel文档
    new_workbook.save('output.xlsx')
    

    此代码假设Excel文档中的链接位于第一列,保存图片链接的Excel文档将保存为output.xlsx。你需要根据自己的需求进行适当的修改。

    评论

报告相同问题?

问题事件

  • 创建了问题 3月3日