lilili07 2022-06-06 20:12 采纳率: 74.1%
浏览 115
已结题

python 爬虫爬取图片问题

python爬虫爬取网页图片无法显示问题,不知道是不是有反爬虫还是代码有问题,代码在回答栏

img

  • 写回答

4条回答 默认 最新

  • 关注

    img

    你题目的解答代码如下:

    #coding=gbk
    import requests
    from io import BytesIO
    from PIL import Image
    from selenium import webdriver
    import lxml.html
    from selenium.webdriver.chrome.options import Options
    opt = Options()
    opt.add_experimental_option('excludeSwitches', ['enable-automation'])
    opt.add_argument('--disable-blink-features')
    opt.add_argument('--disable-extensions')
    opt.add_argument('--disable-blink-features=AutomationControlled')
    driver = webdriver.Chrome(options=opt)
    driver = webdriver.Chrome()
    driver.maximize_window()
    driver.get('https://www.huya.com/g/lol')#虎牙官网
    html=driver.page_source
    xp=lxml.html.fromstring(html)
    u=xp.xpath('//span[@class="avatar fl"]')
    for i in u:
        name=i.xpath('.//img/@alt')
        url=i.xpath('.//img/@data-original')  #改下
        print(url)
        name=name[0]
        url= url[0]
        if url[:6]=='https:':
            url=url
        else:
            url = 'https:'+url
        print(name,url)
        response = requests.get(url)
        image = Image.open(BytesIO(response.content))
        image.save(f'd:\w\{name}.png')
    

    如有帮助,请点击我的回答下方的【采纳该答案】按钮帮忙采纳下,谢谢!

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
  • lilili07 2022-06-06 21:20
    关注
    #coding=gbk
    import requests
    from io import BytesIO
    from PIL import Image
    from selenium import webdriver
    import lxml.html
    from selenium.webdriver.chrome.options import Options
    opt = Options()
    opt.add_experimental_option('excludeSwitches', ['enable-automation'])
    opt.add_argument('--disable-blink-features')
    opt.add_argument('--disable-extensions')
    opt.add_argument('--disable-blink-features=AutomationControlled')
    driver = webdriver.Chrome(options=opt)
    driver = webdriver.Chrome()
    driver.maximize_window()
    driver.get('https://www.huya.com/g/lol')#虎牙官网
    html=driver.page_source
    xp=lxml.html.fromstring(html)
    u=xp.xpath('//span[@class="avatar fl"]')
    for i in u:
        name=i.xpath('.//img/@alt')
        url=i.xpath('.//img/@src')
        print(url)
        name=name[0]
        url= url[0]
        if url[:6]=='https:':
            url=url
        else:
            url = 'https:'+url
        print(name,url)
        response = requests.get(url)
        image = Image.open(BytesIO(response.content))
        image.save(f'd:\w\{name}.png')
    
    
    
    
    评论
  • 有问必答小助手 2022-06-06 23:27
    关注
    您好,我是有问必答小助手,您的问题已经有小伙伴帮您解答,感谢您对有问必答的支持与关注!
    PS:问答VIP年卡 【限时加赠:IT技术图书免费领】,了解详情>>> https://vip.csdn.net/askvip?utm_source=1146287632
    评论
  • 叶功隽 2022-06-07 01:25
    关注

    我主页有爬取图片相关代码

    评论
查看更多回答(3条)

报告相同问题?

问题事件

  • 系统已结题 6月14日
  • 已采纳回答 6月6日
  • 修改了问题 6月6日
  • 修改了问题 6月6日
  • 展开全部

悬赏问题

  • ¥15 VB6.0中PICTUREBOX加载本地图片无法显示
  • ¥100 关于游戏app session获取的问题
  • ¥15 MYSQL数据库建表
  • ¥15 爬虫程序爬取TTGChina网站文章代码
  • ¥35 由于系统缓冲区空间不足或队列已满,不能执行套接字上的操作。
  • ¥15 如何用下图方法在AMESim中搭建离心泵模型
  • ¥15 C#连接服务器,请求时报Ssl/Tsl未能建立安全通道
  • ¥15 xcode15build的c++ dylib在10.15上不兼容
  • ¥15 CPLD如何实现在线逻辑分析
  • ¥15 控制面板卸载无权限!!