qq_53851565 2022-04-19 16:35 采纳率: 66.7%
浏览 85
已结题

xpath定位验证码的src,可是显示不完全

这是验证码的src:data:image/jpg;base64,(后面省略)

可是我用xpath爬取的结果没有显示“base64,”后面的内容。

import requests
from lxml import etree

#1.对验证码图片进行捕获和识别
headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.75 Safari/537.36 Edg/100.0.1185.36'
    }
url = 'http://www.renren.com/login?to=http%3A%2F%2Fwww.renren.com%2F'
page_text = requests.get(url=url,headers=headers).text
tree = etree.HTML(page_text)
code_img_src = tree.xpath('//*[@id="app"]/div[3]/div/div[1]/div[2]/div[2]/div[3]/div/img/@src')[0]
print(code_img_src)

data:image/jpg;base64,

Process finished with exit code 0


我希望能够显示完整的验证码src。

  • 写回答

1条回答 默认 最新

  • 䴺矏 2022-04-19 16:53
    关注

    img

    第一次是没有验证码的,你需要单独请求获取到

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录

报告相同问题?

问题事件

  • 系统已结题 4月27日
  • 已采纳回答 4月19日
  • 创建了问题 4月19日

悬赏问题

  • ¥30 STM32 INMP441无法读取数据
  • ¥100 求汇川机器人IRCB300控制器和示教器同版本升级固件文件升级包
  • ¥15 用visualstudio2022创建vue项目后无法启动
  • ¥15 x趋于0时tanx-sinx极限可以拆开算吗
  • ¥500 把面具戴到人脸上,请大家贡献智慧
  • ¥15 任意一个散点图自己下载其js脚本文件并做成独立的案例页面,不要作在线的,要离线状态。
  • ¥15 各位 帮我看看如何写代码,打出来的图形要和如下图呈现的一样,急
  • ¥30 c#打开word开启修订并实时显示批注
  • ¥15 如何解决ldsc的这条报错/index error
  • ¥15 VS2022+WDK驱动开发环境