qq_53851565 2022-04-19 16:35 采纳率: 66.7%
浏览 80
已结题

xpath定位验证码的src,可是显示不完全

这是验证码的src:data:image/jpg;base64,(后面省略)

可是我用xpath爬取的结果没有显示“base64,”后面的内容。

import requests
from lxml import etree

#1.对验证码图片进行捕获和识别
headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.75 Safari/537.36 Edg/100.0.1185.36'
    }
url = 'http://www.renren.com/login?to=http%3A%2F%2Fwww.renren.com%2F'
page_text = requests.get(url=url,headers=headers).text
tree = etree.HTML(page_text)
code_img_src = tree.xpath('//*[@id="app"]/div[3]/div/div[1]/div[2]/div[2]/div[3]/div/img/@src')[0]
print(code_img_src)

data:image/jpg;base64,

Process finished with exit code 0


我希望能够显示完整的验证码src。

  • 写回答

1条回答 默认 最新

  • 䴺矏 2022-04-19 16:53
    关注

    img

    第一次是没有验证码的,你需要单独请求获取到

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录

报告相同问题?

问题事件

  • 系统已结题 4月27日
  • 已采纳回答 4月19日
  • 创建了问题 4月19日

悬赏问题

  • ¥15 关于#matlab#的问题:在模糊控制器中选出线路信息,在simulink中根据线路信息生成速度时间目标曲线(初速度为20m/s,15秒后减为0的速度时间图像)我想问线路信息是什么
  • ¥15 banner广告展示设置多少时间不怎么会消耗用户价值
  • ¥16 mybatis的代理对象无法通过@Autowired装填
  • ¥15 可见光定位matlab仿真
  • ¥15 arduino 四自由度机械臂
  • ¥15 wordpress 产品图片 GIF 没法显示
  • ¥15 求三国群英传pl国战时间的修改方法
  • ¥15 matlab代码代写,需写出详细代码,代价私
  • ¥15 ROS系统搭建请教(跨境电商用途)
  • ¥15 AIC3204的示例代码有吗,想用AIC3204测量血氧,找不到相关的代码。