问题遇到的现象和发生背景
在爬取人人网验证码图片发现如下问题
问题相关代码,请勿粘贴截图
运行结果及报错内容
运行结果是['data:image/jpg;base64,']
并且运行结果无法下载验证码图片
根据观察网页src属性值发现是
请问这种提取属性值不完整的情况该如何解决。
我的解答思路和尝试过的方法
我的思路上可能是属性值太长,导致的问题,但是并没有找到如何解决的方法
在爬取人人网验证码图片发现如下问题
运行结果是['data:image/jpg;base64,']
并且运行结果无法下载验证码图片
根据观察网页src属性值发现是
请问这种提取属性值不完整的情况该如何解决。
我的思路上可能是属性值太长,导致的问题,但是并没有找到如何解决的方法
不知道是不是有个逗号的原因,然后把后面给截断了,可以试试正则去提取
import requests,re
url = 'https://www.renren.com/login'
rep=requests.get(url)
data=re.findall("src=.*?==\"",rep.text)
print(data)