在爬取人人网验证码图片发现如下问题
运行结果是['data:image/jpg;base64,']并且运行结果无法下载验证码图片根据观察网页src属性值发现是
请问这种提取属性值不完整的情况该如何解决。
我的思路上可能是属性值太长,导致的问题,但是并没有找到如何解决的方法
收起
当前问题酬金
¥ 0 (可追加 ¥500)
支付方式
扫码支付
支付金额 15 元
提供问题酬金的用户不参与问题酬金结算和分配
支付即为同意 《付费问题酬金结算规则》
不知道是不是有个逗号的原因,然后把后面给截断了,可以试试正则去提取
import requests,re url = 'https://www.renren.com/login' rep=requests.get(url) data=re.findall("src=.*?==\"",rep.text) print(data)
报告相同问题?
程序员都在用的中文IT技术交流社区
专业的中文 IT 技术社区,与千万技术人共成长
关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!