花和尚撸自身 2016-05-20 06:21 采纳率: 30%
浏览 1145
已采纳

如何匹配这个a链接中的地址

项目需要要写一个爬虫来抓取京东等网站的手机秒杀商品信息
如图
图片说明

我用curl获取了这个网页的整个内容,现在需要用正则表达式来对里面的网址、图片地址、价格、商品名进行获取,理想状态是把每一件商品的信息获取出来并组成一个新数组,前面对面title、price都可以获取了,但是两个关键的链接就是不能获取,求解!

图片说明

  • 写回答

1条回答 默认 最新

  • threenewbee 2016-05-20 10:41
    关注

    这个很简单,思路就是不变的地方照抄,其中特殊字符加上斜杠转义,可变的部分用通配符。
    比如第一个

     (?<=href\=\")http\:\/\/item\.m\.jd\.com\/product\/\d+.html(?<\")
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥15 微带串馈天线阵列每个阵元宽度计算
  • ¥15 关于无人驾驶的航向角
  • ¥15 keil的map文件中Image component sizes各项意思
  • ¥30 BC260Y用MQTT向阿里云发布主题消息一直错误
  • ¥20 求个正点原子stm32f407开发版的贪吃蛇游戏
  • ¥15 划分vlan后,链路不通了?
  • ¥20 求各位懂行的人,注册表能不能看到usb使用得具体信息,干了什么,传输了什么数据
  • ¥15 Vue3 大型图片数据拖动排序
  • ¥15 Centos / PETGEM
  • ¥15 划分vlan后不通了