zhkbx 2018-06-18 05:38 采纳率: 0%
浏览 1534
已结题

请问这个正则表达式应该怎么修改才能实现截取最靠近中间字符的某个字符串开始截取字符

后端VB写程序提取网站的数据。要提取网页代码中的数据,网页基本格式如下
.......
《li》姓名:张三《/li》
《li》年龄:35《/li》
《li》职业:教师《/li》
.....
《li》分数:99《/li》
....

我就要提取分数进行统计,我写的正则表达式内容为《li 》[^\x00]+?分数[^\x00]+?《/li》
提取出来都带有姓名等不必要的信息,提出来是
《li》姓名:张三《/li》
《li》年龄:35《/li》
《li》职业:教师《/li》
.....
《li》分数:99《/li》
这样后期还要再进行按《/li》分割字符再筛选。虽然结果可以出来,但是不是很喜欢。请问怎么改正则定义才能实现只从最靠近"分数"的《li》字符开始提取,提取出来就是《li》分数:99《/li》这段就好了。
谢谢先

不是只提取数字呀,要一整段《li》分数:99《/li》,就是《li》需要最靠近分数左边的这个

补充:我不是要文本内容,我要截“分数”所在的

网页源代码,我现在写的正则把网页源码中出现的第一个“姓名”开始到“分数”后面的给我返回来了。我不知道怎么改成只返回“分数”左边的(就是事列代码中地4个)到“分数”右边的第一个
  • 写回答

11条回答

  • M_Mark 2018-06-18 05:43
    关注

    不知道你是用前端语言还是后端语言,如果是后端语言的话有很多第三方开源库可以轻松做到

    评论

报告相同问题?

悬赏问题

  • ¥15 三菱伺服电机按启动按钮有使能但不动作
  • ¥20 为什么我写出来的绘图程序是这样的,有没有lao哥改一下
  • ¥15 js,页面2返回页面1时定位进入的设备
  • ¥200 关于#c++#的问题,请各位专家解答!网站的邀请码
  • ¥50 导入文件到网吧的电脑并且在重启之后不会被恢复
  • ¥15 (希望可以解决问题)ma和mb文件无法正常打开,打开后是空白,但是有正常内存占用,但可以在打开Maya应用程序后打开场景ma和mb格式。
  • ¥15 绘制多分类任务的roc曲线时只画出了一类的roc,其它的auc显示为nan
  • ¥20 ML307A在使用AT命令连接EMQX平台的MQTT时被拒绝
  • ¥20 腾讯企业邮箱邮件可以恢复么
  • ¥15 有人知道怎么将自己的迁移策略布到edgecloudsim上使用吗?