zhangpan_soft 2018-07-23 06:31 采纳率: 50%
浏览 531
已采纳

求一个正则,坐等,急急急!

正则需求如下,有一个字符串,字符串为html页面,要求检索html标签中,如href,src等,如果地址不包含http|https则自动添加上http,比如

 String s = "<html><a href=\"www.baidu.com\">测试</a></html><img src=\"www.test.com/1.jpg\">";
 替换为
 String s1 = "<html><a href=\"http://www.baidu.com\">测试</a></html><img src=\"http://www.test.com/1.jpg\">"
 或者类似这样的"://...." 替换为"http://...",总之就是html中的所有地址替换为标准地址,如果本身为标准地址则不替换
  • 写回答

2条回答 默认 最新

  • little_how 2018-07-23 06:45
    关注
     String s = "<html><a href=\"https://www.baidu.com\">测试</a></html><img src=\"www.test.com/1.jpg\">";
            s = s.replaceAll("(href|src)=\"(?!http)(.+?)\"", "$1=\"http://$2\"");
            System.out.println(s);
    

    这个是java语言的,其中

     "(href|src)=\"(?!http)(.+?)\""
    

    是正则表达式,
    在支持正则的语言中都可以
    希望可以帮到你....

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

悬赏问题

  • ¥15 求差集那个函数有问题,有无佬可以解决
  • ¥15 【提问】基于Invest的水源涵养
  • ¥20 微信网友居然可以通过vx号找到我绑的手机号
  • ¥15 寻一个支付宝扫码远程授权登录的软件助手app
  • ¥15 解riccati方程组
  • ¥15 display:none;样式在嵌套结构中的已设置了display样式的元素上不起作用?
  • ¥15 使用rabbitMQ 消息队列作为url源进行多线程爬取时,总有几个url没有处理的问题。
  • ¥15 Ubuntu在安装序列比对软件STAR时出现报错如何解决
  • ¥50 树莓派安卓APK系统签名
  • ¥65 汇编语言除法溢出问题