获取正则表达式的链接文本

How would one parse the content inside these tags, assuming the link is dynamic?

<h3 class="lvtitle">
<a href="http://www.ebay.com/itm/Chicago-Chicago-XXX-Audio-CD-/351478948979?hash=item51d5c72473" 
 class="vip" title="Click this link to access Chicago, Chicago XXX Audio CD">
Chicago, Chicago XXX Audio CD
</a>
</h3>

What I'm after is getting the "Chicago, Chicago XXX Audio CD" part.

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
dri8163 2015-08-15 13:35
关注
Parser example:

$string = '<h3 class="lvtitle"><a href="http://www.ebay.com/itm/Chicago-Chicago-XXX-Audio-CD-/351478948979?hash=item51d5c72473" class="vip" title="Click this link to access Chicago, Chicago XXX Audio CD">Chicago, Chicago XXX Audio CD</a></h3>'; $doc = new DOMDocument(); //make a dom object $doc->loadHTML($string); // load the string into the object $links = $doc->getElementsByTagName('a'); //get all links foreach ($links as $link) { //loop through all links echo $link->nodeValue; //output text content of links }

Output:

Chicago, Chicago XXX Audio CD

References:
http://php.net/manual/en/domelement.getelementsbytagname.php
http://php.net/manual/en/domdocument.loadhtml.php

...or if you really required a regex for some reason ( I don't see why parser wouldn't work)...

$string = '<h3 class="lvtitle"><a href="http://www.ebay.com/itm/Chicago-Chicago-XXX-Audio-CD-/351478948979?hash=item51d5c72473" class="vip" title="Click this link to access Chicago, Chicago XXX Audio CD">Chicago, Chicago XXX Audio CD</a></h3>'; preg_match_all('~<a\h.*?>(.*?)</a>~', $string, $links_content); print_r($links_content[1]);

Output:

Array ( [0] => Chicago, Chicago XXX Audio CD )

~ = delimiter
<a = literally match <a
\h = a horizontal white space
.*? = anything untile the first occurrence of the next character
> = a literal >
(.*?) = a capture grouping capturing everything until the next character again
</a> = literal </a>
~ = closing delimiter

If you prefer regex101 write up, https://regex101.com/r/sT6yA9/1.

Also note the preg_match_all that was incase your string had multiple links in it. With a single occurrence you could use preg_match.
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

想使用正则表达式匹配，提取文本中特定的内容。 python 正则表达式
2022-01-19 16:23

回答 2 已采纳这应该就是你想要的功能： import os, re def GetMiddleStr(content,startStr,endStr): '''提取字符串content当中，startStr
使用正则表达式提取文本数据，正则表达式如何写 python 有问必答正则表达式爬虫
2021-10-25 18:26

回答 2 已采纳 regex = r"('gender':\s*{[^}]+})|('glasses':\s*{[^}]+})|('emotion':.+.jpg')" 不清楚是否你每个文件都是类似的，如果不行，再
正则表达式抽取文本。 python
2021-09-10 10:58

回答 2 已采纳 import re a="...id=1234&" s=re.search(r'id=(.*)&',a) printf(s.group(1)) #1234
php正则表达式获取内容所有链接
2021-01-20 00:53

方法一： function get_all_url($code){ preg_match_all('/[|>' ]+)[|']?s*[^>]*>([^>]+)</a>/i',$code,$arr); return array('name'=>$arr[2],'url'=>$arr[1]); } ...$site=substr($url,0,strpos($url,/,8));...
求一个php正则表达式 php 正则表达式
2022-01-23 19:47

回答 1 已采纳试试这个import repattern = re.compile (r'(?:money=)\d+.?\d*')pattern.findall(string)
C#正则表达式查找非纯数字的字符 c# 正则表达式
2022-04-27 01:53

回答 6 已采纳 (([a-zA-Z_])([a-zA-Z0-9_])+)|(([0-9])([a-zA-Z_])+)
如何用正则表达式把文本提取出来 css python 正则表达式
2019-05-08 20:58

回答 2 已采纳 `re.findall('(.*?)',searchstr,re.DOTALL)`
php正则表达式获取图片地址,正则获取图片地址链接地址
2021-05-07 11:28

EchiTie的博客 /ig正则获取图片地址一、问题：采集的过程中遇到一个问题：从数据库里读出来的图片没有正常显示，分析后发现是数据库里的图片以网站根目录为相对路径方式存储，图片地址如：/uploads/allimg/090403/012F31N9-1.jpg，...
用正则表达式获取src里面的内容 java 正则表达式
2018-09-14 03:19

回答 1 已采纳简单的做法是，修改一下查找src的正则，在前面加一个\s，因为标签的属性前面是使用客格作为分隔的，这里必然有一个\s. 同样的，你data-src也建议加上这个\s
正则表达式 匹配正负整数和正负小数或者空有问必答正则表达式
2021-08-25 15:28

回答 6 已采纳已私聊解决
请教一个PHP正则表达式的问题 php 有问必答正则表达式
2021-08-24 09:13

回答 2 已采纳这样？有帮助麻烦点个采纳【本回答右上角】，谢谢~~ <?php $s=<<<str 1.\$foo->\$bar['baz'] 主要想用两个正则表达式，放入编辑器以查询
php正则表达式取文件路径文件名,用正则表达式获取文件名和路径
2021-04-17 03:08

刘莉旻的博客搜索热词一个文件中包括文件的路径和文件名，用正则表达式来分割路径和文件名$WholePath = "/usr/lib/file.txt";$leadPath = "";$fileName = "";if ($WholePath =~ m!^(.*)/([^/]*)$!) {#能够匹配 $1 和 $2都合法$...
如何使用正则表达式从文本中查找和超链接所有URL？ php
2017-07-19 00:11

回答 1 已采纳 This will slightly improve the accuracy of your original pattern. My pattern will operate nearly
php正则表达式验证超链接,php超链接常用的正则表达式
2021-04-10 13:09

weixin_39760368的博客 3、获取超链接文本内容 //方法一 preg_match_all('/<(a|a)[s]{0,1}[w=":()]*>[nrn]*(check user)[nrn]*/i',$string,$matches); //方法二 preg_match_all('/check user/i',$string,$matches); print_r($matches); //...
正则表达式爬取网页
2022-03-26 09:48

大葱一根的博客 正则表达式 什么是正则表达式？单字符匹配：多字符匹配：小案例开始结束贪婪非贪婪转义字符和原生字符串分组 re模块常用函数爬虫赶集网
没有解决我的问题, 去提问

悬赏问题

¥100 set_link_state
¥15 虚幻5 UE美术毛发渲染
¥15 CVRP 图论物流运输优化
¥15 Tableau online 嵌入ppt失败
¥100 支付宝网页转账系统不识别账号
¥15 基于单片机的靶位控制系统
¥15 真我手机蓝牙传输进度消息被关闭了，怎么打开？(关键词-消息通知)
¥15 装 pytorch 的时候出了好多问题，遇到这种情况怎么处理？
¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
¥15 手机接入宽带网线，如何释放宽带全部速度

获取正则表达式的链接文本

3条回答 默认 最新

悬赏问题

3条回答默认最新