从文档中提取特定的<a href> URL

I think this should be elementary, but I still can't get my head around it. Let's say there's fair amount of HTML documents and I need to catch every image URLs out of them.

The rest of the content changes, but the base of the url is always the same for example: http://images.examplesite.com/images/,

So I want to extract every string that contains that part. the problem is that they're always mixed with <a href=''> or <img src=''> tags, so how could I drop them out? preg_match probably?

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
douyong7199 2010-07-20 07:40
关注
Try something like: preg_match_all('/http:\/\/images\.examplesite\.com\/images\/(.*?)"/i', $html_data, $results, PREG_SET_ORDER)

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

从文档中提取特定的<a href> URL php
2010-07-20 07:37

回答 2 已采纳 Try something like: preg_match_all('/http:\/\/images\.examplesite\.com\/images\/(.*?)"/i', $html_d
如何从txt文档中提取特定的信息并保存到Excel中 python
2021-08-29 00:16

回答 1 已采纳你好，我真的是想表达一句，如果条件允许，尽量的采用付费咨询，时间充足可以是付费专栏，或者购买一些课件去学习。这样比你直接打代码让别人给你看问题效率高，何况你这是科研工作相关，门槛相对就高一些。至少有悬
使用PHP从XML文档中的属性中提取信息 php xml
2014-03-20 13:51

回答 4 已采纳 simplexml_load_string() makes working with XML easy for basic tasks like this: <?php $event= s
HTML中的<head>标签及其内容
2015-08-24 16:33

puppylpg的博客 <head> 标签用于定义文档的头部，它是所有头部元素的容器。 <head> 中的元素可以： - 引用脚本 - 指示浏览器在哪里找到样式表 - 提供元信息 - 等等文档的头部描述了文档的各种属性和信息，包括文档的标题、在...
unicode中的PHP变量错误 php
2016-04-10 17:23

回答 1 已采纳 I think that’s rather your fault, because you are appending the value to the URL query string comp
无法使用PHP通过Cloud Firestore从嵌套集合中获取文档 php
2018-05-06 21:58

回答 1 已采纳 As a workaround, I am able to get the data from the nested document like so: $db = new Firestore
从html文档中提取特定部分，php cURL，php，preg_match php
2010-05-04 18:41

回答 4 已采纳 A very basic example would be highly appreciated To answer the regex part: preg_match('!&l
XSS总结(含绕过)
2021-07-28 23:31

J0hnson666的博客简述XSS攻击通常指的是通过利用网页开发时留下的漏洞，通过巧妙的方法注入恶意指令代码到网页，使用户加载并执行攻击者恶意制造的网页程序。...rel="noopener noreferrer">很全的xss总结</a><br /> <a href=...
如何使用PHP从HTML文档中仅提取某些标签？ php
2012-03-27 20:10

回答 3 已采纳 Check out Simple HTML Dom. It will grab external pages and process them with fairly accurate detai
如何用php，将<textarea>内的文本和媒体内容写入doc文档 javascript php
2018-09-23 05:05

回答 1 已采纳两个办法，一个是直接用scrpting库和剪贴板，粘贴到word里保存。不需要服务器，但是需要客户端安装word 另一个是先提交textarea到服务器，用phpword生成word，然后下载给客户
如何在PHP中从XML（快速信息文档）中获取所有子标签 php xml
2018-02-16 07:10

回答 1 已采纳 The problem is caused by simple_html_dom trying to correct your XML. There are a few issues with
HTML中的-head-标签及其内容
2016-01-29 16:14

puppylpg的博客 <head> 标签用于定义文档的头部，它是所有头部元素的容器。 <head> 中的元素可以： - 引用脚本 - 指示浏览器在哪里找到样式表 - 提供元信息 - 等等文档的头部描述了文档的各种属性和信息，包括文档的标题、在...
<servlet-name>SpringMVC</servlet-name>报红，这一般是哪里错了 intellij-idea spring tomcat 有问必答
2021-05-03 15:41

回答 4 已采纳一般红鼠标移动上去是有提示的，你看看是啥。如果启动不报错的话，其实报红也无所谓。报错了就把错误信息贴出来。
php table表格样式,JavaScript_JavaScript DOM操作表格及样式，一操作表格 <table>标签是 - phpStudy...
2021-03-25 10:51

浔玉无良的博客 JavaScript DOM操作表格及样式一操作表格标签是HTML中结构最为复杂的一个,我们可以通过DOM来创建生成它,或者HTMLDOM来操作它;// 使用DOM来创建表格;var table = document.createElement('table');table.border = 1;...
html学习一
2018-01-31 02:31

weixin_33704591的博客通常情况下，浏览器会从当前文档的 URL 中提取相应的元素来填写相对 URL 中的空白。使用 <base> 标签可以改变这一点。浏览器随后将不再使用当前文档的 URL，而使用指定的基本 URL 来解析所有的相对 URL。这其中...
没有解决我的问题, 去提问

悬赏问题

¥15 uniapp uview http 如何实现统一的请求异常信息提示？
¥15 有了解d3和topogram.js库的吗？有偿请教
¥100 任意维数的K均值聚类
¥15 stamps做sbas-insar，时序沉降图怎么画
¥15 买了个传感器，根据商家发的代码和步骤使用但是代码报错了不会改，有没有人可以看看
¥15 关于#Java#的问题，如何解决？
¥15 加热介质是液体，换热器壳侧导热系数和总的导热系数怎么算
¥100 嵌入式系统基于PIC16F882和热敏电阻的数字温度计
¥20 BAPI_PR_CHANGE how to add account assignment information for service line
¥500 火焰左右视图、视差（基于双目相机）

从文档中提取特定的<a href> URL

2条回答 默认 最新

悬赏问题

2条回答默认最新