必须从html页面检索字符串值并将其存储在类别下的xml中

For a project, I need to pull out the value of a character ('v') from an HTML page generated by me.

The HTML page contains the following links with much garbage data around it:

/watch?v=blablabla&list=blablabla&index=7&feature=blablabla
/watch?v=blablabla&list=blablabla&index=8&feature=blablabla

The task is the values of 'v' has to be retrieved & stored under categories in an XML.

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
dpmpa26468 2012-01-19 14:32
关注
Try using regular expressions with preg_match_all

$file = file('path/file.html'); preg_match_all("/\/watch\?v=([a-z0-9]+)&list=[a-z0-9]*&index=[0-9]*/i", $file, $matches);

I'm not sure what the URL's will look like, so the regexp will have to be altered for that.

Try http://gskinner.com/RegExr/ to fine-tune your expression
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Phatpen-Scraper:Scraper，从QuoteMedia抓取XML以获取公司名称和符号并将其存储在Redis数据库中
2021-05-22 09:34

在这个项目中，JavaScript被用来构建网络请求，处理接收到的XML数据，并将其整理成适合存储的格式。 1. **网络请求**：Phatpen-Scraper 使用了Node.js的HTTP库或第三方库如axios或request，来发送HTTP GET请求到...
oracle怎么从大字段中取节点,Oracle数据库获取CLOB字段存储的xml格式字符串指定节点的值...
2021-05-07 12:09

TechSavvy的博客表单信息是以xml格式的字符串存储在colb类型的字段dataxml中，如何获取呢？参考百度内容，写一个function(函数)，参数有xml格式字符串(dataxml值)和指定节点(nodeName)，返回指定节点的值(nodeValue)。编码实现：--...
jsp实现将信息放入xml中的方法
2020-10-23 06:53

在探讨JSP（Java Server Pages）如何将信息嵌入到XML文件中时，核心涉及的技术包括：JSP编程、Servlet技术、AJAX（Asynchronous JavaScript and XML）以及XML数据的生成和处理。这些技术的结合可以让Web应用更加动态...
在XSD指导下创建XML，不是生成示例xml（草稿，不用审核）
2019-04-03 14:13

在IT行业中，XML（eXtensible Markup Language）是一种用于存储和传输数据的标记语言，它的结构化特性使其非常适合在各种应用中使用，包括交互式电子技术手册（IETM）。XSD（XML Schema Definition）则是一种规范，...
JSON 与 XML 对比：数据存储场景下的格式选择逻辑
2025-10-27 14:10

ghjckjkjkjk的博客 JSON：一种轻量级数据交换格式，基于JavaScript对象语法，使用键值对结构。。它易于读写，常用于Web应用和...XML：一种标记语言，通过标签定义数据结构和内容。。它支持复杂文档和元数据，适用于配置文件或企业级系统。
Web前端面试题(附答案及解析)（2026.1月最新版）
2023-03-27 14:31

Komorebi ঞ꧔ꦿ的博客【Web 前端面试必备】精选高频面试题 + 详细答案解析，搭配实战总结心得，帮你高效复盘考点、轻松应对面试！内容会持续更新，你的每一份支持都是我更新的动力，感谢关注！
XML解析(DOM4j)&检索(Xpath)
2023-04-30 22:54

GaoSSR的博客一. 配置文件XML在以后更多的是用来作为配置文件的。一. 配置文件什么是配置文件二. XML概述三. XML的创建、语法规则根标签就是写在最外面的标签。
前端速成教程（HTML、CSS、JS、Vue…）
2024-05-06 21:51

Akira37R的博客 Vue是一套前端框架，免除原生JavaScript中的DOM操作，简化书写。基于MVVM（Model-View-ViewModel）思想，实现数据的双向绑定，将编程的关注点放在数据上。Vue-cli是Vue官方提供的一个脚手架，用于快速生成Vue项目...
RSS订阅在前端中的使用
2025-08-29 18:09

大丈夫在世当日食一鲲的博客 RSS进阶版,PWA（Progressive Web App，渐进式 Web 应用）是一种通过现代 Web 技术构建的应用程序，它融合了 Web 应用...解析XML数据：获取到原始的RSS XML字符串后，需要将其解析为前端JavaScript可以方便操作的对象。
daily-calender:一个简单的应用程序，用于显示存储在JSON文件中的每日计划事件
2021-05-17 11:32

1. **AJAX**（Asynchronous JavaScript and XML）：这是一种在后台与服务器交换数据并更新部分网页的技术，使得页面无需重新加载即可显示新数据。在每日日历应用中，AJAX可以用于在不刷新整个页面的情况下，添加、...
没有解决我的问题, 去提问

必须从html页面检索字符串值并将其存储在类别下的xml中

1条回答 默认 最新

1条回答默认最新