php使用selenium如何获得页面具体数据

现在用phpunit-selenium做一个php爬虫的一个东西,爬完之后,获得页面的数据,以及
具体的table表格里面第三行第二个的值等,,新人,求懂的大神帮忙解答,谢谢~

3个回答

我之前做了一个爬虫,解析html使用的方案是phpQuery库,语法贴近jquery的选择器,不妨了解一下。
php的simplexml_load_xxx和xml_parser_create似乎都不适合解析html文件,想请问楼上怎么用xml的。

用正则表达式或者xml解析。
http://cuiqingcai.com/977.html

可以把页面当初xml来解析,然后先定位节点等,再获取对应的数据,或者属性值等。
先自己看看xml原始文件,然后寻找XPATH

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
如何获得页面数据?
数据库数据用TABLE列出在页面中,现在希望当点击页面中某一记录时,使一个另一个TABLE由不可见变为可见,并在这个TABLE中列出该记录的详细信息。现在我想知道的是如何在客户端获得页面中一个记录的详细信息,以显示在另一个TABLE中请各位高手指教,谢谢!
selenium 获得页面cookie信息
我们在做某些接口测试的时候,服务器接受客户端请求的时候要求返回客户端相应的一些cookie信息,否则不接受请求。比如客户端的接口请求要求带上客户端的jsessionid。 因为我们的测试框架是基于selenium的,为了跟同一个平台相融合。我查询了相关资料,在selenium的源码中发现Options类里就有对cookie进行相关操作的方法。 向浏览器增加cookie: def a
javascript如何获得页面数据
高手帮帮我 小弟感激不禁rn rn rn rn [color=#FF0000] rn rn rn $invfind.inv_cd [/color] $invfind.prod_name rn $invfind.bs rn $invfind.kpNamern $invfind.qtyrn $invfind.nowQtyrn $invfind.pricern $invfind.trd_chargern $invfind.found rn $invfind.inv_risk rn $invfind.agent_desc_name_enrn rn rn rn rn rn rn rn rn rn rn rn rn rn rn rn rn rn rn rn rn $invfind.inv_date rn $invfind.trd_checkrn rn rn rn rn rn rn 沒有找到相應的記錄 rn rn rn rn rn rn rn rn rn 首頁rn 前頁rn rn rn $pageNumber rn $pageNumber rn rn rn 下頁rn 尾頁rn rn rn rn rn rn rn rn rn rn rn rn rn rn rn rn rn [color=#FF0000][/color]rn rn rn rn rn rn rn rn rnrnrn
如何通过获得页面数据
第一个页面rnrn第2个页面rnsecond.asp获得第一个页面的数据
如何获得某个城市的天气预报具体数据
如上:如何获得某个城市的天气预报具体数据
PHP获得页面运行时间。
$stime=microtime(true); $etime=microtime(true);//获取程序执行结束的时间 $total=$etime-$stime; //计算差值 echo "<br />当前页面执行时间为:{$total} 秒"; 放到页面头部和尾部即可。...
如何获得窗口句柄 具体
有些窗口的句柄还是获得不到的。rnrn说具体点 比如 qq游戏打开后 能获得大窗口得句柄 但是登陆框那个小句柄得不到。rn用FindWindowEx只能得到大窗口里面的比如 游戏大厅 的句柄。rnrn我现在的要求是对比如那个登陆窗口发键盘消息 如何做到?rnrn比如写个程序就是自动输入帐号和密码。谁能给出详细代码?
使用selenium爬虫抓取数据
使用selenium爬虫抓取数据 文章目录使用selenium爬虫抓取数据@[toc]总体介绍Selenium安装安装火狐浏览器插件Katalon Recorder简单教程抓取网易房地产数据例子参考链接 总体介绍 Selenium 简单入门教程 使用 Selenium 模拟访问网易数据中心的房价数据 使用 BeautifulSoup 解析网页信息 使用 Pandas 处理数据 使用 Matplo...
php 如何获得当前页面地址
http://202.116.74.148/data/search.php?database=hongshu_68rnrn1.php 如何获取当前页面地址:http://202.116.74.148/data/search.php?database=hongshu_68rnrn2.php 如何获取当前页面地址?后面参数的值 : database的值
C# Selenium 具体代码
在c# 中应用selenium的一些写法
使用Selenium对WEB端具体字段的测试方法
使用selenium对WEB进行自动化测试,里面的一些方法分享: selenium.getText(String Locator) 这个方法可以对非输入框的字段验证或者是对Boolean型字段的验证,Locator可以是ID或者HTML路径,是ID需要开发人员针对每个字段赋值。 selenium.getValue(String Locator)对输入框的验证。 ...
Selenium如何操作页面元素
(1)输入框 用sendKeys方法输入需要的字符串 sendKeys("aa"); (2)按钮 用click方法进行点击 driver.findElement(By.xpath("//form/input")).click(); (3)下拉选择框 使用Select类进行操作,但首先要导入org.openqa.selenium.support.ui.Select包 WebDrive
ASP.NET中如何获得页面所填数据?
比如在页面中有一个textbox,里面填了一些数据rn我如何用<%=Html.ActionLink("查询", "funcName/参数" )%>rn在这个‘参数’位置填入页面中textbox.value呢?rnrn主要有如下限制:rn1、只能用actionlink,因为是在一个大表单中,所以不能用嵌套form递交的办法来获得textbox中的数据。rn2、工程原因不能使用 JQrnrn谢谢各位~~~
如何获得颜色的具体数值?
已知一变量:COLORREF rgb,而且已经赋值,现在想得到各个Red, Green,Blue的具体数值,如何获得?rn
如何获得本周一的具体日期?
能用SQL语句最好了,因为我想直接通过一个查询,将结果返回给我的C程序。rn不然的话只能用存储过程了?
php如何异步获得接口返回的数据
有个项目,需要向一个接口发送一个请求,同时对该接口返回的数据做其他的操作。rn所有这些操作都要放在php片段里,不能用js实现。rn以前的这部分程序时asp写的,用的是CreateObject("Msxml2.ServerXMLHTTP"),不知道php该如何实现?rn请求高手指点~
如何用php 获得访问者使用的浏览器的具体尺寸?
如题?
php 页面数据显示??
在网页里显示php从数据库里读取出来的信息,rnrn请问各位:php里有没有像java里的El表达式,或是JSTL啊。rnrnphp在网页上显示数据一般怎么处理啊,总不会都用php脚本()吧.rnrn请各位指教,小弟刚接解php.rnrn我看到有项目中使用$smarty.request.return_module,rnrn不知道这是否就是一种什么表达式,有没有这方面的学习资料,如果有的话请贴出来啊,谢谢了.
PHP页面包涵数据
1.先写一个base.html主体页面,将公共部分放在base.html页面中调用 2.在各个页面中调用公共的base.html页面 {extend  name=“相对路径+base.html”} //base.html页面 {include file='public/template/index/iecheck.html'" /} //兼容IE的html语言 {include f
php 抓取页面数据
$url = 'http://product.dangdang.com/23812052.html'; $str = file_get_contents($url);//抓取函数 preg_match_all('/(? ]) ]*src=[\'"]*([^\'"]*)[\'"][^>]*>(?=[ ])/is', $str , $ar );//正则你想要的数据 $st
22.2.3 使用Selenium爬取数据
本视频课程是《Python从小白到大牛》中的第四篇第一个实战项目,内容包括网络爬虫技术、使用urllib爬取数据、使用Selenium爬取数据、使用正则表达式、使用BeautifulSoup库、MySQL数据库、Python访问数据库、Lambda表达式和多线程。
如何获得来源页面?
一个页面a.asp被其他网页弹出(window.open)rnrna.asp如何获得来源页面?
如何使用PHP获得当前页面的地址???
如何使用PHP获得当前页面的地址?
java selenium firefox (图形界面)爬取页面数据
获取网页指定内容信息,每次都通过手动打开网页进入指定页面,操作频繁却又不得不做。想着能否通过程序代替人工。         上网查了下相关资料,大致是selenium jar包对象使用(负责操作页面,获取页面内容),再这里记录一下,方便日后使用。         实现步骤:         1 安装好开发环境(firefox最新版本,只支持jdk1.8以上版本)      
PHP如何获得文件类型
如何判断存在的文件的类型(不是上传的)?rn要求得到一个类似于$_FILES['userfile']['type']所能得到的类型,比如image/gif,application/x-zip-compressed。
table提交获得页面数据
function saveExcel(){ var col1=&quot;&quot;; var col2=&quot;&quot;; var col3=&quot;&quot;; $('#table').find('tr').each(function(){ col1=col1+($(this).find('td:first').text())+&quot;,&quot; col2=col2+($(this).find('td:eq(1)')....
Selenium实战:爬取淘宝页面数据
淘宝页面数据使用Ajax获取,所以最方便的方式还是采用Selenium抓取,最后将商品数据保存为json格式文件。 工具:ChromeDriver与Selenium from selenium import webdriver from selenium.common.exceptions import TimeoutException from selenium.webdriv...
selenium 如何获取分页数据
selenium 如何获取分页数据
PHP无法获得post数据
有没有谁在PHP中遇到过前台post传递值,后台用$_POST无法获取值
获得天空网中的数据.php
获得天空网中的数据,采集数据。这个采集的数据全是天空网中软件名称,采集完保存在数据库中。。
WshShell.Exec()具体如何使用?
WshShell.Exec()具体如何使用?用这个能否调用客户端的程序?如NetMeeting?
CListView具体如何使用。
CListView具体如何使用。
python3 + selenium 使用 JS操作页面滚动条
js2 = &quot;window.scrollTo(0,0);&quot; #括号中为坐标 当不知道需要的滚动的坐标大小时: weizhi2 = driver.find_element_by_id(&quot;goldLeaseApp_bClientID&quot;) #先定位到一个元素 driver.execute_script(&quot;arguments[0].scrollIntoView();&quot;, weizhi2) #让其滚...
使用selenium爬取淘宝页面中的商品信息
一、分析 淘宝页面中的商品都是用js动态加载的,所以使用selenium模块抓取内容 1.首先分析如何用关键字搜索内容 2.打开浏览器 3.然后分析页面结构,抓取信息 4.其次获取商品具体信息的话需要打开二级页面 5.需要找到下一页的按钮用于模拟点击下一页,从而获取所有页面的相关信息 二、开始操作 1.首先分析如何用关键字搜索内容 注意到页面的规律为https://s.taobao.com/sea...
使用selenium给更改页面元素的css属性
package com.gloryroad.Demo; import org.openqa.selenium.By; import org.openqa.selenium.JavascriptExecutor; import org.openqa.selenium.WebDriver; import org.openqa.selenium.WebElement; import o
使用selenium抓取JS动态生成的页面
在抓取网页数据时,传统jsoup方案只能对静态页面有效,而有些网页数据往往是js生成的,所以这时候需要其它的方案。 首先的思路是分析js程序,对js的请求进行再次抓取,这适合于特定的页面抓取,要做到对不同目标URL的通用性,比较麻烦。 第二种思路,也是比较成熟的做法是利用第三方的驱动渲染页面,然后下载。这里介绍一下第二种实现思路。 Selenium是一个模拟浏览器的自动化测试工具,它
使用selenium获取ajax加载的页面信息
使用selenium获取ajax加载的页面信息 实验网站:豆瓣电影剧情片 主要使用模块: selenium (pip install selenium) lxml (pip install lxml) 主要思路:因为直接使用selenium访问豆瓣页面是不行的,需要让selenium执行一段js脚本滑动滚动条,才能使豆瓣页面刷新,获取到需要的内容。 代码如下 """ 使用s...
python 之使用selenium滑动页面下拉方式
若要对页面中的内嵌窗口中的多个滚动条进行操作,要先定位到该内嵌窗口,在进行滚动条操作 使用这个方法:(其中,scall是这个div的class的名字,如过就一个这种div,直接中括号后面用0就可以,如果多个滑动div的class的name一样,需要先找找你需要下拉的div是第几个,如果是第三个,把下面[0],改为[2]) js='document.getElementsByClassName("...
php如何使用Lumen页面传递json数据
php越来越受前端的喜爱,特别是集成的lumen框架,代码优雅,很适合前端工程师来快速开发高质量的代码
使用selenium模拟动态登录百度页面
目标:模拟手动登录百度页面的过程,打开chrome浏览器,输入百度网址,进入百度网页,点击登录,输入账号和密码,进入登录页面。 代码演示过程: from selenium import webdriver import time # 1.打开浏览器 driver = webdriver.Chrome() # 2.设置地址 url = &amp;amp;quot;https://www.baidu.com/&amp;amp;quot;...
相关热词 c# stream 复制 android c# c#监测窗口句柄 c# md5 引用 c# 判断tabtip 自己写个浏览器程序c# c# 字符串变成整数数组 c#语言编程写出一个方法 c# 转盘抽奖 c#选中treeview