2 u011272628 u011272628 于 2018.07.12 06:41 提问

如何爬虫onclick的内容 5C

国家专利,高级检索,查看详细,是一个点击,而不是一个链接。
h
[查看详细]

不用模拟点击,应该如何提取。以下是,网站地址
tttp://www.pss-system.gov.cn/sipopublicsearch/patentsearch/tableSearch-showTableSearchIndex.shtml

3个回答

caozhy
caozhy   Ds   Rxr 2018.07.12 06:56

这个网站提示不是注册用户,不让查询。你提问的时候应该提供测试账户,以及一些测试用的输入数据才好帮你分析。

不过作为一般性的方法,你可以调试
viewDesc()
这个函数,看它都做了什么操作

或者不管这些,而是用浏览器的f12的network功能抓http包,然后分析发送的链接和CN201810098063.320180605FM是否存在什么对应关系。
你也可以把以上两者结合起来。

bealing
bealing   Rxr 2018.07.12 09:17

用Selenum+PhantomJS 模拟点击

sky_cao
sky_cao   2018.07.12 14:34

分析调试,找到API接口。

Csdn user default icon
上传中...
上传图片
插入图片
准确详细的回答,更有利于被提问者采纳,从而获得C币。复制、灌水、广告等回答会被删除,是时候展现真正的技术了!
其他相关推荐
用scrapy框架爬取js交互式表格数据
0. 问题背景 前段时间,我有个朋友让我帮他从网页上自动下载些表格数据。像这个网站http://wszw.hzs.mofcom.gov.cn/fecp/fem/corp/fem_cert_stat_view_list.jsp的表格数据。其难点在于每页的url地址是不变的,有一个交互的过程,需要用户选择第几页,网页才返回数据。要是没有这个过程,用普通的wget也可以解决。 1. scra
js 动态加载function(onclick= function ())
转:http://hi.baidu.com/deli9999/blog/item/3e19831d5a6dfa8786d6b62c.htmlhttp://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">http://www.w3.org/1999/xhtml" >        function cancleEvent(){        d
Python 爬虫学习
本节课程的内容是介绍什么是爬虫?爬虫有什么用?以及爬虫是如何实现的?从这三点来全面剖析爬虫这一工具。
爬虫爬取ajax内容
很多网站都使用javascript...网页内容由js动态生成,一些js事件触发的页面内容变化,链接打开.甚至有些网站在没有js的情况下根本不工作,取而代之返回你一条类似"请打开浏览器js"之类的内容. 对javascript的支持有四种解决方案: 1,写代码模拟相关js逻辑. 2,调用一个有界面的浏览器,类似各种广泛用于测试的,selenium这类. 3,使用一个无界面的浏览器,各种
Google 爬虫如何抓取 JavaScript 的?
(点击上方公众号,可快速关注) 编译:伯乐在线/刘健超-J.c 如果好文章投稿,点击 → 了解详情 我们测试了谷歌爬虫是如何抓取 JavaScript,下面就是我们从中学习到的知识。 认为 Google 不能处理 JavaScript ?再想想吧。Audette Audette 分享了一系列测试结果,他和他同事测试了什么类型的
a标签click和href执行顺序探讨
前提:项目中开始绑定document click事件, 在document子类的一个a标签也绑定了click时间, 想要实现效果,就是click事件触发完成后 document事件不触发。即组织事件冒泡,加了阻止事件冒泡方法(e.stopPropagation(); e.preventDefault();)也不行,这种现在只有在google下发生,ff不会发生。 原因:是超链接的href=“#”
[JS] addEventListener和onclick的区别
function a(){ alert("A"); } var b = function(){ alert("B") } dom.onclick=a dom.onclick=function(){ b() } //失效 dom.onclick=alert(""); dom.addEventListener("click",a) dom.addEventListener("cli
网络视频爬虫系统的实现
设计了网络视频爬虫的基本架构、详细讨论了如何有效的避免重复遍历网页和如何快速的更新网站内容的两个关键问题和网络视频爬虫下戴视频和抓取网页的工作方式。
python爬虫-->抓取动态内容
上几篇博文讲的都是关于抓取静态网页的相关内容,但是现在市面上绝大多数主流网站都在其重要功能中依赖JavaScript,使用JavaScript时,不再是加载后立即下载所有页面内容,这样就会造成许多网页在浏览器中展示的内容不会出现在html源码中。这时候再用前几篇博文中介绍的办法爬取来数据,得到的数据肯定为空。本篇博文将主要介绍对如动态网页应该如何进行爬取。这里我们将介绍两种办法来抓取动态网页数据
Python 爬虫学习笔记三:多页内容爬取&内容分析及格式化
Python 爬虫学习笔记三:多页内容爬取&内容分析及格式化 python int 与 string 之间的转换: Python int与string之间的转化 string–>int 1、10进制string转化为int  int(‘12’) 2、16进制string转化为int   int(‘12’, 16) int–>str