2 u011272628 u011272628 于 2018.07.12 06:41 提问

如何爬虫onclick的内容 5C

国家专利,高级检索,查看详细,是一个点击,而不是一个链接。
h
[查看详细]

不用模拟点击,应该如何提取。以下是,网站地址
tttp://www.pss-system.gov.cn/sipopublicsearch/patentsearch/tableSearch-showTableSearchIndex.shtml

3个回答

caozhy
caozhy   Ds   Rxr 2018.07.12 06:56

这个网站提示不是注册用户,不让查询。你提问的时候应该提供测试账户,以及一些测试用的输入数据才好帮你分析。

不过作为一般性的方法,你可以调试
viewDesc()
这个函数,看它都做了什么操作

或者不管这些,而是用浏览器的f12的network功能抓http包,然后分析发送的链接和CN201810098063.320180605FM是否存在什么对应关系。
你也可以把以上两者结合起来。

sky_cao
sky_cao   2018.07.12 14:34

分析调试,找到API接口。

bealing
bealing   Rxr 2018.07.12 09:17

用Selenum+PhantomJS 模拟点击

Csdn user default icon
上传中...
上传图片
插入图片
准确详细的回答,更有利于被提问者采纳,从而获得C币。复制、灌水、广告等回答会被删除,是时候展现真正的技术了!
其他相关推荐
关于如何使用按钮(onclick)打开链接
关于如何使用按钮(onclick)打开链接 做网页的时候遇到一个问题,如何使用onclick打开超链接,后来查到一篇文章解决了问题。 利用javascript onclick跳转链接网页 文章很短,如下,我选其中一句话,就可以解决问题 最后我就改成了如下的形式 到这里就差不多了,就可以通过点击按钮来实现网页的跳转 下面还是讲一下我自己做的一个
python 爬虫工具记录
记录一些常用的爬虫工具:常用爬虫库1、Requests比较简单,常用的爬虫库2、pyspider一个国人编写的强大的网络爬虫系统并带有强大的WebUI。采用Python语言编写,分布式架构,支持多种数据库后端,强大的WebUI支持脚本编辑器,任务监视器,项目管理器以及结果查看器3、ScrapyScrapy 使用了 Twisted'twɪstɪd异步网络框架来处理网络通讯,可以加快我们的下载速度,不...
Python 爬虫学习
本节课程的内容是介绍什么是爬虫?爬虫有什么用?以及爬虫是如何实现的?从这三点来全面剖析爬虫这一工具。
网络视频爬虫系统的实现
设计了网络视频爬虫的基本架构、详细讨论了如何有效的避免重复遍历网页和如何快速的更新网站内容的两个关键问题和网络视频爬虫下戴视频和抓取网页的工作方式。
用scrapy框架爬取js交互式表格数据
0. 问题背景 前段时间,我有个朋友让我帮他从网页上自动下载些表格数据。像这个网站http://wszw.hzs.mofcom.gov.cn/fecp/fem/corp/fem_cert_stat_view_list.jsp的表格数据。其难点在于每页的url地址是不变的,有一个交互的过程,需要用户选择第几页,网页才返回数据。要是没有这个过程,用普通的wget也可以解决。 1. scra
Python爬虫如何获取动态内容-上
首先这里说一下我标题动态内容指的就是一个网页,每天你去浏览它的时候有些内容是更新的,所以这些是在源代码里面没有的。例子为B站每天的轮播和静态推荐内容都是不断更新的。 因此,如果想要爬取这些信息,一直用之前的爬取方式:requests.get(URL) ,是找不到这些的。用的是和get相呼应的:requests.post(URL) 。 关键一,就是如何正确得到这些动态更新内容的URL:
爬虫一:爬取基本静态界面的标签内容_
chrome中CSS Selector与XPath均为描述一个标签的路径CSS Selector的描述方式为:body->div.main-content >ul > li:nth-child(1)->img的方式而XPath为:html/body/div[2]/ul/li[1]/img其中汤勺只认Selector方式的路径#coding=utf-8 import json...
爬虫奇遇记——如何按照标签的文本内容来抓取
俗话说的好:只要能爬下来,其他都不是事。 昨天写爬虫遇到这样一个情况:父标签的class内容都一样,里面子标签只有标签带文本,还是来张图比较明了: 我又要以站长之家的为例说明了 可以发现,这两块,父标签和子标签内容一模一样,findall第一个指向的是第一块的,直接用索引我试过,一开始是可以的,但是对于其他网页,有的并没有注册商这一块,这时候索引就对不上了,还有可能报IndexErr
Python 爬虫学习笔记三:多页内容爬取&内容分析及格式化
Python 爬虫学习笔记三:多页内容爬取&内容分析及格式化 python int 与 string 之间的转换: Python int与string之间的转化 string–>int 1、10进制string转化为int  int(‘12’) 2、16进制string转化为int   int(‘12’, 16) int–>str
Python爬虫时获取标签内全部文本内容的四种方式
    前文提到了Python爬虫框架之一的——Scrapy框架安装和相关命令的简单使用,熟悉了起码的实用流程。今天我们进行一些细节上的总结。如题,在我们要获取目标文本所在的标签时,通常有几种方法,下面我们挨个举例说明各种用法的使用:     以百度贴吧小说吧中的一篇小说为例,我们开始进行爬虫举例,该小说链接为:https://tieba.baidu.com/p/5702862812?pn=1 ...