爬虫 382个问题
2018.07.18 09:05来自 qq_33108245 悬赏 10C
一个安卓相关的爬虫问题
我做一个APP,实现的是,爬取一个网站上的选择题在APP上,然后在APP上做了选择题提交之后,能够继续爬取那个网站上的答案之类的分析。就相当于在网站上面做选择题,提交得出答案,如何能把这些步骤搬到APP上?使用爬虫...
2

回答

2018.07.17 17:57来自 sinat_32092535 悬赏 5C
scrapy-redis报错,这个真不知道什么原因,我之前写的另外一个爬虫是可以执行的
Traceback (most recent call last): File "C:\Users\xin\Desktop\spider_thief\venv\lib\site-packages\scrapy\...
3

回答

2018.07.12 22:53来自 yzhu1015 悬赏 10C
在python爬虫中使用for循环填入网页id并嵌套函数爬取信息时,无法正确爬取
使用了三个网页ID:38635、38636、38627来测试,输出dic的结果为三个同样的字典(都对应38635), ``` headers = {'User-Agent':'Mozilla/5.0 (Windo...
5

回答

2018.07.12 06:41来自 u011272628 悬赏 5C
如何爬虫onclick的内容
国家专利,高级检索,查看详细,是一个点击,而不是一个链接。 h <a href="javascript:;" onclick="viewDesc('CN201810098063.320180605FM')">[查看...
5

回答

2018.07.06 15:30来自 acbnmqwer 悬赏 10C
htmlunit模拟浏览器访问页面,请问怎么设置页面停留时间
WebClient webClient = new WebClient(BrowserVersion.FIREFOX_38,ip,port); webClient.getOptions().se...
6

回答

2018.07.01 23:55来自 reffud 悬赏 10C
淘宝列表URL中的cat参数怎么搞?
项目需要,需要去淘宝抓几页搜索结果进行分析。但是对于搜索的URL中的cat参数完全找不出规律。 举个例子: 1.. 我生成一个URL https://s.taobao.com/search?q=项链&s=...
4

回答

2018.07.01 18:20来自 l1159015838 悬赏 10C
[WinError 10053] 你的主机中的软件中止了一个已建立的连接。
爬虫, selenium + 火狐, 目前情况是:![图片说明](https://img-ask.csdn.net/upload/201807/01/1530440384_226003.jpg) --- 就这个 8...
1

回答

2018.06.27 16:13来自 qq_19339041 悬赏 5C
python 爬虫怎么构造 提交的类型为 multipart/form-data 的数据
post请求提交的数据格式为下图,怎么 ![图片说明](https://img-ask.csdn.net/upload/201806/27/1530087130_659803.png) ![图片说明](http...
5

回答

2018.06.24 11:15来自 JAJAJAJarvis 悬赏 5C
python写爬虫遇到"脚本可访问"属性的cookies怎么办?
最近在用python做网页模拟登陆的时候遇到一些问题。 1.cookies方面的: 当访问某个网页的子页时候往往需要发送一些cookies,这些cookies大多数能在response header...
2

回答

2018.06.22 15:53来自 qq_37105807 悬赏 5C
python爬虫去哪网热门景点
我用python爬虫去哪网热门景点信息,结果只爬到了两页的内容,不知道是哪的问题,有大佬帮忙看看: # -*- coding: utf-8 -*- # created by:tianxing # created ...
2

回答

共382条数据 1 3 4 ... 尾页