爬虫 全部 | 未解决 | 已解决
2018.11.17 19:00来自 csdnxhy

不登入爬微博会被封IP多久?

请问如果不登入去爬微博,被微博发现後会封锁此IP多久?频率大概是多高会被封锁?谢谢
2

回答

2018.11.13 23:25来自 weixin_43408134

python3 爬网络小说 编码gbk,utf-8均报错

很简单的爬取一个小说,但是编码遇到报错,gbk,utf-8都不行。 # -*- coding: utf-8 -*- import urllib.request import re import sy...
2

回答

2018.11.12 22:11来自 l982044273

xpath的text可以获取子标签的文本么?

为什么我测试的text()和string()都可以获得子标签下的文本??后端也能正常获取到,面试的时候面试官说的我一脸懵逼。。。。。。因为我一直用的都是text去获取文本,一直也都能获取到,面试官说text不能获取...
1

回答

2018.11.12 12:02来自 weixin_43408134

爬虫代码问题,为什么要用set处理

代码如下,问题在最后: import urllib.request import socket import re import sys import os ta...
2

回答

2018.11.11 09:11来自 qq_43258883 悬赏 20C

python爬虫 登陆不成功

![Request](https://img-ask.csdn.net/upload/201811/04/1541306099_578797.png) ![form data](https://img-ask.c...
1

回答

2018.11.08 23:17来自 oQianShouXiuLuo 悬赏 5C

有没有哪位大佬知道怎么爬取天猫的商品信息?要带促销价和库存的,还要图片

有没有哪位大佬知道怎么爬取天猫的商品信息?要带促销价和库存的,还要图片
1

回答

2018.11.07 23:02来自 weixin_40825517 悬赏 5C

[已解决] 如何用Python 3遍历循环下载CSV文件中内容链接的图片?

## 本人目前情况如下: 现在有个文件表(CSV),表中信息均为图片链接,如图1所示 ![图1](https://img-ask.csdn.net/upload/201811/07/154160...
2

回答

2018.11.07 18:09来自 weixin_36938798

[已解决] 请问这种网址里面的pdf页面怎么爬取

http://www.cpppc.org:8083/efmisweb/ppp/projectLibrary/getProjInfoNational.do?projId=45f747ac429b4773a88938e...
1

回答

2018.11.06 22:10来自 casper__

python为什么修改了headers之后反而出错了?

用python写了个简单的爬虫,但是由于被识破了所以想修饰一下,于是改了代理headers,但是改完之后对BeautifulSoup里所有的find操作都失败了,改之前是会返回503访问失败,现在是返回200但是f...
3

回答

2018.11.06 17:04来自 casper__

python爬虫抓取亚马逊商品名,一段时间后大量返回503错误?

写了个简单的爬虫,抓取亚马逊商品的名字,一开始抓取的都还能正确返回,到几百条以后就大量返回503,偶尔成功一两条。网上说的headers和代理IP讲得比较乱,试过用headers,但是只要我一加上headers,虽...
3

回答