爬虫 全部 | 未解决 | 已解决
2018.09.21 14:45来自 sjw19911110

[已解决] Python保存从网上下载的图片遇到字符格式问题

![图片说明](https://img-ask.csdn.net/upload/201809/21/1537512221_28908.png) ![图片说明](https://img-ask.csdn.net/u...
1

回答

2018.09.20 18:35来自 qq_39367735

python爬虫如何用beautifulsoup提取多层div标签下的内容

用request提取到的HTMLdiv标签未能展开,用findall方法,传入“div”“类名”做参数,也提取不到任何内容,求教!
0

回答

2018.09.20 16:15来自 weixin_42724958

抓取网页里的链接地址

![图片说明](https://img-ask.csdn.net/upload/201809/20/1537430760_786483.png) 我试图抓取上图的链接可是返回以下错误 > Traceback...
1

回答

2018.09.19 14:06来自 luslin

Scrapy爬虫问题

class LiepinspiderSpider(scrapy.Spider): name = 'liepinspider' allowed_domains = ['www.liepin.com']...
0

回答

2018.09.15 17:24来自 dlucode7

Python 3 如何用BeautifulSoup抓取配套的超链接?

目标是在这个天猫搜索页面上抓取与产品名配套的产品页超链接 ``` <p class="productTitle"> <p class="productPrice"> <em title="99.00"><...
2

回答

2018.09.14 13:35来自 weixin_42682091

怎么得到div标签下的 图片 的 路径?

小弟刚开始学爬虫,目前只会用requests的BeautifulSoup. 请问一下:怎么得到div标签下的图片的路径?![图片说明](https://img-ask.csdn.net/upload/201809/...
3

回答

2018.09.13 13:32来自 qq_41270528

关于国家企业信用信息公示网的抓取?

现在在研究爬虫,但是因为技术有限所以磕磕碰碰,在抓取信用公示网的时候,遇到很多问题,大部分在网上搜索相关解决方法和自己摸索都解决了。目前这个网站主要是用了一种叫做加速乐的技术,也就是当访问时系统会返回521,但是获...
1

回答

2018.09.07 23:58来自 lma8811 悬赏 20C

java采集页面显示202状态

最近测试采集公共资源交易的页面,出来202问题,无法采集最终页面内容,希望给予页面采集的完整JAVA代码,谢谢! 附测试代码: package asptest; import java.io.IOExcep...
2

回答

2018.08.25 16:43来自 wyylife 悬赏 80C

[已解决] python爬虫如何自动获取Network中的某个XHR地址?

需要获取机场航班数据 该机场的url地址https://zh.flightaware.com/live/airport/KHRL 其航班数据是动态加载进来的,通过F12并刷新后得到 https://zh.fligh...
3

回答

2018.08.16 17:57来自 qq_41265012 悬赏 5C

什么情况下蜘蛛爬取网页会出现504

百度蜘蛛爬虫在我的网站大量返回504是什么情况?什么情况下蜘蛛爬取网页会出现504
3

回答