关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
Xい
2022-03-11 17:52
采纳率: 66.7%
浏览 61
首页
Python
已结题
Python爬虫爬取不同网页的相似内容
python
爬虫
1、一个网站列表的十个链接分别跳转不同的页面
2、每个页面的排版不同
3、需爬取十个页面中的联系人
4、想问一下应该用什么方法
收起
写回答
好问题
0
提建议
关注问题
微信扫一扫
点击复制链接
分享
邀请回答
编辑
收藏
删除
收藏
举报
2
条回答
默认
最新
关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
Xい
2022-03-18 09:39
关注
re模块,正则表达式,split切分
本回答被题主选为最佳回答
, 对您是否有帮助呢?
本回答被专家选为最佳回答
, 对您是否有帮助呢?
本回答被题主和专家选为最佳回答
, 对您是否有帮助呢?
解决
无用
2
评论
打赏
微信扫一扫
点击复制链接
分享
举报
评论
按下Enter换行,Ctrl+Enter发表内容
查看更多回答(1条)
向“C知道”追问
报告相同问题?
提交
关注问题
python
爬虫
爬取
网页
代码遇到了一些问题
python
爬虫
2022-08-17 17:07
回答 3
已采纳
因为元素里的你要的
内容
是通过 ajax 请求动态加载的,可以浏览器抓包去看下,你想要的这条数据到底是哪个请求返回的,找到真正的请求,然后模拟发送就行了
python
爬虫
爬取
到的
内容
无法输出到txt文档中
python
2022-08-12 12:20
回答 3
已采纳
不如换用requests库和bs4库吧。 from bs4 import BeautifulSoup as bs import requests as r url = 'https://fanqie
python
爬虫
爬取
图片,图片打不开
python
爬虫
2022-10-18 21:52
回答 1
已采纳
图片是从cdn上过来的,做了防盗链。在headers中添加Refer,指向该网站就行了。 import re import requests import os if not os.path.ex
python
小项目——【
爬虫
爬取
网页
中的
内容
及链接】
2024-11-18 18:33
Heris99的博客
python
爬虫
爬取
网页
内容
小项目
python
爬虫
,如何
爬取
相关数据
python
有问必答
爬虫
2021-11-11 11:15
回答 1
已采纳
先确定需要
爬取
的网站,然后分析网站的数据来源,是后端生成数据还是ajax生成数据,确定数据来源方式就根据HTTP请求编写代码,这个涉及一些请求参数的加密、转换等等处理,然后清洗数据和数据入库
python
爬虫
爬取
网页
为什么获得的不是正常
网页
数据
python
爬虫
2022-05-12 14:48
回答 2
已采纳
这代码里面好多错误,你是怎么运行成功的?
python
爬虫
爬取
jsonp请求的响应数据怎么获取
json
python
2021-05-22 21:34
回答 1
已采纳
这里我们以
爬取
淘宝评论为例子讲解一下如何去做到的。 这里主要分为了四步: 一 获取淘宝评论时,ajax请求链接(url) 二 获取该ajax请求返回的json数据 三 使用
python
解析js
python
爬虫
实战——小说
爬取
2023-05-21 21:01
清清清清弦的博客
基于requests库和lxml库编写的
爬虫
,目标小说网站域名http://www.365kk.cc/,类似的小说网站殊途同归,均可采用本文方法
爬取
。
Python
爬虫
BeautifulSoup解析
网页
爬取
内容
为None
python
有问必答
2021-08-31 14:07
回答 2
已采纳
你抓的频率太快,IP被墙了
Pandas借助
Python
爬虫
爬取
HTML
网页
表格保存到Excel文件的问题,解答。
python
有问必答
2021-09-20 23:00
回答 2
已采纳
没有指定打开方式写为with open("./Gldjc_Pandas.txt","w+") as fin:即可 有帮助望采纳~
关于#
python
#的问题:
python
爬虫
爬取
百度图片
python
有问必答
爬虫
2021-11-27 22:00
回答 2
已采纳
你检查下这个
网页
中的
内容
是不是通过js代码读取外部json数据来动态更新的。requests只能获取
网页
的静态源代码,动态更新的
内容
取不到。对于动态更新的
内容
要用selenium 来
爬取
。 或者是通
Python
爬虫
——简单
网页
抓取(实战案例)小白篇_
python
爬虫
爬取
网页
数据(2)
2024-05-02 21:47
2401_84562768的博客
requests库是一个常用于http请求的模块,可以方便的对
网页
进行
爬取
,是学习
python
爬虫
比较好的http请求模块,比urllib库更加简洁,并且自带json解析器。掌握了它,Cookies、登录验证、代理设置等操作都不是事儿。
python
爬虫
爬取
多个页面_
Python
爬虫
笔记:
爬取
单个页面
2020-11-24 10:20
weixin_39676021的博客
前言学习
Python
爬虫
技术也是一件需要大量实践的事情,因为并不是所有的网站都对
爬虫
友好,更多的一种情况是网站为了限制
爬虫
不得不在最小化影响用户体验的前提下对网站访问做出一定的限制,最常见的就是一些网站的...
Python
爬虫
实战:
爬取
解放日报新闻文章
2021-04-24 22:10
机灵鹤的博客
上一篇《
Python
网络
爬虫
实战:
爬取
人民日报新闻文章》发布之后,确实帮到了不少朋友。 前几天,我好哥们问我:我想爬另一个日报新闻网站,
网页
结构几乎跟人民日报几乎一模一样,但是我用你的那个代码去爬却爬不...
Python
爬虫
手把手教你利用
爬虫
爬取
网页
2020-10-21 18:47
夕夕老师的博客
本文主要分为两个部分:一部分是网络
爬虫
的概述,帮助大家详细了解网络
爬虫
;另一部分是HTTP请求的
Python
实现,帮助大家了解
Python
中实现HTTP请求的各种方式,以便具备编写HTTP网络...网络
爬虫
(又被称为
网页
蜘蛛、...
没有解决我的问题,
去提问
向专家提问
向AI提问
付费问答(悬赏)服务下线公告
◇ 用户帮助中心
◇ 新手如何提问
◇ 奖惩公告
问题事件
关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
系统已结题
3月26日
关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
已采纳回答
3月18日
关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
创建了问题
3月11日