for i in range(0,count):
html = urllib.request.urlopen(url, context=ctx).read()
soup = BeautifulSoup(html, 'html.parser')
tags=soup('a')
url=tags[pos-1].get('href',None)
print(url)
本人小白这一段代码看不明白,请教大神
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
1条回答
- JonathanYan 2019-08-16 12:18关注
//迭代count次 for i in range(0,count): //使用urllib打开url对应的html文件为html变量 html = urllib.request.urlopen(url, context=ctx).read() //使用BeautifulSoup解释html为soup,类似ParseJSON,使其可以直接通过标签的条件进行查询 soup = BeautifulSoup(html, 'html.parser') //获取soup中所有的a(超链接)标签的对象为tags数组 //a标签一般写法为<a href="www.******.com/******/***">等 tags=soup('a') //获得tags中第pos个超链接标签对象的超链接url,且该url进入下个循环 url=tags[pos-1].get('href',None) //打印url print(url)
这段代码根据每个页面第pos个超链接指向的页面进行count次迭代,找到最终指向的网址。
例如页面a第pos个链接指向页面b,页面b指向c,页面c指向d
以a为起始循环count=3次会打印出b,c,d的urlP.S. 说清楚你不懂的是什么在问问题的时候很重要
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报
悬赏问题
- ¥15 这是哪个作者做的宝宝起名网站
- ¥60 版本过低apk如何修改可以兼容新的安卓系统
- ¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
- ¥50 有数据,怎么建立模型求影响全要素生产率的因素
- ¥50 有数据,怎么用matlab求全要素生产率
- ¥15 TI的insta-spin例程
- ¥15 完成下列问题完成下列问题
- ¥15 C#算法问题, 不知道怎么处理这个数据的转换
- ¥15 YoloV5 第三方库的版本对照问题
- ¥15 请完成下列相关问题!