benny817 2019-08-16 12:01 采纳率: 100%
浏览 240
已采纳

本人小白这一段代码看不明白,请教大神

for i in range(0,count):
    html = urllib.request.urlopen(url, context=ctx).read()
    soup = BeautifulSoup(html, 'html.parser')
    tags=soup('a')
    url=tags[pos-1].get('href',None)
    print(url)

  • 写回答

1条回答

  • JonathanYan 2019-08-16 12:18
    关注
    //迭代count次
    for i in range(0,count):
    //使用urllib打开url对应的html文件为html变量
        html = urllib.request.urlopen(url, context=ctx).read()
    //使用BeautifulSoup解释html为soup,类似ParseJSON,使其可以直接通过标签的条件进行查询
        soup = BeautifulSoup(html, 'html.parser')
    //获取soup中所有的a(超链接)标签的对象为tags数组
    //a标签一般写法为<a href="www.******.com/******/***">等
        tags=soup('a')
    //获得tags中第pos个超链接标签对象的超链接url,且该url进入下个循环
        url=tags[pos-1].get('href',None)
    //打印url
        print(url)
    

    这段代码根据每个页面第pos个超链接指向的页面进行count次迭代,找到最终指向的网址。
    例如页面a第pos个链接指向页面b,页面b指向c,页面c指向d
    以a为起始循环count=3次会打印出b,c,d的url

    P.S. 说清楚你不懂的是什么在问问题的时候很重要

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥15 这是哪个作者做的宝宝起名网站
  • ¥60 版本过低apk如何修改可以兼容新的安卓系统
  • ¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
  • ¥50 有数据,怎么建立模型求影响全要素生产率的因素
  • ¥50 有数据,怎么用matlab求全要素生产率
  • ¥15 TI的insta-spin例程
  • ¥15 完成下列问题完成下列问题
  • ¥15 C#算法问题, 不知道怎么处理这个数据的转换
  • ¥15 YoloV5 第三方库的版本对照问题
  • ¥15 请完成下列相关问题!