爬取网页需要完整代码用两种方法

爬取买购网户外运动品牌信息（只爬取一页即可）

品牌大全_买购网 https://www.maigoo.com/brand/search/?catid=8961

需要代码

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

CSDN专家-showbo 2021-10-25 16:15

关注

页面数据接口这个，修改下page参数获取指定页的数据即可，不过接口返回的是html代码，具体内容需要用BeautifulSoup解析下

https://www.maigoo.com/brand/search/?catid=8961&page=1&ajax=1&subaction=resultlist&action=searchlist

题主要的代码如下，有帮助麻烦点下【采纳该答案】，谢谢~~有其他问题可以继续交流~

import requests
from bs4 import BeautifulSoup
for i in range(1,3):#采集1,2页数据
    url="https://www.maigoo.com/brand/search/?catid=8961&page=%s&ajax=1&subaction=resultlist&action=searchlist"%i
    html=requests.get(url).text
    soup=BeautifulSoup(html,features="html.parser")
    lis=soup.select('li')
    for li in lis:
        print('图片网址：'+li.select('img')[0].attrs['src'])
        print('品牌：'+li.select('.info a.name')[0].text)
        print('公司名称：'+li.select('.cbox')[0].text)
        print('公司介绍：'+li.select('.rongyu')[0].text)
        print('\n\n')

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(1条)

报告相同问题？

关注问题

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 11月3日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月26日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月25日

爬取网页需要完整代码用两种方法

2条回答 默认 最新

问题事件

2条回答默认最新