第一段
-
temp = url.split('_')[2].split('.')[0].split('-')
-
pageNo = temp[1]
-
titleNo = temp[0] if int(temp[0]) >= 10 else '0' + temp[0]
-
path = destdir + '/' + year + month + day + '/'
-
fileName = year + month + day + '-' + pageNo + '-' + titleNo + '.txt'
第二段
if temp: pageList = temp.ul.find_all('div', attrs={'class': 'right_title-name'}) else: pageList = bsobj.find('div', attrs={ 'class': 'swiper-container'}).find_all('div', attrs={'class': 'swiper-slide'}) linkList = []