python如何下载NOAA数据下载界面所有后缀为.nc的文件
我需要下载NOAA官网上1993-2020年的数据,它文件名超级的怪,开头是日期,中间一长串固定字符,然后跟着一个年份加编号(编号是这年的第几天),再来个随测量时间变换的night/day再来一串固定字符,最后才是.nc,而我只会下载固定字符串+年月日的文件,这种复杂名字要变的地方好几处的我就不会了,求问各位能人们如何下载!!
网址:
https://www.ncei.noaa.gov/data/oceans/pathfinder/Version5.3/L3C/1993/data/
我只会下载一串字符串+年月日的文件,下面是我的代码:
```python
#!/usr/bin/env python
# -*- coding: utf-8 -*-
# urllib2_urlopen.py
import urllib.request
import urllib.error
import os
def getLegalUrl(year,mon):
base_url="https://www.ncei.noaa.gov/pub/data/cmb/ersst/v5/netcdf/"
url_preletter='ersst.v5.'
try:
url=base_url+url_preletter+str(year)+str(mon).zfill(2)+'.nc'
f=urllib.request.urlopen(url)
return url
except urllib.request.URLError:
return " "
def download(url,year,mon):
f=urllib.request.urlopen(url)
data=f.read()
url_preletter = 'ersst.v5.'
pathgz = "D:\\123\\P\\SST"
with open(os.path.join(pathgz,url_preletter+str(year)+str(mon).zfill(2)+'.nc'),'wb') as file:
file.write(data)
if __name__ == '__main__':
for year in range(1982,2021):
for mon in range(1,13):
url=getLegalUrl(year,mon)
if url=="":
with open("download.log",'a') as log:
log.write(str(year)+str(mon).zfill(2)+'not found\n')
else:
download(url,year,mon)
或许有无可以不需要文件名就可下载网上数据的方法,就是直接把后缀名是.nc的文件下了,不管它前面的名字,各位神人看看我 啊!!