ChitaWang 2022-07-21 20:57 采纳率: 20%
浏览 137
已结题

python如何下载NOAA数据下载界面所有后缀为.nc的文件

python如何下载NOAA数据下载界面所有后缀为.nc的文件

我需要下载NOAA官网上1993-2020年的数据,它文件名超级的怪,开头是日期,中间一长串固定字符,然后跟着一个年份加编号(编号是这年的第几天),再来个随测量时间变换的night/day再来一串固定字符,最后才是.nc,而我只会下载固定字符串+年月日的文件,这种复杂名字要变的地方好几处的我就不会了,求问各位能人们如何下载!!
网址:
https://www.ncei.noaa.gov/data/oceans/pathfinder/Version5.3/L3C/1993/data/

img

我只会下载一串字符串+年月日的文件,下面是我的代码:


```python
#!/usr/bin/env python
# -*- coding: utf-8 -*-
# urllib2_urlopen.py
import urllib.request
import urllib.error
import os

def getLegalUrl(year,mon):
    base_url="https://www.ncei.noaa.gov/pub/data/cmb/ersst/v5/netcdf/"
    url_preletter='ersst.v5.'
    try:
        url=base_url+url_preletter+str(year)+str(mon).zfill(2)+'.nc'
        f=urllib.request.urlopen(url)
        return url
    except urllib.request.URLError:
        return " "

def download(url,year,mon):
    f=urllib.request.urlopen(url)
    data=f.read()
    url_preletter = 'ersst.v5.'
    pathgz = "D:\\123\\P\\SST"
    with open(os.path.join(pathgz,url_preletter+str(year)+str(mon).zfill(2)+'.nc'),'wb') as file:
        file.write(data)

if __name__ == '__main__':
    for year in range(1982,2021):
        for mon in range(1,13):
            url=getLegalUrl(year,mon)
            if url=="":
                with open("download.log",'a') as log:
                    log.write(str(year)+str(mon).zfill(2)+'not found\n')
            else:
                download(url,year,mon)


或许有无可以不需要文件名就可下载网上数据的方法,就是直接把后缀名是.nc的文件下了,不管它前面的名字,各位神人看看我 啊!!


  • 写回答

1条回答 默认 最新

  • 快乐小土狗 2022-07-22 01:34
    关注

    你请求这个网页,解析返回的数据,获得含有这些文件下载地址的url,去请求这些url就行了呀

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 7月31日
  • 已采纳回答 7月23日
  • 创建了问题 7月21日

悬赏问题

  • ¥20 有关区间dp的问题求解
  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置
  • ¥15 有没有研究水声通信方面的帮我改俩matlab代码
  • ¥15 对于相关问题的求解与代码
  • ¥15 ubuntu子系统密码忘记
  • ¥15 信号傅里叶变换在matlab上遇到的小问题请求帮助
  • ¥15 保护模式-系统加载-段寄存器
  • ¥15 电脑桌面设定一个区域禁止鼠标操作
  • ¥15 求NPF226060磁芯的详细资料