ChitaWang 2022-07-21 20:57 采纳率: 20%
浏览 155
已结题

python如何下载NOAA数据下载界面所有后缀为.nc的文件

python如何下载NOAA数据下载界面所有后缀为.nc的文件

我需要下载NOAA官网上1993-2020年的数据,它文件名超级的怪,开头是日期,中间一长串固定字符,然后跟着一个年份加编号(编号是这年的第几天),再来个随测量时间变换的night/day再来一串固定字符,最后才是.nc,而我只会下载固定字符串+年月日的文件,这种复杂名字要变的地方好几处的我就不会了,求问各位能人们如何下载!!
网址:
https://www.ncei.noaa.gov/data/oceans/pathfinder/Version5.3/L3C/1993/data/

img

我只会下载一串字符串+年月日的文件,下面是我的代码:


```python
#!/usr/bin/env python
# -*- coding: utf-8 -*-
# urllib2_urlopen.py
import urllib.request
import urllib.error
import os

def getLegalUrl(year,mon):
    base_url="https://www.ncei.noaa.gov/pub/data/cmb/ersst/v5/netcdf/"
    url_preletter='ersst.v5.'
    try:
        url=base_url+url_preletter+str(year)+str(mon).zfill(2)+'.nc'
        f=urllib.request.urlopen(url)
        return url
    except urllib.request.URLError:
        return " "

def download(url,year,mon):
    f=urllib.request.urlopen(url)
    data=f.read()
    url_preletter = 'ersst.v5.'
    pathgz = "D:\\123\\P\\SST"
    with open(os.path.join(pathgz,url_preletter+str(year)+str(mon).zfill(2)+'.nc'),'wb') as file:
        file.write(data)

if __name__ == '__main__':
    for year in range(1982,2021):
        for mon in range(1,13):
            url=getLegalUrl(year,mon)
            if url=="":
                with open("download.log",'a') as log:
                    log.write(str(year)+str(mon).zfill(2)+'not found\n')
            else:
                download(url,year,mon)


或许有无可以不需要文件名就可下载网上数据的方法,就是直接把后缀名是.nc的文件下了,不管它前面的名字,各位神人看看我 啊!!


  • 写回答

1条回答 默认 最新

  • 快乐小土狗 2022-07-22 01:34
    关注

    你请求这个网页,解析返回的数据,获得含有这些文件下载地址的url,去请求这些url就行了呀

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 7月31日
  • 已采纳回答 7月23日
  • 创建了问题 7月21日

悬赏问题

  • ¥15 PADS Logic 原理图
  • ¥15 PADS Logic 图标
  • ¥15 电脑和power bi环境都是英文如何将日期层次结构转换成英文
  • ¥20 气象站点数据求取中~
  • ¥15 如何获取APP内弹出的网址链接
  • ¥15 wifi 图标不见了 不知道怎么办 上不了网 变成小地球了
  • ¥50 STM32单片机传感器读取错误
  • ¥50 power BI 从Mysql服务器导入数据,但连接进去后显示表无数据
  • ¥15 (关键词-阻抗匹配,HFSS,RFID标签天线)
  • ¥15 机器人轨迹规划相关问题