别再到处找了！手把手教你用Python批量下载NASA GPM半小时降雨数据（附提速代码）

张开发

• 2026/4/19 11:26:29 • 15 分钟阅读

分享文章

别再到处找了！手把手教你用Python批量下载NASA GPM半小时降雨数据（附提速代码）

高效获取NASA GPM降雨数据的Python自动化方案对于气象研究、水文分析或环境监测领域的从业者来说获取高时间分辨率的降雨数据是开展工作的基础。NASA的GPMGlobal Precipitation Measurement系统提供的半小时降雨数据因其全球覆盖和高精度特点成为众多科研项目的首选数据源。然而面对海量数据下载需求时传统的手动操作方式不仅效率低下还容易因网络波动导致下载中断。本文将分享一套经过实战检验的Python自动化解决方案帮助您轻松实现GPM数据的批量高效获取。1. 准备工作与环境配置在开始编写自动化脚本之前我们需要完成几项必要的准备工作。这些步骤看似琐碎却是确保后续流程顺畅运行的关键。首先访问NASA Earthdata官网https://earthdata.nasa.gov/注册账号。注册过程中需注意以下几点用户名建议使用字母和数字组合避免特殊字符密码需包含大小写字母、数字和符号长度至少12位务必验证邮箱地址否则账号将无法正常使用注册完成后我们需要配置netrc认证文件。这个文件用于存储Earthdata的登录凭证让Python脚本能够自动完成认证过程。在Linux/macOS系统上该文件通常位于用户主目录下~/.netrcWindows系统则可能需要在用户目录下手动创建_netrc文件。netrc文件的内容格式如下machine urs.earthdata.nasa.gov login 您的用户名 password 您的密码文件权限设置同样重要过于宽松的权限可能导致安全风险。在终端中执行以下命令修改权限chmod 600 ~/.netrc2. 数据源分析与URL生成策略GPM数据在NASA的GES DISC平台提供多种产品其中GPM_3IMERGHHL数据集提供半小时分辨率的全球降雨估算。理解数据组织结构对于高效获取特定时空范围的数据至关重要。数据URL通常遵循固定模式主要由以下几个部分组成https://gpm1.gesdisc.eosdis.nasa.gov/data/GPM_L3/GPM_3IMERGHHL.06/{YYYY.MM.DD}/3B-HHL.MS.MRG.3IMERG.{YYYYMMDD}-S{hh}{mm}00-E{hh}{mm}59.{MMMM}.V06B.HDF5其中各占位符含义如下YYYY四位年份MM两位月份DD两位日期hh两位小时00-23mm两位分钟00或30MMMM四位月份英文缩写如Janu、Febr等基于这种规律我们可以编写URL生成函数动态创建所需时间范围内的所有数据链接from datetime import datetime, timedelta def generate_gpm_urls(start_date, end_date): base_url https://gpm1.gesdisc.eosdis.nasa.gov/data/GPM_L3/GPM_3IMERGHHL.06 urls [] current_date start_date while current_date end_date: date_str current_date.strftime(%Y.%m.%d) month_abbr current_date.strftime(%b)[:4].lower() for hour in range(0, 24): for minute in [0, 30]: time_str current_date.strftime(%Y%m%d) url f{base_url}/{date_str}/3B-HHL.MS.MRG.3IMERG.{time_str}-S{hour:02d}{minute:02d}00-E{hour:02d}{minute:02d}59.{month_abbr}.V06B.HDF5 urls.append(url) current_date timedelta(days1) return urls3. 高效下载引擎的实现单线程下载在面对数百个数据文件时效率明显不足。我们利用Python的并发编程能力构建一个高效的多线程下载引擎。以下是核心实现代码import os import requests from concurrent.futures import ThreadPoolExecutor, as_completed def download_file(url, save_dir, max_retries3): filename url.split(/)[-1] save_path os.path.join(save_dir, filename) for attempt in range(max_retries): try: with requests.get(url, streamTrue, timeout30) as r: r.raise_for_status() with open(save_path, wb) as f: for chunk in r.iter_content(chunk_size8192): if chunk: f.write(chunk) return True, url except Exception as e: print(fAttempt {attempt 1} failed for {url}: {str(e)}) if attempt max_retries - 1: return False, url def batch_download(urls, save_dir, max_workers8): os.makedirs(save_dir, exist_okTrue) successful [] failed [] with ThreadPoolExecutor(max_workersmax_workers) as executor: future_to_url { executor.submit(download_file, url, save_dir): url for url in urls } for future in as_completed(future_to_url): url future_to_url[future] try: success, url future.result() if success: successful.append(url) print(fDownloaded: {url}) else: failed.append(url) except Exception as e: failed.append(url) print(fError processing {url}: {str(e)}) return successful, failed这个下载引擎具有以下特点断点续传支持通过流式下载和大文件分块处理避免内存溢出自动重试机制网络波动时可自动重试提高下载成功率进度可视化实时打印下载状态便于监控进度线程安全每个线程独立处理文件写入避免资源竞争4. 性能优化与错误处理在实际应用中我们还需要考虑各种边界情况和性能优化点。以下是几个关键优化策略连接池配置通过调整requests.Session参数优化HTTP连接session requests.Session() adapter requests.adapters.HTTPAdapter( pool_connections20, pool_maxsize20, max_retries3 ) session.mount(http://, adapter) session.mount(https://, adapter)速率限制避免对服务器造成过大压力from time import sleep from random import uniform def throttled_request(url, session): sleep(uniform(0.1, 0.3)) # 随机延迟 return session.get(url, streamTrue)错误分类处理针对不同错误类型采取不同策略错误类型处理策略重试间隔连接超时立即重试1-3秒认证失败终止并报警-404错误跳过该URL-服务器错误指数退避重试2^n秒磁盘空间检查避免因磁盘不足导致下载失败def check_disk_space(path, min_gb5): stat os.statvfs(path) free_gb stat.f_bavail * stat.f_frsize / (1024**3) return free_gb min_gb5. 实战案例下载特定区域的季风降雨数据假设我们需要下载2023年东南亚季风季节5月至10月的GPM数据用于研究。以下是完整的操作流程定义时空范围start_date datetime(2023, 5, 1) end_date datetime(2023, 10, 31) region_bbox [92, -11, 142, 23] # 东南亚大致经纬度范围生成下载列表all_urls generate_gpm_urls(start_date, end_date) print(fTotal files to download: {len(all_urls)})配置下载参数download_dir /data/gpm/southeast_asia_2023_monsoon thread_count 12 # 根据网络带宽调整执行批量下载successful, failed batch_download(all_urls, download_dir, max_workersthread_count) print(fDownload completed: {len(successful)} success, {len(failed)} failed)结果验证import glob downloaded_files glob.glob(os.path.join(download_dir, *.HDF5)) assert len(downloaded_files) len(successful), File count mismatch在实际测试中这套方案将原本需要数周手动操作的数据获取过程缩短到几小时内完成。在一台中等配置的服务器上100Mbps带宽完整下载半年的半小时分辨率数据约3TB仅需约18小时。

更多文章

前端开发 2026/4/16 23:05:24

2026必看AI工具合集：大模型选型+全场景工具，新手老手都适用

2026年的AI行业早已进入实用阶段，不管是日常办公、内容创作还是软件开发，AI工具都成了效率提升的关键，但很多人都有同感：AI工具越来越多，用户很难找到和体验不同模型，想试试ChatGPT、Claude这些主流模型&am…

在 Ubuntu 系统中，从集成显卡切换到 NVIDIA 独立显卡（RTX 3090），核心是通过 NVIDIA 提供的 prime-select 工具或图形界面设置来完成。方法一：使用命令行工具 prime-select（推荐）Ubuntu 自带的 n…

张开发

前端开发 2026/4/18 14:01:59

comsol三维粗糙岩石裂隙水热耦合模型价格。 comsol岩石岩石裂隙水热耦合模型，模型可...

comsol三维粗糙岩石裂隙水热耦合模型价格。 comsol岩石岩石裂隙水热耦合模型，模型可以考虑裂隙粗糙度，分析温度场，流速，传热，压强的变化。在玩COMSOL的时候，三维裂隙模型绝对是让人又爱又恨的存在。今天咱…

张开发

别再到处找了！手把手教你用Python批量下载NASA GPM半小时降雨数据（附提速代码）

最新文章

安卓玩机进阶：用Magisk模块给Root后的手机装上‘系统级’定时任务（Crontab实战）

字节跳动Video Depth Anything实战：10分钟视频深度估计从入门到精通（附避坑指南）

React Hook 的性能优化策略

为什么你的AI告警总在“假阳性”？SITS2026首次披露告警置信度校准模型，含4层过滤机制详解

Webshell工具进化史：从菜刀到哥斯拉的加密对抗技术变迁

保姆级教程：用Infineon TC377和C/F车模搞定智能车竞赛双车跟随（附开源代码）

推荐文章

从零上手CH340G：USB转串口芯片的实战应用指南

别再手动算周期了！用STM32CubeMX的TIM1输入捕获测按键时长（附完整代码）

AI代码配额管理实战指南：7大行业真实配额模型+3类超限预警SOP（附2026大会未发布白皮书节选）

集合（ArrayList）

防止SQL注入的运维实践_实时清理数据库缓存与历史记录

MySQL Explain 执行计划性能对比

相关文章

无损音乐下载与高品质音频管理：tidal-dl-ng的核心能力探索

LyricsX：让歌词如影随形的桌面歌词助手

如何利用自动化抢票工具突破大麦网90%的抢票失败率：从绝望到成功的完整指南

电子设计竞赛必备：RC、运放、TTL信号处理电路实战指南（附避坑技巧）

从RoboMaster到智能仓储：深入聊聊麦克纳姆轮底盘的那些‘坑’与最佳实践

libhv实战：从零构建一个高效的WebSocket客户端

分享文章

更多文章

2026必看AI工具合集：大模型选型+全场景工具，新手老手都适用

如何快速掌握ZeroOmega代理工具：3步构建你的网络代理系统

从浮点到定点：在Xilinx Vivado里给FPGA设计做‘瘦身’的实战避坑指南

保姆级教程：在Windows 10/11上快速搭建mosquitto MQTT服务器，并用MQTTX客户端测试（附常见错误解决）

家长选择赶考状元AI学伴的五大理由：解锁学习新体验与核心好处

OpenAI Codex 插件系统：革新企业 AI 开发，却面临生态挑战

AI辅助开发新思路：让快马平台智能生成与优化Touchgal复杂手势交互

GHelper完整指南：华硕笔记本性能优化的终极解决方案

类器官：精准医疗的核心利器

卷积神经网络原理在忍者像素绘卷中的应用与效果增强

系统中集成显卡切换至独显操作

comsol三维粗糙岩石裂隙水热耦合模型价格。 comsol岩石岩石裂隙水热耦合模型，模型可...