如何使用Python的azure-storage-blob库上传文件到Azure Blob Storage？

如何解决使用Python的azure-storage-blob库上传大文件到Azure Blob Storage时出现的“内存不足”问题？在使用azure-storage-blob库上传大文件时，如果直接读取整个文件内容，可能会导致内存占用过高，甚至引发“内存不足”的错误。为避免此问题，可以采用分块上传的方式。通过设置`max_single_put_size`和`max_block_size`参数，控制单次上传的最大文件大小和每个数据块的大小。例如，创建`BlobServiceClient`后，使用`upload_blob`方法时指定`max_concurrency`参数以优化并发性能。此外，确保正确处理异常情况，如网络中断或超时，可通过捕获`AzureHttpError`或`ServiceRequestError`进行重试逻辑设计。这种方法不仅提高了大文件上传的稳定性，还有效降低了内存消耗。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
狐狸晨曦 2025-06-09 05:35
关注
1. 问题概述

在使用Python的azure-storage-blob库上传大文件到Azure Blob Storage时，可能会遇到“内存不足”的问题。这是由于直接读取整个文件内容导致内存占用过高所引起的。为了有效解决这一问题，我们需要从分块上传、参数优化以及异常处理等方面入手。

常见技术问题：

如何避免一次性加载整个文件到内存中？
如何通过调整参数来优化上传性能？
如何设计重试机制以应对网络中断或超时问题？

2. 分块上传的基本原理

分块上传的核心思想是将大文件分割成多个小块（chunks），逐个上传至Azure Blob Storage。这种方式可以显著降低内存消耗，并提高上传的稳定性。

关键参数说明：

参数名称描述默认值
max_single_put_size 单次上传的最大文件大小（字节） 64 MB
max_block_size 每个数据块的大小（字节） 4 MB
max_concurrency 并发上传任务数 1

3. 实现分块上传的代码示例

以下是通过调整参数实现分块上传的代码示例：

from azure.storage.blob import BlobServiceClient # 创建BlobServiceClient connection_string = "your_connection_string" container_name = "your_container_name" blob_name = "your_blob_name" file_path = "path_to_large_file" service_client = BlobServiceClient.from_connection_string(connection_string) container_client = service_client.get_container_client(container_name) # 设置分块上传参数 with open(file_path, "rb") as data: container_client.upload_blob( name=blob_name, data=data, max_concurrency=5, # 并发上传任务数 max_single_put_size=67108864, # 单次上传最大大小为64MB max_block_size=4194304 # 每个数据块大小为4MB )

4. 异常处理与重试机制

在网络不稳定的情况下，上传过程可能会出现中断或超时。此时，可以通过捕获异常并设计重试逻辑来增强程序的健壮性。

常见异常类型：

AzureHttpError: 表示HTTP请求失败。
ServiceRequestError: 表示服务端请求错误。

以下是一个简单的重试机制示例：

from azure.core.exceptions import AzureHttpError, ServiceRequestError def upload_with_retry(blob_client, file_path, retries=3): for attempt in range(retries): try: with open(file_path, "rb") as data: blob_client.upload_blob( data=data, max_concurrency=5, max_single_put_size=67108864, max_block_size=4194304 ) return True # 成功上传 except (AzureHttpError, ServiceRequestError) as e: print(f"Attempt {attempt + 1} failed: {e}") return False # 超过重试次数

5. 流程图：分块上传的整体流程

以下是分块上传的整体流程图：

graph TD A[开始] --> B{文件大小是否超过\nmax_single_put_size} B --是--> C[分块上传] B --否--> D[直接上传] C --> E[设置max_block_size和max_concurrency] E --> F[逐块上传至Azure Blob Storage] D --> G[上传至Azure Blob Storage] F --> H[完成] G --> H

6. 性能优化建议

除了调整参数外，还可以通过以下方式进一步优化性能：

选择合适的max_block_size和max_single_put_size值，确保既不过高也不过低。
根据硬件配置合理设置max_concurrency，以充分利用多核CPU的优势。
使用流式上传（streaming upload）减少内存占用。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

参数名称	描述	默认值
`max_single_put_size`	单次上传的最大文件大小（字节）	64 MB
`max_block_size`	每个数据块的大小（字节）	4 MB
`max_concurrency`	并发上传任务数	1

报告相同问题？

关注问题

flysystem-azure-blob-storage:扩展Leagueflysystem-azure-blob-storage
2021-04-10 11:13

标题 "flysystem-azure-blob-storage" 指的是一种扩展，它将League的Flysystem文件系统抽象库与Azure Blob Storage服务相结合。Flysystem是一个PHP库，它提供了一个统一的接口来操作各种不同的文件系统，如本地磁盘...
azure-storage-blob-11.0.0.jar
2021-02-25 14:04

微软云读写共享文件所需依赖
laravel-azure-storage：用于Laravel的Storage API的Microsoft Azure Blob存储集成
2021-02-02 03:11

它使用Flysystem自己的Azure blob存储适配器，因此不能轻易添加超出此范围的功能-实际上，添加功能将超出项目范围。安装使用composer安装软件包： composer require matthewbdaly/laravel-azure-storage 在5.5...
react-native-azure-blob-storage:Azure中的文件存储
2021-03-31 23:27

$ npm install react-native-azure-blob-storage --save 大多是自动安装 $ react-native link react-native-azure-blob-storage 用法 import React , { Component } from 'react' ; import { Button , StyleSheet ...
azure-storage-blob-go:Azure存储Blob库的分支
2021-03-13 07:09

适用于Go的Azure存储Blob SDK Microsoft Go的Microsoft Azure...storage-blob-go/azblob Dep：将github.com/Azure/azure-storage-blob-go添加到Gopkg.toml中： [[constraint]] version = "0.3.0" name = "github.com/A
2024年最新Python 操作 Azure Blob Storage_python blob storage
2024-05-02 04:51

2401_84557849的博客最近笔者需要在 Linux 系统中做类似的事情，于是决定使用 Azure 提供的 Azure Storage SDK for Python 来操作 Blob Storage。这样今后无论在 Windows 上还是 Linux上，都用 Python 就可以了。
python azure-storage-blob库使用SAS key下载blob文件实例
2021-02-24 15:42

爱知菜的博客 pip install azure-storage-blob 2. 使用SAS URL可以直接连上某个container，然后以文件名来下载。 from azure.storage.blob import ContainerClient sas_url = "SAS URL" container = ContainerClient.from_...
azure-storage-blob-12.25.3.jar中文-英文对照文档.zip
2025-09-15 13:50

（1）为了防止解压后路径太长导致浏览器无法打开，推荐在解压时选择“解压到当前文件夹”（放心，自带文件夹，文件不会散落一地）；（2）有时，一套Java组件会有多个jar，所以在下载前，请仔细阅读本篇描述，以确保...
azure-storage-blob-12.30.0.jar中文-英文对照文档.zip
2025-09-15 13:50

（1）为了防止解压后路径太长导致浏览器无法打开，推荐在解压时选择“解压到当前文件夹”（放心，自带文件夹，文件不会散落一地）；（2）有时，一套Java组件会有多个jar，所以在下载前，请仔细阅读本篇描述，以确保...
itests-azure-storage-blob-4.14.0.jar
2025-10-13 09:30

itests-azure-storage-blob-4.14.0
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 6月9日

如何使用Python的azure-storage-blob库上传文件到Azure Blob Storage？

1条回答 默认 最新

1. 问题概述

常见技术问题：

2. 分块上传的基本原理

3. 实现分块上传的代码示例

4. 异常处理与重试机制

5. 流程图：分块上传的整体流程

6. 性能优化建议

问题事件

1条回答默认最新