Python | 手动删除生成的mdb数据库文件后，系统磁盘空间并未释放，这是为什么？

环境：win10 pyhton3.7 lmdb0.9

问题描述：做CRNN实验时，自己制作数据集时，用别人封装好的函数，将图片数据和标签数据存入mdb数据文件中。能正常生成对应mdb数据文件，但是我在删除该文件后，发现磁盘空间未释放。比如，我申请了10GB空间，在将data.mdb和lock.mdb文件删除后，磁盘未恢复10GB的空间，这应该怎么解决？是需要将环境先关闭吗？倘若之前未关闭，文件也已删除，有无解决方法？

代码如下：

43行是申请了15GB的空间

import os
import lmdb # install lmdb by "pip install lmdb"
import cv2
import numpy as np
import chardet


def checkImageIsValid(imageBin):
    if imageBin is None:
        return False
    
    imageBuf = np.fromstring(imageBin, dtype=np.uint8)
    img = cv2.imdecode(imageBuf, cv2.IMREAD_GRAYSCALE)
    
    imgH, imgW = img.shape[0], img.shape[1]
    if imgH * imgW == 0:
        return False
    return True


def writeCache(env, cache):
    with env.begin(write=True) as txn:
        for k, v in cache.items():
            if type(v) == type('1'): 
                v = v.encode()
            txn.put(k.encode(), v)


def createDataset(outputPath, imagePathList, labelList, lexiconList=None, checkValid=True):
    """
    Create LMDB dataset for CRNN training.

    ARGS:
        outputPath    : LMDB output path
        imagePathList : list of image path
        labelList     : list of corresponding groundtruth texts
        lexiconList   : (optional) list of lexicon lists
        checkValid    : if true, check the validity of every image
    """
    assert(len(imagePathList) == len(labelList))
    nSamples = len(imagePathList)
    # 在这里申请了15GB的空间，但是删除相应文件后，空间未释放
    env = lmdb.open(outputPath, map_size=16106127360)
    cache = {}
    cnt = 1
    for i in range(nSamples):
        imagePath = imagePathList[i]
        label = labelList[i]
        if not os.path.exists(imagePath):
            print('%s does not exist' % imagePath)
            continue
        with open(imagePath, 'rb') as f:
            imageBin = f.read()
        if checkValid:
            if not checkImageIsValid(imageBin):
                print('%s is not a valid image' % imagePath)
                continue

        imageKey = 'image-%09d' % cnt
        labelKey = 'label-%09d' % cnt
        cache[imageKey] = imageBin
        cache[labelKey] = label
        if lexiconList:
            lexiconKey = 'lexicon-%09d' % cnt
            cache[lexiconKey] = ' '.join(lexiconList[i])
        if cnt % 1000 == 0:
            writeCache(env, cache)
            cache = {}
            print('Written %d / %d' % (cnt, nSamples))
        cnt += 1
    nSamples = cnt-1
    cache['num-samples'] = str(nSamples)
    writeCache(env, cache)
    print('Created dataset with %d samples' % nSamples)

def check_charset(file_path):
    
    with open(file_path, "rb") as f:
        data = f.read(4)
        charset = chardet.detect(data)['encoding']
    return charset

def getParam():
    outputPath = 'D:/MLWorkspace/crnn-master/crnn-master/data/train_data'
    datasetPath = 'D:/MLWorkspace/dataset/crnn/DataSet/'
    dataTrainTxtPath = datasetPath + 'data_train.txt'
    imagePath = datasetPath + 'Synthetic_Chinese_String_Dataset/images/'
    imagePathList = []
    labelPathList = []
    with open(dataTrainTxtPath) as f:
        lines = f.readlines()
        for i in range(len(lines)):
            arr = lines[i].split()
            filename = arr[0]
            labelArr = arr[1:11]
            label = ''
            for item in labelArr:
                label += item + ','
            imagePathList.append(imagePath + filename)
            labelPathList.append(label)
        return outputPath, imagePathList, labelPathList

if __name__ == '__main__':
    params = getParam()
    createDataset(params[0], params[1], params[2])
    # pass

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-黄老师 2021-06-28 21:35
关注
程序在运行的时候删除文件，这个时候占用的内存不会释放，你只能重新运行程序才行

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

关于#python#的问题：检索到mdb数据库中的表名及数据，插入到mysql时报TypeError: not enough arguments for format string python
2022-11-11 11:02

回答 4 已采纳这个错误报错的原因是你的sql语句中输入的%s和后面用来填充字符的变量数量不对应，比如输入了5个%，后面只有4个变量但是我猜肯定是你的保存信息中包含了%，所以导致你的sql语句报错了，解决方法是把保
Java读取文本数据存到数据库，在方法执行完成后为啥所占用的内存资源没释放？
2018-11-27 07:29

回答 3 已采纳先提交事务之后，在进行ps关闭； statement也进行关闭下同时在list使用完毕后清理下最后把有close方法的都搞上
python post请求获取信息失败 python
2022-05-22 11:42

回答 1 已采纳请求的参数不对，所以返回的是一个静态页面
Python库 | lmdb-1.1.1-cp27-cp27m-manylinux2010_x86_64.whl
2022-02-17 05:02

- **mdb_env_open()**：打开一个数据库文件，定义数据库的路径和选项。 - **mdb_txn_begin()**：开始一个新的事务，所有数据库操作都在事务中进行。 - **mdb_dbi_open()**：打开或创建一个数据库标识符，用于后续...
求助python操作mysql问题，运行过一段时间，就不显示好象没有执行一样。程序代码如下。 mysql python 数据库
2018-10-21 10:22

回答 4 已采纳你这个函数是单线程还是多线程？是不是“sql1 = "select * from log where content = '%s'" % (Content) print(sql1) #这句打印可以
C# 在Any CPU环境调试下可以正常打开mdb但是在X86环境下无法打开mdb文件？ .net c# sql
2021-06-19 15:38

回答 1 已采纳清理项目，删除bin->debug下面的所有文件，重新生成调试
用python爬虫无法导出数据 json python 爬虫
2023-03-01 20:22

回答 3 已采纳回答不易，望采纳！这一行代码报错了应该是连页面内容都没有爬下来，后边更别谈格式化处理了。检查一下你的 cookie 是不是过期了吧
python读取sql数据库_使用python读取MS-SQL数据库
2020-12-06 14:12

weixin_39922361的博客使用python读取MS-SQL中的数据，这里使用到模板pymssql。因为不是python自带的模板，所以首先需要使用pip安装，对应命令：pip install pymssql建立main.py文件，输入代码如下：import pymssql,osserver="127.0.0.1" ...
请问，用C#，连接上数据库后，如何将数据库名称显示在combobox下拉列表内； c#
2023-03-10 18:21

回答 2 已采纳基于Monster 组和GPT的调写：示例： using System; using System.Data.SqlClient; using System.Windows.Forms; names
springboot 连接access数据库失败请问怎么解决 java spring boot 数据库
2022-04-25 11:11

回答 2 已采纳报错呢？
为什么无法完成MDB表的插入代码如下
2015-04-22 03:06

回答 3 已采纳不需要，但是你的表名是否正确，字段名是否正确，值是否正确，是否违背重复等、范围、字符串长度等约束，是否有非空字段没有赋值，是否类型匹配，全角半角符号是否一致，是否和关键字冲突，字符串要加引号，数字不要
第一章 Python pyodbc连接access数据库的使用方法
2022-10-26 22:31

七月一起吹晚风吧的博客解决pyodbc安装报错并快速入门python第三方库pyodbc连接access数据库
在datagridview中修改数据，为什么数据库没有更新 c# 数据库
2015-04-01 11:12

回答 2 已采纳 catch中加上 MessageBox.Show(ex.Message)看下具体错误信息是不是违法了约束，或者主键重复之类的错误
grafana数据源python_Grafana监控数据库 | 服务器性能
2021-01-13 13:57

张颂文的博客关键词:Grafana,Mysql,Python1. Grafana 简介在使用爬虫爬取大量数据的时候，一般我们都会把程序挂在服务器上运行，然后就可以去干别的事情了。但是，我们还是有必要定时看一下程序运行情况的。虽然我们可以通过 log...
python生成lmdb格式文件及读取
2021-01-02 14:25

进击的天然呆的博客 LMDB全称Lightning Memory-Mapped Database,是内存映射型数据库，这意味着它返回指向键和值的内存地址的指针，而不需要像大多数其他数据库那样复制内存中的任何内容，使用内存映射文件，可以提供更好的输入/输出性能...
PYTHON专题-（9）基操之我要玩文件
2024-08-06 10:57

代码不行的搬运工的博客文件操作、IO操作
Python对Linux系统的管理
2020-04-27 20:38

MAYSYQ的博客 Python对Linux系统的管理一、OS模块常用功能 1、os模块打开文件方法如下： os.open(filename, flag, [,mode]) flag参数说明： os.O_CREAT # 创建文件 os.O_RDONLY # 只读方式打开 os.O_WRONLY # 只写方式打开 os...
没有解决我的问题, 去提问

悬赏问题

¥20 高德地图聚合图层MarkerCluster聚合多个点，但是ClusterData只有其中部分数据，原因应该是有经纬度重合的地方点，现在我想让ClusterData显示所有点的信息，如何实现？
¥100 求Web版SPC控制图程序包调式
¥20 指导如何跑通以下两个Github代码
¥15 大家知道这个后备文件怎么删吗，为啥这些文件我只看到一份，没有后备呀
¥15 C++为什么这个代码没报错运行不出来啊
¥15 一道ban了很多东西的pyjail题
¥15 关于#r语言#的问题：如何将生成的四幅图排在一起，且对变量的赋值进行更改，让组合的图漂亮、美观@（相关搜索：森林图）
¥15 C++识别堆叠物体异常
¥15 微软硬件驱动认证账号申请
¥15 GPT写作提示指令词

Python | 手动删除生成的mdb数据库文件后，系统磁盘空间并未释放，这是为什么？

1条回答 默认 最新

悬赏问题

1条回答默认最新