多次Git add 的垃圾对象为什么要保留在暂存区？

比如一个文件readme.txt 。修改一次 git add ，第二次修改，然后 git add ，第三次修改然后再git add。这时候你会发现以上三次add形成的blod文件都留在硬盘上。不明白Git如此设定的目的是什么？留下前两个版本的blod文件在暂存区有什么作用呢？

暂存区保留第三版blod文件，那么当你在工作区又修改了readme.txt以后，git stauts git diff 都会用到第三版的 blod文件。但是前两版的blod有什么用呢？站在用户需求的角度想不到这两个老版本有什么用？而且commit时会提交两个老版本blod文件么？

如果它们有用，那么git为什么要专门提供 git prune命令去删除前两个版本呢？

如果说它们没用吧，那么git add 时为什么不采用覆盖机制，直接用新版blod替换掉上一版的blod文件呢？

如果是为了回滚，那么在什么场景下回滚代码不用Git库中的，一定要用暂存区的历史版本呢？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
断水流大撕兄 HarmonyOS创作领域新星创作者 2023-05-25 17:33
关注
这是一个很好的疑问。Git在add后保留多个版本的blob对象的设计固然让人费解。但它有以下几个目的:

支持 Git stash。Git stash会将工作区的修改暂存起来,等以后恢复使用。这需要保留add后的多个blob对象版本。
支持交互式rebase。在rebase过程中,Git会暂停,让你解决冲突,然后继续rebase。这也需要保留多个blob对象版本。
方便DEBUG。有时候想看看某次修改的diff结果,能够查看任意两个版本之间的diff很useful。如果只保留一个blob对象版本,就没法做这件事了。
方便回滚。虽然正常情况下,回滚代码使用版本库的历史提交记录即可。但在某些复杂的回滚场景下,有老版本的blob对象也能提供帮助。当然,这不是主要目的,更推荐使用git reflog和git reset来回滚。
降低内存占用。如果每次add都覆盖前一个blob对象,那么工作区的全部修改历史只会保存在一个blob对象内。这个blob对象可能会变得越来越大,占用更多内存。保留多个小的blob对象可以有效避免这个问题。

所以,可以看出,Git保留多个blob对象版本有一定的意义和作用。但是,为了避免blob对象过多占用空间,Git提供了git gc和git prune来清理不需要的blob对象,这也是很贴心的设计。
一般来说,可以这么理解:

添加新文件或重命名文件,新旧版本的blob对象都保留,以支持各种Git操作(stash、rebase、diff等)
修改文件,只保留最近两个版本的blob对象,足以支持一般的Git操作需求。更老的版本对象会在git gc时清理。
如果 blob对象过多,会影响仓库体积或内存占用,可以手动执行git prune移除不需要的版本。总之,Git保留多个blob版本有一定好处,但也需适当清理,这两点Git的设计都考虑得很到位。理解Git的设计思想,会让我们更清楚如何高效运用Git。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

git commit 之后，暂存区会清空么？ git
2022-03-04 23:13

回答 2 已采纳 add 后就进入暂存区commit之后就到版本库了 git status可以查看如果没有add就会显示为红色 add后就会显示为绿色 commit后就会提示你的暂存区是干净的,已经都提交了
git暂存区的内容被提交后，会自动删除吗？ linux
2022-03-27 23:02

回答 1 已采纳 1.git暂存区的内容被提交后不会自动删除2.关于git diff git diff 比较的是工作区和暂存区的差别 git diff --cached 比较的是暂存区和版本库的差别 git diff
VS2017 resource文件在git中为什么是二进制文件？ c++ git mfc
2022-03-22 17:16

回答 2 已采纳不是提交是二进制文件，是你diff，在git窗口内是这样的，你看下你仓库正常么？因为不知道是哪的问题，正常的话我告你怎么改
git 将暂存区文件提交_git 暂存区
2020-12-22 10:54

weixin_39679468的博客一、Git基本工作流程1.... 第二种是从一个服务器克隆一个现有的 Git 仓库git init –bare git 创建一个裸仓库2.git仓库有三个区域工作区working directory日常编辑代码的地方历史仓库history repository是comm...
Git如何避免多次输入账号密码？ git
2023-01-29 09:53

回答 2 已采纳 https://blog.csdn.net/code_lyb/article/details/108995095
关于#git#的问题：为什么我第一次打开Git是64位的 git
2023-04-08 20:59

回答 3 已采纳题主，这个问题我来替你解决，若有帮助，还望采纳，点击回答右侧采纳即可。你可以尝试下git 命令查看你当前的git安装版本，命令：git --version。查验下自己安装的是32位还是64位。其次你
为什么我的git-bash前面的美元符号不见了？ git
2022-09-28 17:16

回答 5 已采纳简单粗暴的方法，卸载git,重新安装
Git实战技巧-如何将暂存区的多个功能代码分成多次提交
2022-07-01 21:32

Ares_Yin的博客如何将暂存区的多个功能代码分成多次提交
git版本如何判断谁新谁旧？为什么出现这种情况？ git github
2020-07-16 17:49

回答 1 已采纳 https://www.it1352.com/1619846.html
git remote remove origin后在使用git remote add origin命令添加后提交代码报错 git github 前端
2022-04-27 15:05

回答 1 已采纳建议删除.git文件重新操作
为什么git push卡在total不动了 git
2021-09-26 08:31

回答 1 已采纳看看你push的文件有多大？？某些服务器是有限制单个文件的上传大小。这个需要注意。
git 将暂存区文件提交_git文件状态，暂存与提交
2020-12-31 03:08

普林西斯的博客 git中文件的状态有两种：已跟踪或者未跟踪。...git仓库作为一个目录保存在项目目录中，目录名为 .git。作为一种分布式版本控制工具，git仓库中包含了项目的所有被记录信息。在目录中，使用 $ git init 命...
git如何解决开发冲突？ git github
2023-04-16 21:53

回答 1 已采纳在开发的过程中接到修复bug的任务的处理流程执行git stash将当前工作现场“储藏”起来，等以后恢复现场后继续工作。用git status查看工作区，就是干净的；确定要在哪个分支上修复bug，假
git 的详细使用操作暂存区
2021-11-01 23:32

留着鼻涕敲代码的博客 git 大概流程： 1.配置 1.1 配置本机全局的用户名（username）和邮箱（useremail ）配置 >>>> 查看一般就是新安装git才需要配置一次 git config --global user.name 'ifer' # fier 是输入用户名 ...
git仓库与本地暂存区的同步问题
2023-08-05 16:13

xvwen的博客 git本地仓库与缓存区代码同步问题
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 7月2日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月25日

悬赏问题

¥15 关于大棚监测的pcb板设计
¥15 stm32开发clion时遇到的编译问题
¥15 lna设计源简并电感型共源放大器
¥15 如何用Labview在myRIO上做LCD显示？(语言-开发语言)
¥15 Vue3地图和异步函数使用
¥15 C++ yoloV5改写遇到的问题
¥20 win11修改中文用户名路径
¥15 win2012磁盘空间不足,c盘正常，d盘无法写入
¥15 用土力学知识进行土坡稳定性分析与挡土墙设计
¥15 帮我写一个c++工程

多次Git add 的垃圾对象为什么要保留在暂存区？

3条回答 默认 最新

问题事件

悬赏问题

3条回答默认最新