Git基本原理和使用方法

概述

git是开源的分布式版本控制系统,是为Linux内核开发而开发的版本控制工具。
本文结合git的原理介绍Git基本的使用方法和命令,文章安排如下:

  1. git 的工作区,暂存区和版本库 [1]
  2. git 基本命令
  3. git 分支和合并 # git工作区、暂存区和版本库 一个仓库的建立从$ git init 开始,该命令用于创建空的仓库,与此同时工作目录下会多出一个.git 文件夹,所有关于git控制的信息都存放在该文件内。在该目录下,有一个 index 文件,该文件记录了通过git add 进来的工作区文件的时间戳、长度等信息,index文件实际上是一个包含文件索引的目录树。当执行git status 时,先依据 .git/index 文件中记录的时间戳、长度等信息判断工作区文件是否改变。如果工作区的文件时间戳改变,说明文件的内容 可能 被改变了,需要要打开文件,读取文件内容,和更改前的原始文件相比较,判断文件内容是否被更改。如果文件内容没有改变,则将该文件新的时间戳记录到 .git/index 文件中。因为判断文件是否更改,使用时间戳、文件长度等信息进行比较要比通过文件内容比较要快的多,所以 Git 这样的实现方式可以让工作区状态扫描更快速的执行。

如图所示,文件 .git/index 像是一个虚拟的工作区。在这个虚拟工作区的目录树中,记录了文件名、文件的状态信息(时间戳、文件长度等),文件的 内容并不存储其中,而是保存在 Git 对象库(.git/objects)中,文件索引建立了文件和对象库中对象实体之间的对应。

git-stage

  • 图中左侧为工作区,右侧为版本库。在版本库中标记为 "index" 的区域是暂存区(stage, index),标记为 "master" 的是 master 分支所代表的目录树。
  • 图中看出此时 "HEAD" 实际是指向 master 分支的一个“游标”。所以图示的命令中出现 HEAD 的地方可以用 master 来替换。
  • 图中的 objects 标识的区域为 Git 的对象库,实际位于 ".git/objects" 目录下。

git基本命令

下面我们看一下 Git 命令是如何影响工作区和暂存区(stage, index)的。

  • 当对工作区修改(或新增)的文件执行 git add命令时,暂存区的目录树被更新,同时工作区修改(或新增)的文件内容被写入到对象库中的一个新的对象中,而该对象的ID 被记录在暂存区的文件索引中。
  • 当执行提交操作git commit时,暂存区的目录树写到版本库(对象库)中,master 分支会做相应的更新。即 master 指向的目录树就是提交时暂存区的目录树。
  • 当执行git reset HEAD命令时,暂存区的目录树会被重写,被 master 分支指向的目录树所替换,但是工作区不受影响;当执行git reset --soft HEAD时,撤销上次的commit,暂存区目录树和工作目录都不会受影响。
  • 当执行 git rm --cached 命令时,会直接从暂存区删除文件,工作区则不做出改变。
  • 当执行git checkout 或者 git checkout -- 命令时,会用暂存区全部或指定的文件替换工作区的文件。这个操作很危险,会清除工作区中未添加到暂存区的改动。
  • 当执行 git checkout HEAD 或者 git checkout HEAD 命令时,会用 HEAD 指向的 master 分支中的全部或者部分文件替换暂存区和以及工作区中的文件。这个命令也是极具危险性的,因为不但会清除工作区中未提交的改动,也会清除暂存区中未提交的改动。
  • 当执行 git diff用于显示工作区和暂存区(index)的区别
  • 当执行 git diff --cached用于显示暂存区和版本库的区别
  • 当执行 git diff HEAD用于显示工作区和当前HEAD之间的区别

git分支与合并[2]

ref[2]

references

  1. Git工作区、暂存区和版本库
  2. Git分支的新建与合并