Git 存储过程探究

5600阅读 0评论2012-09-04 无赖皮肤
分类:项目管理


1
 一些基础概念

1.1 SHA1

SHA1是密码学上的一种算法,git通过它来识别文件。在git中,通过对“对象”进行计算得来的SHA1,来得到对该文件项目的索引。其中SHA1值是一个40 个字符大小的“对象名”。所有对该文件的索引,都是通过该SHA值进行的。


实例:


 

  1. ~/ChenOS$ git log
  2. commit 4931e7216c6128fc86ee517f644e0cabc5be1cdc
  3. Author: Li Shuo
  4. Date: Sat Sep 1 08:44:26 2012 +0800
  5. 在emacs下测试一下
  6. commit 31ea7b0e2727c11250c45c0e4783a7c9bad79b42
  7. Author: Li Shuo
  8. Date: Sat Sep 1 07:44:38 2012 +0800
  9. 对freedos进行忽略,不提交到版本库
  10. commit 5380879d00d6cc47b68b43387715f844362c1e09
  11. Author: Li Shuo
  12. Date: Fri Aug 31 20:47:37 2012 +0800
  13. add freedos.img, modified bochsrc and make it into protectmode
  14. commit c1007d90ff564de39dd4c5a53231cadf941816df
  15. Author: Li Shuo
  16. Date: Fri Aug 31 20:03:46 2012 +0800


 

其中的commit后面跟着的就是SHA值。


1.2 bolb对象

bolb用来存储文件的内容,它是一块二进制数据。Blob对象不像Tree或者 commit对象一样,它没有指向任何东西或者其它属性。所以说,它本质上就是一个存放文件内容的仓库。


1.3 tree对象

一个tree对象通常有多个指向blob对象或者其它tree对象的指针,这个指针其实就是一个SHA值。tree对象一般用来表示内容之间的目录和层次关系。


1.4 commit对象

commit对象指向一个tree对象,并且它本身带有一些相关的描述信息。


2 实例测试


2.1 首先查看commit对象的SHA值

使用git last命令可以查看最近一次的提交,下面commit所跟的即是该次 commit的索引,我们可以利用该SHA值查看commit中的内容。


该命令的语法格式:

 

  1. git last

 

测试:

 

  1. ~$ cd ChenOS/
  2. ~/ChenOS$ git last
  3. commit 4931e7216c6128fc86ee517f644e0cabc5be1cdc
  4. Author: Li Shuo
  5. Date: Sat Sep 1 08:44:26 2012 +0800
  6. 在emacs下测试一下


 


2.2 查看commit对象中的内容
 

从上一步中,我们找到了commit的SHA值,接下来可以使用该值查看commit的存储结构。


该命令的语法格式:


  1. git show -s --pretty=raw [commit-SHA]

测试:


  1. ~/ChenOS$ git show -s --pretty=raw 4931e7216c
  2. commit 4931e7216c6128fc86ee517f644e0cabc5be1cdc
  3. tree f5b7e53e20b4fc8aea3050863c8e69962850c4a6
  4. parent 31ea7b0e2727c11250c45c0e4783a7c9bad79b42
  5. author Li Shuo 1346460266 +0800
  6. committer Li Shuo 1346460266 +0800
  7. 在emacs下测试一下

从命令的输出结果上看,在commit中,存储这该commit的索引,以及tree对象,父对象,作者和提交者的信息。在这里,我们需要的只是tree对象的索引。


2.3 查看tree对象中内容

由上一步,我们找到了commit指向的tree对象,我们就查看tree对象里面存着什么。


语法格式:


  1. git ls-tree [tree-SHA]

测试:


  1. ~/ChenOS$ git ls-tree f5b7e53e20b
  2. 100644 blob e930018d222af541a6ec6ea93b7b09ae8af27141 .gitignore
  3. 100644 blob 83019b82b43bfdcff6cc3a0fb654a8c217644cb3 README
  4. 040000 tree 8034271b096fa202f664224651aade823918b4f3 V0.1

从输出可以很清楚的看到,tree对象里面包含着blob对象以及其它tree对象的索引。仔细看,其中那个tree对象索引是一个目录,跟上面两个的属性不一样。而在这里,我们需要的是blob对象,我们希望知道blob里面放着什么。


2.4 查看bolb对象中内容

语法格式:


  1. git show [blob-SHA]

测试:


  1. ~/ChenOS$ git show e930018d222a
  2. V0.1/freedos.img
  3. *.img
  4. *.bin
  5. *.a
  6. *.o
  7. ~/ChenOS$ git show 83019b82b4
  8. This is my project of ChenOs.
  9. It's small , but all made by myself.

我们再用cat看看这两个文件的内容:


  1. ~/ChenOS$ cat .gitignore
  2. V0.1/freedos.img
  3. *.img
  4. *.bin
  5. *.a
  6. *.o
  7. ~/ChenOS$ cat README
  8. This is my project of ChenOs.
  9. It's small , but all made by myself.

看清楚了吧,两者实际上是一样的,也就是说blob对象存储着文件的内容。


3 总结

到现在,我们可以说基本上搞明白了git存储过程。Git通过SHA值找到commit对象,在commit对象中存储着对tree对象的索引;接着通过该tree索引,找到tree对象, tree对象中存储着对blob对象和其它tree对象的索引;最后,通过索引找到blob 对象,而blob对象中则存储着实际的文件内容。整个过程完成。


上一篇:Emacs Cscope 安装
下一篇:Emacs AucTex安装