vendredi 29 avril 2011

VCS + deduplication

La déduplication c'est très intéressant pour économiser l'espace disque.

En tout particulier pour des dossiers SVN. En effet, quand on fait un svn checkout dans /monprojet, SVN crée pour chaque fichier du projet /monprojet/fichier mais aussi une copie en /monprojet/.svn/.../fichier. Cette copie permet d'accélérer plusieurs opérations dont svn diff et svn revert.

Mais cela veut dire garder 2 copies identiques (ou quasiment) du même fichier. Mais grâce à la déduplication, cette copie ne coûte plus rien !

Par exemple pour un disque NFS (sur du NetApp) sur lequel une centaine de développeurs travaillent sur le même projet, on dépasse les 35% de gain d'espace disque par rapport à un stockage traditionnel.

En revanche pour GIT, qui stocke tout dans des blobs compressés, cette optimisation de l'espace disque devient impossible.