在许多文件存储场景中,时常存在文件内容的删除和更新,每当删除一些文件中内容时,会存在空间回收问题。正好最近遇到这个问题,在这里记录一下。
文件空间回收的常见解决方案- 将文件中有效内容拷贝到新的文件中,删除旧的文件从而释放空间;
- 类比数组,将后面的数据向前移动,移动的偏移为删除的数据长度;
- 文件打洞。
在一般的场景下,数据量不大(小于10G)或者数据与其他文件没有关联性,移动数据或者拷贝数据相对于文件打洞性能区别不打。如果当前的数据和其他数据存在数据关联,数据的位置的变更很大程度会影响其他数据(如索引数据)。存在数据关联的大数据,使用移动和拷贝(理论上也是移动数据),会削减系统的性能和工作效率。
基于linux的文件打洞命令调用:fallocate
fallocate -p [-o offset] -l length [-n] filename
这里重点介绍一下-p:
在以offset为起点的位置连续长度位length的区域,进行打洞,如果没有范围,便会移除整个文件系统块从文件中,调用成功后,后面的读便会返回为0;
函数调用:
int fallocate(int fd, int mod, off_t offset, off_t len);
mod有如下选择:
DEFAULT: 预分配空间
FALLOC_FL_KEEP_SZIE:
FALLOC_FL_PUNCH_HOLE: 文件打洞
后面在补充。。。。



