组织与管理/备份
备份非常难,不是设计上的,而是实践上的。
数据备份,是必不可缺的一环,也是很难处理的一环,因为掌握备份的度,很难。在到达“数据收藏癖”这个范围内,备份数据不是说“复制一份”就完事了,因为没有那么多的资源可以利用——钞能力另说。
此前我从经济及可支配资源的角度表达了我的想法:
备份方案并不见得可靠,在大于100TB的时候,机械硬盘的成本太高,存储非重要资料都要上磁带机,更别提备份,根本不可能备份一遍,对于非核心资料,只能磁带机存储一份了事。而磁带虽然持久,但对环境是有要求的,我在中原,天气不潮湿、有摄影机防潮箱装着,但是因为经济问题,室内并不会冬暖夏凉,所以环境不会是最佳环境,而据一些社区的讨论,有的人写入了百十来盘,两年后只有几盘读不出来,当事人可能想表达存活率高,但是有几盘就意味着几TB的数据丢失(我的是lto5磁带,写入效率和单盘大小并不乐观),具体可靠性如何,是需要经过实际检验才能得出的结论。而这恰好在我的弱项,我没有那么多的经济支撑我去试错,甚至没有那么多钱去补足硬盘和磁带,所以我也懈怠了实体资源的收藏,看着很多好项目消失。
单纯备份,你可以参考其他现成的文章或策略(如:3-2-1备份),我只说我的策略:
- 重要的文件,本机一份、镜像一份,这是实时或者每周一次之类的定期的备份。本机的在固态硬盘上,镜像的在nas上(都在家里,所以不算异地备份,如果家里出意外数据就全部阵亡,但考虑到那时我也不在乎这些数据了就未作更多处理)。
- 将最终完成品——即如果丢失了就仿若心被挖去的那部分,复制一份到另一个不同环境的存储介质内,这样,即便所有备份丢失,您仍旧掌握最重要的那部分,而又无需进行3-2-1的复杂操作。
- 关键的节点(比如较大变动尤其是删除时)备份一份(并且最为关键的几部分都进行了保留),在nas上,最新的一个关键节点备份存云端一份,关键节点间的一般备份便可以删除了。
- 我是因为有很多文字手稿,如果不是高清视频太多,体积不会太大,只是增加内容,没必要弄那么多的关键节点备份,关键节点备份是处理涉及删减与结构调整的变化而存在的。
- 如果有条件可以电脑上再放个机械硬盘,冷备份一份。
虽然你能从经验中自己总结,但我还要多嘴一句,那就是“不是什么资源都有存档的价值”——但经历过反复删减大量垃圾内容从而切身体会到这点也非常重要,因为价值是主观概念,不是什么资源都是表面光鲜但粗制滥造的劣质物,更多的是因人而异的无法断论之物。不过有一点,对于热门影视,中短期内绝对不会消失;对于经典作品(尤其是噱头拉满的,如十大禁片、豆瓣前xx名)绝不会是难以获得之物;对于杂乱的大包若非内含稀有资源可酌情摒弃;电子书大包除非经过合理分类,否则libgen/zlib等公网渠道永远是更好的选择;而它们会占用大量的空间,这些最基本的权衡还是要掌握,该删时,不要删错了内容。
现在我从备份的角度上表达下想法:
- 最理想的低成本备份方案当然是制造一个容灾包,一次备份容灾包的所有内容,但要配合组织与管理/标签中对设想的标签管理器实现——那就是无法实现。
还是从最朴素的备份角度上说明:
- RAID不是备份是广为流传的说法,我个人亦是如此认为的,除了它本来就不属于备份外,当raid阵列出现坏盘时,损坏后的重构过程因为长期占用磁盘很容易导致第二个磁盘也损坏……并引发连锁反应,尤其是大多数人都是RAID5,出现第二块换盘意味着所有数据都丢失。
- 这不新鲜,但备份亦要注意与之有共通之处的隐患现象,如避免硬盘处在相近状态,例如所有硬盘都是2w+小时,读写xxTB,同样恶劣的湿温度/共振环境,那当出现第一块坏盘时,第二块也不远了,如果这些硬盘同时用于日用及备份,在某一块坏掉而从另一块拷贝数据时,风险也会增加。