組織與管理/備份

出自Wired
跳至導覽 跳至搜尋

  備份非常難,不是設計上的,而是實踐上的。

  數據備份,是必不可缺的一環,也是很難處理的一環,因為掌握備份的度,很難。在到達「數據收藏癖」這個範圍內,備份數據不是說「複製一份」就完事了,因為沒有那麼多的資源可以利用——鈔能力另說。


此前我從經濟及可支配資源的角度表達了我的想法:

  備份方案並不見得可靠,在大於100TB的時候,機械硬碟的成本太高,存儲非重要資料都要上磁帶機,更別提備份,根本不可能備份一遍,對於非核心資料,只能磁帶機存儲一份了事。而磁帶雖然持久,但對環境是有要求的,我在中原,天氣不潮濕、有攝影機防潮箱裝著,但是因為經濟問題,室內並不會冬暖夏涼,所以環境不會是最佳環境,而據一些社區的討論,有的人寫入了百十來盤,兩年後只有幾盤讀不出來,當事人可能想表達存活率高,但是有幾盤就意味著幾TB的數據丟失(我的是lto5磁帶,寫入效率和單盤大小並不樂觀),具體可靠性如何,是需要經過實際檢驗才能得出的結論。而這恰好在我的弱項,我沒有那麼多的經濟支撐我去試錯,甚至沒有那麼多錢去補足硬碟和磁帶,所以我也懈怠了實體資源的收藏,看著很多好項目消失。

  單純備份,你可以參考其他現成的文章或策略(如:3-2-1備份),我只說我的策略:

  • 重要的文件,本機一份、鏡像一份,這是實時或者每周一次之類的定期的備份。本機的在固態硬碟上,鏡像的在nas上(都在家裡,所以不算異地備份,如果家裡出意外數據就全部陣亡,但考慮到那時我也不在乎這些數據了就未作更多處理)。
    • 將最終完成品——即如果丟失了就仿若心被挖去的那部分,複製一份到另一個不同環境的存儲介質內,這樣,即便所有備份丟失,您仍舊掌握最重要的那部分,而又無需進行3-2-1的複雜操作。
  • 關鍵的節點(比如較大變動尤其是刪除時)備份一份(並且最為關鍵的幾部分都進行了保留),在nas上,最新的一個關鍵節點備份存雲端一份,關鍵節點間的一般備份便可以刪除了。
    • 我是因為有很多文字手稿,如果不是高清視頻太多,體積不會太大,只是增加內容,沒必要弄那麼多的關鍵節點備份,關鍵節點備份是處理涉及刪減與結構調整的變化而存在的。
  • 如果有條件可以電腦上再放個機械硬碟,冷備份一份。

  雖然你能從經驗中自己總結,但我還要多嘴一句,那就是「不是什麼資源都有存檔的價值」——但經歷過反覆刪減大量垃圾內容從而切身體會到這點也非常重要,因為價值是主觀概念,不是什麼資源都是表面光鮮但粗製濫造的劣質物,更多的是因人而異的無法斷論之物。不過有一點,對於熱門影視,中短期內絕對不會消失;對於經典作品(尤其是噱頭拉滿的,如十大禁片、豆瓣前xx名)絕不會是難以獲得之物;對於雜亂的大包若非內含稀有資源可酌情摒棄;電子書大包除非經過合理分類,否則libgen/zlib等公網渠道永遠是更好的選擇;而它們會占用大量的空間,這些最基本的權衡還是要掌握,該刪時,不要刪錯了內容。


現在我從備份的角度上表達下想法:

  • 最理想的低成本備份方案當然是製造一個容災包,一次備份容災包的所有內容,但要配合組織與管理/標籤中對設想的標籤管理器實現——那就是無法實現。

還是從最樸素的備份角度上說明:

  • RAID不是備份是廣為流傳的說法,我個人亦是如此認為的,除了它本來就不屬於備份外,當raid陣列出現壞盤時,損壞後的重構過程因為長期占用磁碟很容易導致第二個磁碟也損壞……並引發連鎖反應,尤其是大多數人都是RAID5,出現第二塊換盤意味著所有數據都丟失。
  • 這不新鮮,但備份亦要注意與之有共通之處的隱患現象,如避免硬碟處在相近狀態,例如所有硬碟都是2w+小時,讀寫xxTB,同樣惡劣的濕溫度/共振環境,那當出現第一塊壞盤時,第二塊也不遠了,如果這些硬碟同時用於日用及備份,在某一塊壞掉而從另一塊拷貝數據時,風險也會增加。