网络备份储存的选择

因为数据很重要,这其中还有大量的代码片段,笔记,各种资料文档等等.所以早前买了NAS,目的就是备份数据.

由于数据安全性和完整性必须得到保证,如果选用本地加密后上传,取回数据也是个麻烦,如果不加密,就必须选些靠谱的储存,总不能存着存着数据就泄密,搞出艳照门什么的吧.根据统计,里面最大的文件是20GB左右,总量大致21000个文件,因为是数据备份,所以本地NAS上传到备份储存流量较多,而从备份储存下载流量较少,可能要数据恢复时候,就是需要整盘转移的时候了.

首选对象储存,因为这是稳定成熟的储存,限制少(其实一点都不少,特别是文件名要求~),一开始找到一家wasabi,不足1TB按1TB收费,数据可靠性保证99.999999999%,在线时间保证99.9%,按照我的情况,每个月需要付出5.99USD的成本,一年71.88USD成本,按照现在汇率503.30人民币,可是一点都不便宜啊.到是如果出现问题,数据取回不要钱,但是数据不支持版本管理.

第二考虑S3,亚马逊S3提供很多的选择,由于数据不会频繁访问,所以要选择最便宜的储存方式,即S3 Glacier Deep Archive,收费为每月每GB 0.00099USD,按照我的数据量来看,0.852192USD每个月,一年付出10.226304USD,大概71元人民币左右.数据可靠度也是99.99999999999%,但是数据不能直接取出,取出全部数据本身需要大约70USD成本(如果使用AWS 同区传输可以做到免费,先用虚拟卡开AWS账号,然后共享储存桶,然后同区传输到CloudFront,再从CloudFront传回.),还要附加最多2天的取回时间(实测批量取回也是几分钟的事情~),单纯以储存来说,这个比较划算,而且支持版本管理,这也是我目前选择的.

关于Glacier Deep Archive的还原,数据通常会被检索到标准层,然后再提供下载S3 Glacier Deep Archive批量检索需要最长48小时才能完成,标准检索最长12小时才能完成,不能使用标准检索.由于S3 Glacier Deep Archive使用多区域磁带备份,所以落地和储存和磁盘肯定还是有差别的.

其他选择,例如DigitalOcean Object Storage等等,但是我最终没有去测试,原因是这些通常比上面的大牌还要贵,对于储存用途来说,并不合适.对于国内京东云,阿里云储存,对数据是否会被审查表示担忧,毕竟有些内容可能比较敏感(比如女神的自拍).所以也直接排除了.

次选网络储存服务,比如Google Drive/OneDrive for Business,首先12USD一个月的Google Drive我是肯定用不起的,所以只能退而求之那些所谓的校友账号,但是这种东西,是有翻车的可能性的,概率未知,数据可靠未知,数据隐私来说还好,正规大学的管理员也没空天天看你的东西,他要是有足够的权限去看看有一些什么校长信箱.

但是实际使用中,Google Drive由于政策原因,上传速度不太好,但是总体还是很稳定,OneDrive for Business又由于网络原因,经常出现重复传输的情况.860G的资料,同步了一周,在OneDrive for Business网页上显示占用了2TB?,后来看到一大堆tmp~文件,原来是传输一半又中断又重来,最终就这个结果,后来又试了下世纪互联经营的OneDrive for Business in China,到是数据不丢了,传输速度也很好,但是API限制过于变态,100G数据硬是传了一周,价格来说还并不便宜.

最后的选择是使用Storage VPS,由于数据没有安全性保证,价格也不便宜,最终没有考虑.


最后,我如何实现了我的备份架构.

从NAS利用Cloud Sync直接备份先到Google Drive,然后在服务器上使用了每天定时的程序复制文件到S3 Glacier Deep Archive,附加使用Power Automate从Google Drive复制到了OneDrive for Business,最后数据冗余度分别为:

  • 本地NAS储存 [RAID1双盘冗余]
  • S3 Glacier Deep Archive [3可用区冗余]
  • Google Drive 教育账号 [两个账号互相备份]
  • OneDrive for Business 教育账号 [两个账号互相备份]

要是这样数据还是丢了无法恢复,那就认命了.

《网络备份储存的选择》有2个想法

不优秀的夹心饼干进行回复 取消回复

电子邮件地址不会被公开。 必填项已用*标注