存储退潮
现在是2026年5月21日,我在某个该死的日子的后一天写了这个该死的东西。从去年下半年开始,因为AI的原因,整个NAND产业的价格都坐上了大火箭一飞冲天,顺带着把半死不活的HDD又一次救了起来,但是但是HDD的价格也开始非常搞笑的起飞了,我说AI确实刺激经济发展嗯嘛啊。就连HC620这种以前狗都不用的盘现在都要900CNY左右才能拿下(就是所谓的“加密盘”),以前能买到全新盘的价格更是只能买到矿和R盘。发展到今年大概两月份,这股涨价的风甚至吹到了磁带,这个基本上烂完的东西,驱动器价格基本上已经翻了4倍,垃圾存储介质也翻了4倍,非常搞笑。
然后到了大概四五月份,突然出现一堆神秘自媒体开始宣传磁带,当然我不能恶意揣测,但是一众神秘KOL和带货哥,以及非科技区的影视大V都开始宣传磁带,也是非常有默契了。总之引了一批大流到了这个杀马特存储介质上。我所在的神秘仓鼠小团体群也算是进来了一大批人,所以我出来劝退了!
磁带是如何毁了你的数据完整性的
如果你不幸的被骗进了这个无底深坑,我建议你马上把买的东西出了,看情况甚至还能找接盘的再赚一笔。如果你非常不幸的想要来受罪,可以往下看。
磁带,在这里只得就是LTO了,用IBM3592/T10K的富哥以及SLR等等的老登可以不用看。磁带的基建奇差无比,是的奇差无比。宣传的LTFS看起来很美好但是全部都是坑。而且在Linux上的坑比Windows上更大(想不到吧蛤蛤蛤)。磁带机只分成两种,使用STK的HP/HPE老机器(下文简写HP),纯血IBM的IBM机器。随着STK被龟壳收购倒闭丝滑一条龙,LTO7+已经没有HP的机器了,LTO7+的HPE机器机芯也是IBM的。判断IBM机器的方法也很简单,IBM的机器有一个7-SEG显示屏。说回LTFS,现在Windows/Linux上的LTFS的驱动都处于一个能用和不能用的中间态,非常混乱。IBM的LTFS驱动在Windows11上已经不能正常工作了,HP的还可以。是的,这两家的机器的驱动是不一样的!虽然大部分指令是一样的,但是一些重要指令的机器行为是不一样的,所以你需要去找到对应牌子的驱动,而且这两个驱动是互斥的,你不能同时装两个。
再说到Linux(蛆),虽然/dev/stx直写tar(所谓为磁带设计的打包格式)看起来很美好,但是你先别急。直接mount需要LTFS驱动,而大部分的发行版都没有这个驱动的包,你得去Github或者某个神秘镜像源下载到符合操作系统的驱动,然后才能正确“看到”这个磁带机。
接下来是文件的写入和读取,磁带机写入/读取文件并不具有端到端文件完整性保证。当然不是说正常写入的情况下没有保证,而是指家庭环境下没有保证。得益于磁带自带的ECC纠错机制以及磁带自带的压缩机制,一个固定大小的文件写入磁带后所占用的空间是不可预测的。同时LTFS还要更进一步,LTFS有一个分区是专门用来存储磁带索引的,但是这个索引的写入是定时的,没错是定时,这意味着固定刷新间隔,以及会将不完整的记录写入磁带(是不是很弱智)。当你的磁带机遇到Power-on Reset(电源太菜或者其他原因,BTW磁带机对5V的电流要求不低)后你这回写入的数据可以基本上当作白写,少侠请重新来过。LTFS同样没有内建(可以自己做)的文件校验机制,这意味着你在开箱情况下完全没有任何数据完整性保证(ext4:first time?)。同时,磁带中的文件是按照extents(连续的磁带空间)来存储的,而不是block,extents之间是可以复用的,所以如果你的文件运气非常好的非常可复用,当你提取的时候会发现这个傻逼机器开始读一下,倒带一下,读一下,倒带一下,坐牢程度堪比百度网盘无SVIP下载,因为LTO是没有反向读这个东西的,只有Seek到前面往后读。
如果你非常侥幸的跳过了以上问题,并且切小了分包,我们再来谈谈别的。众所周知磁带是直接暴露在空气中的,当然也会进灰以及发霉或者出现划痕。一般这些都被叫做垃圾带。非常不幸的是因为你不够起夜级所以大概率是会买到垃圾带和因为垃圾带出现问题的垃圾机的。对一台好的机器使用垃圾带会让好机器变成垃圾机,就像人被杀就会死一样。如果你非常不幸的用的是IBM机器,那大概率你的这台机器就报废了,恭喜退坑。老HP比较适合家庭使用,但是难免还是要手动拆机清理。BTW所谓清洗带基本上是没用的,这东西只是让写入错误率好看以及make tape drive happier,后面会讲。
写入的时候,因为各种原因会导致磁带一直纠错重写,在实际情况下,可能一盘所谓能存5T的磁带实际上放个100G的文件就写满了。在写入这种垃圾文件的时候会出现降速,reload,尖啸等一些“听”起来非常不正常的事情(没错你为了用这个倒霉玩意还得学会听他的状态),如果你不及时停止并进行干预,恭喜你大概率也可以准备退坑了。如果你运气很好的没有遇到以上问题,下一个到达战场的是early warning。这东西的幽默程度大概类似于Windows的红盘,但是LTFS驱动遇到这个会直接判断磁带已满不能写入,也就是意味着你最后的几百G空间是不能用的。结合分区,实际上你的官配可用空间大概是标称的未压缩容量的70%左右。
再说有些时候写入的时候会弹出,然后你看到一个C或者一个灯在闪,这是磁带机要吃清洗带了,这东西现在已经被炒到了几百块钱一盘,核心作用就是make tape drive happier,因为他对清洗工作在家庭条件下的磁带机基本上没有什么作用。总之你需要准备几盘清洗带。
最后保存反而比较正常,只需要保证湿度和温度,详见IBM手册。
IBM的机器非常娇贵,据某群友描述,LTO9/10甚至出现过运输过程中直接报废的问题,报损率超高。这就是起夜级,你只需要一年交20万的维保费,然后售后帮你解决所有问题。什么?你没钱?那很抱歉你不配。
综上所述,如果你像用正常的电子产品来用磁带机的话,大概率你的数据安全性还不如一个黑胶U盘。要用的话记得多买几台磁带机。
Changer
如果你还有带库。MSL的带库真的非常非常慢,还不如手快。建议使用i500。
垃圾国产NAS是如何橄榄你的数据完整性的
其他多了不讲了,关注HPE/群晖/DELL EMC谢谢喵。不建议使用国潮NAS系统,比如fnOS,关注Windows Server/TrueNAS谢谢喵。
错误配置的备份是如何橄榄你的硬盘的
有些人会用RClone之类的软件来备份文件,这东西在上传下载的时候,为了保证文件的完整性,大概率会将文件复制一份暂存在本地磁盘上,所以会造成极其严重的“上传放大”,对你的SSD造成巨大打击。同时这东西的实际可用性也非常不好用,我个人用起来是非常尴尬的。
Raid不是备份。Raid不是备份。Raid不是备份。Raid是冗余,提升可用性的,不多说了。关于群晖那个支持不同大小盘建池的切分方案,我还是持保留态度,使用之前的老方案。
信创大法好
在用BTRFS的时候,某些SSD主控(YMTC最喜欢的)没有实现正确的FLUSH命令,导致BTRFS爆炸,直接把你的数据送上天。BTRFS假设所有的存储设备都能正确处理先进的命令,如果主控没有正确实现,数据就可能会在写入过程中丢失或损坏。所以建议使用老牌SSD而不是国产SSD。三星0e全家桶当然仍然需要避免。
BTRFS
如果说EXT4完全没有保证,炸了你都不知道。那么BTRFS就是炸了会狗叫。如果你发现你的阵列进只读了,请不要直接使用btrfsck,这东西大概率给你数据全部送走。你应该寻找arch社区或者其他社区,btrfs用户含量高的社区寻求专业的正确的解决方案。
- btrfs有很多坑,但是只要你知道坑在哪,那它就是完美的文件系统
- 那btrfs不就是文件系统界的c++
- OvO
光盘是怎么死掉的
如果你不知道,BD驱动器已经停产了,ODS,索尼那个光盘整列也死了。抛开现在作为手办的CD,DVD和BD的写入读取速度到现在还在20M/s以下,同期磁带是(400M/s)。光盘的寿命完全取决于厂商和使用环境,你会遇到不限于发霉、脱胶、划痕(这东西可以靠打磨救)和染料褪色。光盘存的久的大部分都是“压盘”出来的,即批量物理刻录。剩下的是千年盘,这东西的价格你还不如去买HDD呢。同样的BD读取非常伤光头,记得多买几台光驱。
HDD和SDD的优点
数据存储一定要能存储。光盘和磁带一直没有进入大众市场是有原因的。BD招笑的寿命和读写速度,较高的存储成本;磁带幽默的维保和保存问题都使得这两个完全不适合家用。所以SSD和自密封不暴露的HDD仍然是最好的家用选择。所以如果你真的要添加存储,请顶着溢价买这两个东西,而不是被骗去买一些奇淫技巧。
云的优点
便宜,还是便宜。买个BackBlaze的Computer Backup直接无限存。百度云和115也便宜,加密上云就是了。云的好处就是不需要担心数据完整性问题了,云厂商会帮你做好备份和冗余的工作,当然前提是你选对了云厂商。大部分数据都不需要Always Online,所以大胆上云。不过不要找OSS,OSS和所谓深度存储的OSS还是很贵的。
目前我的存储方案
固态56t,机械12t,磁带250t。
结语
冲浪误入深水区,回头,SSD/HDD才是温暖的家。不建议新手把一堆开源工具裸拼成“自研备份系统”。工具能用不代表方案成立,备份系统至少要有校验、版本保留、删除保护等等,关注起夜级软件谢谢喵。介质方面,至少在大部分情况下光盘和磁带是完全没有任何性价比的,除非你开始有上百t的冷数据。
以及:不要相信AI,AI不懂。