«

»

Mar 17 2020

遭受数据丢失

灾难降临了,却无能为力

——我

与数据丢失的斗争

我一直有备份数据的习惯。

在这之前则已经丢失过很多次数据。

比如初中的时候从别人家借的电脑,被家里人从摩托车上摔下来了,硬盘当场就废了。同型号的硬盘早没了,还得多掏钱陪一个更大更贵的。那机器在当年还没有 BIOS 技术,主板固件是写在硬盘里的,所以直接换硬盘会导致整台主机主板抽风。

上大学的时候 500 多块钱买西数的 500G 移动硬盘结果被坑,这盘有在使用途中自行掉电之后出现未分区未格式化的情况。因为是在实体店买的,我找店主理论,店主去翻仓库,发现全部都三码不合一(店主和店主上家应该都是受害者)。后来从旁边店拿了个三码能对上的同型号的,照旧有一模一样的毛病。最终加钱换了个三星的。这也是我一直不喜欢西数的原因。

后来,这块硬盘被盗。

pic001

大学时只有一张床,全部家当都放在床上。钱包,手机,移动硬盘全部都放在床上最难够到的箱子里。我去旁边寝室帮同学修电脑,回来之后移动硬盘就失窃了,而钱什么的却一分都没丢。

幸好移动硬盘里只是电脑数据的备份镜像。除了个人隐私泄露之外,并没有丢什么数据。

那个时候刚好赶上硬盘价格跳水,300 块钱搞了块 3.5寸的 1T 希捷监控盘(这容量这价格在10年之后照旧令人流口水,当然了,SATA-2 5900RPM 8M 缓存,是上个时代的产物)。

搞了个数据备份工具,将自己电脑中的数据分成几类,每天开电脑第一件事是手动执行一次备份。

后来换了台式机后,这块 1T 的监控盘就成了主机里的存储盘,主要工作就是备份数据。毕竟 SATA-3 7200RPM 64M 早就成标配,这慢启动的监控盘随机读写也是不利索。

我还开启了 Win7 的系统还原,只为了卷影功能,用来实现增量备份。

换了台式机后每次过年回家都把这 1T 硬盘拆下来用泡沫包起来随身带着。在家的时候用公司的笔记本的电脑就能访问自己的所有重要数据。

老笔记本则直接改成了 Linux 服务器,虽说干过很多事,不过私有云存储没变过,主要用来存工作上需要保存的数据。当时北京宽带还是有公网 IP 的,开小飞机给数据加密,跳过公司的脑残审查。同时手里还备有U盘,每天下班备份一次。

并不能做到万无一失

 

丢失数据

很久以前就一直看我博客的人应该知道我有一次错过航班的经历。那次是公司组织去成都开启动会公费旅游

当然是拍了好多照片和视频的。

因为我当时还没用上现在的索尼,用的是那个同学充话费送的 Y51A 。所以拍照这事主要由大学毕业前攒钱买的的相机负责。

拍了好多照片,好多景点,好多熊猫。当时还很幸运碰上几只熊猫幼崽打架,被我从头到尾全程录下来了。

从成都回来之后,当然是和习惯一样,把照片和视频都备份了。我应该还在公司的服务器里也传了一份给大家共享了。(因为公司是做存储设备的,硬盘和服务器在这方面很充裕,我又有很大的权限来操作部门内部的服务器和网络)

一晃两年过去了。

最近在玩 Blender ,需要一些视频素材。因为自己很少拍视频,所以只能想到去成都时拍的。

翻了一下硬盘对应备份目录中的文件,没有!

因为数据是平均每 4 天备份一次的,而我这十几个月来都没有看到过这个备份方案有删除文件的情况(全部都是新增),所以备份盘里也肯定,没有!

因为上个月重装系统时把卷影服务重置了所以卷影里也,没有!

数码相机里的数据也被重置过,没有!

我甚至用了文件误删找回工具去翻,很可惜电脑和相机在这两年内有过很大量的文件读写,误删找回,没有!

我甚至把电脑中所有 *.mov 文件全部都看了一遍(相机拍的视频是 mov 扩展名的),没有!

微信联系以前同事当时有没有过备份,没有!

部门解散一年半了,服务器早就拆没了,没有!

心累。

我现在能想到的唯一可能性,就是我当时根本就没用工具备份相机上的数据,理由是这么备份会同时向私有云里备份一份,然而私有云的存储空间极为紧缺,所以我是手工向主机中复制的文件到其他位置,又不知道是什么时候把这些文件和相机中的文件都删掉了,而这些文件并没存储到该存储的地方。

难受。

 

小米路由 R1D 硬盘损坏

我还幻想着没准路由器里会有备份?毕竟当时这货有个 1T 的硬盘在里面。而且这两年因为跟小米跟迅雷闹翻导致远程下载功能报废后就一直没用过。接上电直接红灯。根据官方的说法,叫系统损坏,网页还能登陆,可以刷机解决。

刷机你妈逼,刷机是你妈啊雷军?

去小米官网下 ROM,返回个纯文本的 JSON 404。

snap_start_at_590

在野生的网站找到对应的 ROM ,刷完当然是,跟没刷一样。

刷机你妈逼,刷机治百病啊雷军?

网页和SSH都是死透状态。

直接把这路由拆开把硬盘抠出来,这傻逼设计真是惊艳到瞎眼。

DSC_3349

不仅一点防尘设计都没有,你这他妈的把 CPU 热量往硬盘上吹!雷军你的脑子不 OK!

有点计算机常识的都应该懂:

  • CPU 发热量高但耐热能力强,一般 CPU 在 72-90 度压力完全不大,大不了还能自我降频。
  • 机械硬盘发热量低但耐热能力差,一般机械硬盘在 55 度就期望报警,60 度以上就容易出故障。

snap_start_at_579

你个破小米把抗热设备的热量往怕热的设备上吹,你说这产品设计人员上辈子是不是冻死的。

别扯了,中国人根本不关心在乎设计,也不会为设计花钱买单,甚至多数公司的资深设计人员都是花瓶摆设放那好看的,在这个只重视营销的环境下谈这些都没用。 好好看一下那些夸小米路由这个设计的专业评测吧,都是写连基础常识都没有的舔狗,反正有钱拿就行了。

直接把硬盘装核接机器上,直接识别到 EXT4 分区。然而并不能拷贝文件,只要有点操作就 IO 卡死。

看一眼 SMART,C5 值 57。

snap_start_at_578

我 2007 年的主机硬盘(还磕碰过几次,带壳或者整机摔的)的 C5 值才 04。

你说 2014 年买的存储硬盘,状态比差 14 倍,要不就是被这傻逼散热设计吹坏的,要不就是被小米自身的软件写坏的(即使里面没有文件的时候硬盘也无法休眠)。硬也傻软也傻,软硬皆不行。

我买这破玩意最初就没打算自用,只是这破玩意根本卖不掉啊。

只能靠 ddrescue 往外面救了。

snap_start_at_567

从上午开始,一直干到第二天凌晨三点半。导出了个 930G 的 img 文件。

snap20200316095612-1

看着状态还好。错觉。

用 ext2explore 提取文件。

snap_start_at_575

只取出来 180G 的文件,其他文件都看不到。盘里面应该有 800G 的数据,丢了四分之三左右。

虽说都是网上的资源,但很多甚至是我挂了半年才抠下来的几近绝版的稀缺资源,这些稀有的文件丢了之后估计全网都没地方再找第二份。

 

更新:结果是 ext2explore 的问题。这软件官网上说是发布了 2.2 版本(2010年),但给的所有 2.2 下载链接里的文件都是 2.1 的,也就是说不能正常支持 EXT4。我在 Linux 下挂在 Image 后能看到所有的文件,才注意到 ext2explore 竟然这么坑。

重新找工具把里面的文件提取出来,约 793 GB ,包含了我所有期望恢复的数据(然而并不包含去成都的照片)。虽然 Hash 校验是没法做了,但是检查了几个超大型的压缩包,均能正常测试通过。

 

以后怎么办

我跟存储行业打交道也不是一年两年。

同学以前的公司也做过不少产品。有个是用来存储医院的病例,因为这是当地的规定,数据必须上云多活异地灾备存几年,所以这个产品本地保存热数据和meta,冷数据全部上云,因为医院的数据太大了本地搞不起多活,所以都是买云存储。同学曾想出来把所有照片视频之类的数据也像这个方式一样存到云上。

我觉得不靠谱。虽说因为买的是云存储而不像相册服务一样怕跑路,数据也可以强加密不怕泄露隐私,就算供应商跑路还可以随时全部DUMP下来。然而最重要的一点,成本。以腾讯云为例,使用云服务存储 50G 的数据最低也要每个月 27.8 元,一年下来一块 1T 硬盘的钱都有了。更别说你还得跟老百姓讲,看个照片要装软件,要依赖网速,你还要看管好自己的签名加密证书……,你再讲下去他们全跑去用百度网盘了,2T还免费。

反正我是不用公有云。跑路要是有比赛,百度新浪网易金山还不定谁能夺冠。

看起来最可行的方案莫过于家用NAS,当然成本也是很高。如果只是单硬盘的,搞个树莓派配2.5寸盘就得将近 2000 块钱。如果想要组 Raid5 的话至少得有个靠谱机箱,不算硬盘就得 2500。要是没有动手能力的话用现成方案得 5000 多块钱,都够组一台台式机了(其实就是在组台式机)。这种高要求甭说一般家庭,即使是很多公司对自己的数据(命根子)都没这么重视

动手能力上我倒是没问题啊,问题是我这居无定所,这一摞硬盘怎么办。现在我每次跑来跑去都背着3块贼沉还占地方的大硬盘,自己都担心万一哪天摔倒了是不是就全丢了,不是我脑震荡就是硬盘脑震荡。

心累

13 comments

Skip to comment form

  1. sunnywolf

    办公的数据我都是用坚果云,每年好像200。家里照片视频就是HP N40L 组RAID5,然后搭了个黑群晖,专门备份照片,还同步到google photo,amazon s3上备份。S3费用每个月不到1美金,还是划得来的。

  2. 大致

    当年寝室电脑买了块长城硬盘,两年包换。我们去换了5次,把老板换跑了。
    不备份就没安全感。理解。
    金山毒霸免费以后,我有个表哥装了。去他家修电脑的时候,发现金山的病毒数据库占了10G以上的硬盘。从那以后对雷军就再没有好印象。

    1. 石樱灯笼

      长城硬盘,贴牌的,实体不详。我工作过的地方,有一次就是去仓库把长城的logo扯下来贴黑胶布上去。后来贴黑胶布客户不同意,于是在西二旗周边找能做这种胶条的,一般店里表示,1000条起步(单条的价钱倒是可以接受),问题是这些废铜烂铁能出20台就顶天了,做一千个扔980个么……
      所以自那时起我就觉得国产货水不是一般的深,淹死行内人士的情况天天有。
      毒霸做出有个新用户半个月免费,拿邮箱注册就可以。个人版也有离线升级功能。于是我每次跑去网吧装个毒霸,之后把升级包抠下来,再拷回家里电脑升级,好像也就十几M的样子(铁定是2007年前)。

  3. henix

    我自己最近也在尝试云存储,使用体验基本还行。

    > 以腾讯云为例,使用云服务存储 50G 的数据最低也要每个月 27.8 元

    不知道这个数据是怎么算出来的,腾讯云的单价是 0.118 GB / 月。只存储的话 50G 只需要每月 6 元左右,上传不收费,下载才收费。从你的文章看,只是用来备份,电脑上一般都会有一份,跟我的使用场景一样,所以下载肯定是没那么多的。不可能每个月把所有数据都下载一遍吧。

    更多可参考我这篇文章:已删除 欢迎一起讨论。

    1. 石樱灯笼

      帐都不会算就不要在别人博客里发软链了,也不嫌丢人。

  4. zmmio

    18年11月份在京东买了一个玩客云,一直仍在家当云备份使用,到现在挂的2T硬盘,用了800G多了,主要是备份手机里的图片、视频啥的,还有办公的文档,也下载电影看,不知道这个还能用多久的时间。

  5. 灰狼

    备份成本来说,最低的应该是移动硬盘。我连移动硬盘都没有……是应该去买一个来存东西。
    但有一点就是麻烦,要手工复制。

    1. 石樱灯笼

      最低成本的是免费云盘。
      如果限制条件是本地存储的话,最低成本的是3.5寸盘,接个SATA线就行了,外壳都不要。

  6. 陈大猫

    数据的重要性对每个人不一样。
    对我而言就是家庭成员慢慢累积的一些照片素材(视频极少,太占空间),少部分文档,我目前分三个地方存储。台式机、笔记本、移动硬盘。也没用什么工具,主力存储在台式机,想起来了就手动往另外两个拷贝一些。。

  7. Glegoo

    以前也丢过数据,用的是WD MyBook,当时还发了篇博文,所以我现在整个储存搞得非常变态。
    我现在公司的数据是:
    各种服务器的数据都备份到一台 QNAP NAS (RAID 1 ),为了避免误删除所有文件会在回收站里面放15天。每4小时自动生成一个快照,定时备份到外部硬盘,同时每两天上传到云(DropBox)。重要文档数据一旦更改之后立即同步到云。之所以用 DropBox 是因为不算流量费,像 Azure 那些算上流量费真的不得了!
    并且这些功能都是 QNAP NAS 自带, 自己 DIY 的话我估计费的力气不会少,NAS 这笔钱确实是值得花的。

    1. 石樱灯笼

      公司数据我现在完全不关心了。以前工作过的公司都没有备份资料的习惯,都是我默默无闻在背地里当好人,伤透了心。

  8. Mr.Chou

    你说西数不行,我倒觉得希捷不行~都是看人品,
    第二个硬盘320G好像只用了三四年就挂了~其实早期有提示一直没重视知道有一天开不起机才恍然大悟,我18岁之前的照片和所有数据都没了,现在那块硬盘还丢在家中封存;之后换了1T的西数一直用倒现在担心中~

    1. 石樱灯笼

      应该是看批次和产地,比如西数的硬盘不一定是西数的,也可能是三星的。
      现在可以说是没得选了,毕竟做硬盘的只剩那么几家了,可能以后想要安心存数据就只能买企业盘了。

发表评论

电子邮件地址不会被公开。 必填项已用*标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据