打开网易新闻 查看精彩图片

一位Reddit用户最近晒了自己的备份日志:把NAS当PC用,5年攒了47个婚礼相册副本,占用空间从计划的2TB飙到6.8TB。这不是个例。Backblaze 2023年报告显示,家庭NAS用户的冗余数据占比平均达34%,而企业级存储规划师会把这个数字压到5%以下。

差距不在硬件,在文件夹结构。

我们从小被PC训练出一种本能:桌面放快捷方式,下载归下载,文档归文档。Windows、macOS、Linux都这么干,肌肉记忆刻进DNA。但NAS不是PC,它是仓库,不是工作台。把PC的文件夹逻辑搬进NAS,就像把衣柜的收纳法套用到档案馆——短期内能找着东西,长期全是灾难。

作者花了三年才想明白这件事。他的转折点是一次例行备份:快照工具提示"检测到127GB重复文件",排查后发现是三个不同路径下的同一套照片——手机自动上传一份,电脑同步一份,手动拖拽又一份。婚礼相册只是最显眼的那个。

PC思维在NAS上的三大翻车现场

PC思维在NAS上的三大翻车现场

第一,权限成了俄罗斯套娃。

PC是单用户逻辑,NAS天生多用户。作者早期把媒体文件全塞进个人账户,后来装Plex时发现:要么给媒体服务器开全盘访问,要么逐层剥洋葱般调整共享权限。他选了前者,"反正家里就这几口人"。三个月后,某个Docker容器被扫到漏洞,攻击者拿到了他整个存储池的读取权。

这不是技术问题,是结构问题。PC的"我的文档"思维让用户默认"我的=隔离的",但NAS的服务架构要求"按功能分区,按角色授权"。作者现在的做法是:媒体、文档、应用数据各建独立数据集(dataset),Plex只挂载/media只读,Immich(照片管理工具)走/photos专用通道,个人账户彻底与服务解耦。

第二,备份策略被迫玩扫雷。

PC的备份是"整个C盘打包",NAS如果照搬,会把临时文件、缩略图缓存、容器日志全卷进去。作者最初的快照策略是每周全量,结果1TB实际数据膨胀到3.2TB快照占用——ZFS的重删救不了结构性的浪费。

他的修正方案分层很明确:热数据(最近30天工作文件)走每日增量,温数据(家庭相册、媒体库)周快照保留8周,冷数据(归档项目)月快照+异地复制。临时文件和缓存目录直接排除在备份策略外,像清理肠道一样定期排空。

第三,服务与存储的耦合灾难。

这是很多DIY NAS用户的暗礁。作者曾把Home Assistant的配置、数据库、媒体全塞进/homeassistant一个文件夹,升级时迁移像搬家——你不知道哪个子目录是配置,哪个是运行时生成的垃圾。Docker的卷映射(volume mount)设计本意是解耦,但糟糕的文件夹规划让它变成了新的耦合点。

现在的结构是:/config放持久化配置,/data放用户数据,/cache放可重建的临时文件,三者分别对应不同的备份频率和保留策略。升级容器时,/config和/data挂到新版本,/cache直接丢弃重建。

作者现在的NAS文件夹结构长什么样

作者现在的NAS文件夹结构长什么样

放弃"按用户分"后,他改成了"按生命周期分"。顶层只有四个数据集:

· fast:SSD池,放活跃项目、虚拟机磁盘、容器运行时。快照保留24小时,本质是"可丢的"。

· store:主HDD池,家庭相册、媒体库、文档。3-2-1备份策略,本地双副本+加密云同步。

· archive:冷存储,旧项目、原始素材、法律文件。单副本+异地磁带(其实是另一台低功耗NAS),写入后基本只读。

· service:应用数据,按服务分子目录,每个子目录内部再分config/data/cache。备份只抓config和data,cache在快照策略里直接跳过。

用户目录依然存在,但功能变了:不再是"我的文件放这里",而是"我需要临时中转站"。手机照片自动进/photos/inbox,作者每周花10分钟分类到/store的年度相册,或归档,或删除。inbox本身不备份,丢了就丢了。

这套结构省了多少事

这套结构省了多少事

备份窗口从每周4小时压到40分钟。快照占用从3.2TB降到1.1TB,接近实际数据量。权限管理从"每次装新服务就头疼"变成"复制粘贴挂载路径"。

最意外的收获是家庭协作。以前老婆找照片要问他"你存哪了",现在路径是固定的:/store/photos/2024/事件名。不需要解释,不需要培训,像冰箱的固定层架一样形成共识。

作者提到一个细节:他不再纠结"这个文件到底算文档还是媒体"。PC思维追求分类的纯粹性,NAS思维接受模糊性——照片附带的PDF收据?扔photos目录建个receipts子文件夹就行。检索靠搜索,不靠浏览。

这背后是存储哲学的根本差异。PC的文件夹是导航工具,NAS的文件夹是治理工具。前者服务于"我现在要找什么",后者服务于"十年后还能不能找回什么"以及"找回的成本有多高"。

作者最后放了一张截图:他的新NAS仪表盘,存储利用率61%,快照效率94%,上次备份验证通过时间是"2小时前"。评论区最高赞是问"验证脚本能不能分享",第二高赞是"我现在的结构就是你三年前那样,看完去改文件夹了"。

你现在的NAS文件夹结构,是更像PC桌面,还是更像档案馆的编目系统?如果明天硬盘挂掉,你能用多快速度列出哪些数据必须恢复、哪些可以重建、哪些其实早该删掉?