很多人以为:视频压缩,就是把文件变小。

但真正的视频编码,本质上更像:在欺骗人类的大脑。

因为一秒视频,其实是:24、30、60 甚至上百张图片连续播放。

一部两小时的4K电影,可能包含几十万到上千万帧画面。

如果每一帧都完整保存,体积会大到离谱。

所以问题来了:有没有必要,每一帧都完如何把几千万帧画面,压缩到极小体积,还尽量不损失质量整存储?

答案是:没必要。

打开网易新闻 查看精彩图片

因为现实世界的大部分画面,其实并没有变化。

比如一个采访视频:真正变化的,可能只有嘴巴和眼睛。

背景、墙壁、衣服,几乎不动。

于是现代视频编码干了一件极其聪明的事:它不记录整张图。

而是:只记录变化的部分。

比如:

第一帧完整保存。

第二帧这个区域往右移动了2像素。

第三帧这个嘴巴颜色变了一点。

第四帧背景没变化,不用重复存。

这就是视频压缩最核心的逻辑:时间冗余压缩

它本质上是在说:别重复记录已经知道的信息。

但这还只是第一层。

真正恐怖的是:现代编码器甚至开始研究,人眼到底“看不见”什么。

因为人的视觉系统并不完美。

比如:

  • 人眼对亮度更敏感;
  • 对颜色变化没那么敏感;
  • 对高速运动细节不敏感;
  • 对边缘特别敏感;
  • 对噪点容忍度高。

于是编码器开始有选择地丢弃信息。

比如:

  • 偷偷降低颜色精度;
  • 减少人眼不敏感区域的细节;
  • 在高速运动时模糊部分纹理;
  • 只保留你最容易注意到的部分。

这叫:有损压缩

听起来很可怕。

但现代互联网几乎所有视频,都在使用它。

因为:真正重要的不是数据完整。

而是:你感觉它完整。

于是你会发现:视频编码其实非常哲学。

它不是在保存现实。

而是在保存:人类以为自己看见的现实。

这也是为什么:现代编码器越来越像AI。

它们不再只是机械压缩文件。

而是在预测:

  • 哪些信息人类在意;
  • 哪些细节可以欺骗过去;
  • 如何用最少的数据,维持真实感。

所以今天一个几GB的电影,才能被压缩到几百MB,

还能让你觉得:画质没什么区别。

本质上,这是人类工程史上最成功的一次:对感知系统的逆向工程。