打开网易新闻 查看精彩图片

打开网易新闻 查看精彩图片

大约30年来,JPEG一直是万维网的主要图像格式。不过,网络诞生之初所采用的图像格式并不是JPEG。事实上,第一个主流图像浏览器NCSA Mosaic最初并不支持嵌入式JPEG文件,只支持嵌入式GIF以及其他一些已经被遗忘的格式。无论如何,相比被其取代的格式,JPEG有许多优点。

打开网易新闻 查看精彩图片

尽管JPEG没有随着网络浏览器一起出现(JPEG正式发布两年后的1994年,使用JPEG标准的图像才首次出现在了网景浏览器中),但JPEG和网络浏览器还是自然而然地结合了起来。JPEG文件的图像退化过程比GIF文件更优雅,能够保留图片的更多原始形态。这种特性使其实现了更广泛的成功应用。虽然JPEG不能制作动画,但它从使用调制解调器上网时代缓慢加载的格式起步,逐步发展成为足以用于高端专业摄影的图像格式。

就互联网的目的而言,虽然图片退化很重要,但它并非JPEG在数字世界中实现巨大价值的唯一因素。还有一个重要的原因是,它是由众多贡献者共同构建的文档化标准。

打开网易新闻 查看精彩图片

想知道JPEG作为标准有多重要?可以先听一个故事。

在史蒂夫·威尔海特(Steve Wilhite)因创造GIF格式而获奖之前,2013年他接受了《纽约时报》的采访,随后无意中卷入了一场辩论。

简单地说,就是没有人知道他所倡导的图像格式(Graphics Interchange Format)的首字母缩略词怎么发音。他尝试利用这个机会做出解释:它的发音就像花生酱品牌,“是一个柔和的‘G’,读作‘jif’,就是这样。”他说。

当时,我把威尔海特的这句话发布在了我很受欢迎的Tumblr页面上,当时这家社交媒体网站是应用GIF的热门网站。不久之后,我的帖子被转发了数千次,几乎所有的人都不同意威尔海特的观点。很快,威尔海特的这句话成为了一个表情包。

这一插曲凸显了一个事实,那就是,2022年去世的威尔海特并没有通过正式的委员会机制发展他所创造的格式。1987年,他作为CompuServe的员工接手了这个项目,然后他创造了这种格式,仅此而已。他可以说它应该读作“jif”,因为这是他创造的。介绍其工作原理的初始文档也非常简单。38年过去了,我们还在使用GIF,但它从来没有像JPEG那样出名过。

大约5年后,JPEG正式出现,该格式在很大程度上并不是由某一个人开发的。实际上,这是事实标准和实际标准之间的区别。事实证明,这对它最终的普及至关重要。

打开网易新闻 查看精彩图片

联合图像专家组(Joint Photographic Experts Group)与数十个利益相关者一起合作目标是创造一种符合每个人需求的格式。确切地说,该格式的名称是设计该格式的委员会的首字母缩写。1992年,这种格式最终面世时,有一本600多页的书以此为主题,这本书令人惊艳的封面展示了同一张JPEG图片的一系列版本。

由IBM员工与JPEG组织利益相关者威廉姆·B.彭内贝克(William B. Pennebaker)和琼· L.米切尔(Joan L. Mitchell)撰写的《JPEG:静态图像数据压缩标准》(JPEG: Still Image Data Compression Standard,施普林格出版社,1992年)一书介绍了由于缺乏一种方法来平衡对图像逼真度和即时性的需求,因此造成的多媒体图像发展受限制的现象。他们认为,标准化可以解决这个问题。“问题不在于缺乏图像压缩的算法(因为该领域已经有很悠久的技术工作历史了),”作者写道,“而是缺乏一个标准算法,一个允许在不同的应用程序之间交换图像的算法。”

他们的想法是正确的。30多年来,JPEG实现了高质量、高分辨率图片在操作系统中的广泛应用。尽管我们不再需要对JPEG进行极限压缩,但这种能力正是现代互联网发展不可或缺的推动力。

正如书中所述,米切尔和彭内贝克得到了IBM的支持,得以跟踪这项研究并与JPEG委员会合作。凭借这种支持,他们开发了许多JPEG格式的基础专利。米切尔、彭内贝克和两位同事在1988年提交的专利文件中介绍了IBM以及美国电话电报公司(AT&T)和佳能等JPEG标准委员会的其他成员开发的方法,这些方法使用了压缩技术,从而使得高质量图像在受限环境下更易于传输。

打开网易新闻 查看精彩图片

委员会的每个成员都有自己的需求。显然,佳能更注重打印机和摄影,而美国电话电报公司主要对数据传输感兴趣。这些公司共同努力,形成了一个经得起时间考验的标准。

有趣的是,这一切意味着,能够使用JPEG压缩的程序最早并没有出现在mac OS或Windows中,而是出现在了米切尔和彭内贝克所属的IBM公司所创建的OS/2这个优秀但最终失败的图形操作系统中。早在1990年,OS/2就可以通过OS/2图像支持应用程序支持这种格式。

打开网易新闻 查看精彩图片

JPEG文件与PNG文件或GIF文件的区别在于数据压缩的退化程度JPEG图像的目标是在完成所有压缩处理后仍能保持照片般的视觉效果,即便需要压缩至合理尺寸才能正常运行,这种格式也能让你用更少的字节数尽量还原原始图像。

或者,正如彭内贝克和米切尔所说的那样:“最有效的压缩是通过近似原始图像(而不是完全复制原始图像)来实现的。”

其核心是一种名为离散余弦变换(DCT)的压缩过程,这是一种有损的压缩编码形式,广泛用于各种压缩格式中,尤其是在数字音频和信号处理中。(有损压缩会永久性地删除一些原始数据,以便实现更小的文件;无损压缩则会发现数据中的冗余以缩小文件大小,同时保留原始质量。)从本质上来说,DCT通过去除细节来提供低质量的产品,同时通过近似来保留原始产品的核心。DTC越强,最终结果的压缩程度越高。

20世纪70年代,研究人员开发的该算法采用了数据网格,并将其视为可通过旋钮调节频率的系统。控制数据的速率就像水龙头控制水流一样,需要的数据越多,设置的数据速率就越高。即便在高度压缩的情况下,DCT仍然能维持少量数据流,尽管这意味着画质会略有降低。换言之,虽然压缩过程中无法保留全部数据,但DCT能确保数据的核心部分得以留存。

DCT无处不在。例如,观看流媒体视频或收听在线广播流时,由于带宽突然下降而导致观看或收听质量下降,这时DCT就大显神通了。

正如《JPEG:静态图像数据压缩标准》一书所解释的那样,JPEG文件并非只能通过一种方法来运用DCT:

JPEG标准描述了一系列图像压缩技术,而不是单一的压缩技术。它提供了压缩技术的“工具包”,应用程序可以从中选择能够满足其特定需求的元素。

该工具包有4种模式:

顺序DCT(Sequential DCT),这种模式会按顺序显示压缩图像,就像慢慢地放下窗帘一样。

渐进式DCT(Progressive DCT),这种模式会以最低的分辨率显示完整的图像,然后随着信息的增加而添加细节。

无损顺序式(Sequential Lossless),这种模式使用了窗帘格式,但不会压缩图像。

分层式模式(Hierarchical Mode),这种模式结合了前3种模式,因此该模式可能会从渐进式模式开始,然后缓慢加载顺序无损压缩,之后达到无损的最终效果。

JPEG标准创建时,峰值速度为14.4千比特/秒的拨号调制解调器非常普遍。这意味着图像加载缓慢,因此渐进式DCT成为了最适合早期互联网的格式。随着时间的推移,渐进式DCT越来越不常见,因为许多计算机可以轻松实现一次加载顺序DCT。

使用DCT压缩图像时,在图像中比较杂乱、纹理较多的区域(例如头发或枝叶),变化往往不明显。这些区域更难压缩,因此这些区域能更长时间地保持完整性。在纯色图像中或从一种颜色急剧变化为另一种颜色的区域,压缩造成的变化往往更明显。截取社交媒体帖子的屏幕截图后,图像可能会布满噪点,这就是一个制作JPEG文件的过程。

打开网易新闻 查看精彩图片

PNG等其他格式则在文本处理方面表现很好,因为其压缩算法是无损的。PNG的压缩格式Deflate是由菲尔·卡茨(Phil Katz)设计的,他还创建了ZIP格式。PNG使用Deflate的部分原因是,它是一种免许可的压缩格式。事实证明,这位杰出的程序员虽然一直在与酗酒做斗争,但他在不幸去世以前以多种方式改善了互联网。

尽管JPEG历史悠久且已经成熟,但它仍然是我们在互联网上分享照片的最佳选择之一。虽然它并不是适用于任何环境的最佳工具,但就像我们有时会把扳手当锤子用一样,我们也经常这样利用JPEG

打开网易新闻 查看精彩图片

20世纪90年代JPEG之所以流行起来,不仅仅是因为这种格式有质量优势。专利也发挥了作用,从1994年开始,科技公司Unisys就试图对依赖GIF文件的个别网站收费,因为这些网站使用了该公司拥有的专利。这使得免费使用的JPEG更受欢迎了。(这种情况也促使了无专利的PNG格式的诞生。)

虽然JPEG以标准为基础,但由于专利系统的原因,它仍然可能面临与GIF相同的命运。在JPEG格式出现的几年前,Compression Labs的两名员工提交了一份关于动态图像压缩的专利申请。不过,直到JPEG无处不在时,人们才发现它与JPEG压缩很相似。

1997年,一家名为Forgent Networks的公司收购了Compression Labs。Forgent Networks公司最终发现了这项专利,并开始就此提起诉讼,这场意外收获被该公司视为了天赐良机。

“从某些方面来说,这项专利就像是一张彩票,”Forgent的首席财务官杰伊·彼得森(Jay Peterson)在2005年向科技资讯网(CNET)表示,“如果5年前你告诉我‘你拥有JPEG专利’,我是不会相信的。”

虽然Forgent对JPEG压缩算法的所有权主张站不住脚,但该公司最终在法律诉讼中取得了比Unisys更大的成功,并向数码相机制造商和其他公司收取了超过1亿美元的费用。此外,Forgent还试图向个人电脑行业收取许可费;最终,该公司同意与大约30家电脑制造商达成800万美元的和解协议。

随着对其获取的专利采取越来越激进的维权方式,该公司开始在舆论场和实际诉讼中接连受挫。批评者纷纷援引有关先前技术水平的例子,而法庭则将该专利的适用范围限定在了视频等动态用途。

2006年,Forgent Networks公司的压缩专利过期,其商业诉讼模式随之终结。同年,该公司更名为Asure Software,专注于薪酬与人力资源解决方案,由此彻底地转型了。

JPEG为我们提供了很好的服务。要打破这种模式的地位很难。例如,JPEG 2000格式旨在通过提供无损选项和更好的性能来取代原始JPEG。虽然这种较新的格式在美国国会图书馆和美国互联网档案馆等专业网站得到了广泛的应用,但作为终端用户格式却不太受欢迎。

其他图像技术在突破JPEG格式的限制方面略有成效。谷歌支持的WebP受到了网站开发者的欢迎(但在终端用户中存在争议)。与此同时,与JPEG和JPEG 2000相比,同样由标准机构开发的格式AVIF和HEIC在技术上更先进。

目前,JPEG仍然很难被淘汰。从某种意义上说,这种格式的处境类似MP3音频与ZIP压缩,这两种传统格式都非常受欢迎,而且得到了广泛的应用,因此很难被淘汰。虽然其他格式能够更好地压缩文件,更高效地完成同样的任务,但要推翻一种领先30年的格式非常困难。

来源:悦智网

编辑:夜凌Ryelin

转载内容仅代表作者观点

不代表中科院物理所立场

如需转载请联系原公众号