这两天, AIGC (AI生成内容)火了!

打开网易新闻 查看精彩图片

AI生成图片、视频、音频等内容,给用户带来全新的体验,甚至激发了一些“不良”的创作欲望。
很多人看到这种场景就想:这是不是能解决 AI内容生成的问题呢?从图像生成、写作到视频生成,我们已经看到了 AIGC的发展前景。
但这些 AI生成内容,还存在一个问题:缺少“灵魂”。

打开网易新闻 查看精彩图片

在人工智能领域,计算机视觉和语音识别是主要研究方向。但它们在图像方面的研究较多,而对于文字内容的处理很少有深入研究。以计算机视觉为例,我们需要将人脸相关元素和背景分离开来;然后对单独的图像进行分析,找出特定区域(如人脸相关元素)里最能吸引我们兴趣的部分;最后提取这些图像中最能吸引我们兴趣的部分进行合成。这是一种类似于“洗牌”的过程:在此过程中,对图片内容进行标记和识别。
而 AIGC则需要在生成过程中,完成图像到文字信息的转化和匹配。比如:一张图片首先被分解成各个部分,然后对每个部分提取相关元素;随后匹配与这些元素对应部分内容,形成文字。这种“洗牌”与“合成”过程比较复杂,需要依赖于计算机视觉和语音识别方面的技术创新。

打开网易新闻 查看精彩图片

图像处理而言, AIGC可以分为三大类:图像识别(OCR)、图像分割(SIFT)以及图像生成(PNG+ AI)。
以生成图片为例,这需要用到“特征提取”算法;然后根据这些特征信息来对图片进行分割、标记以及匹配。