当前,图像处理是AI大模型开发和AI应用的重要领域之一。它与自然语言处理、语音处理共同构成人工智能大模型的三个重要前沿领域,都各自取得了重大进展。比较起来,AI图像处理具有“空间智能”特征。斯坦福大学教授李飞飞强调,“空间智能”是人工智能理解真实世界的关键技术,这项技术能够使人工智能完成从视觉、洞察力到行动的转变,增强其对三维空间的理解和互动能力。
图像处理的探索对理解民族视觉形象的本质以及未来在人工智能领域中拓展民族视觉形象研究和创造具有重要价值。就目前的技术水平而言,AI图像处理在某些方面,诸如分类、数据集,以及技术应用还没有达到对全球各民族视觉形象的全面认知。但是,它的设计思路和方法对从技术角度认识和理解民族视觉形象、研究民族视觉形象的机理与机制具有重要启迪作用。
民族视觉形象的社会历史文化机理
民族视觉形象反映了特定群体或共同体的文化规范、价值观和审美观。人文区位、历史事件、迁徙、战争以及不同文化之间的互动都对民族视觉形象产生了影响。例如,贸易路线加深了不同文明之间艺术技巧和图案的交流。艺术家在创作和塑造民族视觉形象方面发挥着重要作用。他们从本民族的文化遗产、个人经历、知识储备和当代发展与挑战中汲取灵感,创作出反映本民族的、形式多样的、丰富的艺术作品。绘画、印刷、摄影和数字媒体等技术的进步拓展了创作和传播民族视觉形象的空间。技术进步带来的创作方式使艺术家能够尝试新的形式、风格和媒介,接触到更多的观众。全球化带来的相互联系和文化交流,对民族视觉形象的生产和消费已经产生了深刻影响。艺术家们从文化传统中汲取养分,形成自己独特的风格和叙事场景。民族视觉形象是文化表达、适应和创新的产物,反映了人类经验的历史积淀。
当前,AI技术迅速发展并向各个领域渗透。这给各民族视觉形象带来了重大影响,我们从Sora的横空出世及其迭代发展中就已经看到了某些端倪。人工智能将促进全球范围内更多的文化交流和互动。随着人工智能实现跨越地理和文化界限的无缝交流与合作,不同民族的视觉风格将出现融合,这将促进新的混合视觉形象发展。AI系统在提高视觉形象的代表性和多样性方面发挥着重要作用。先进的AI图像识别和生成能力将会促进视觉艺术作品的创作和传播,展现更具包容性的各民族文化和历史,使不同民族背景的艺术家开展新形式的创作与合作,产出具有丰富文化内涵和活力的视觉形象。
AI图像处理的问题和不足
AI图像处理与民族视觉形象的关系是多方面的。用于视觉处理的AI系统,如图像识别、大型图像数据集训练等,其数据集会在无意中包含偏差,如对某些民族文化特征表达不准确等。AI图像处理系统中使用的算法也可能产生偏差,原因是算法本身的设计问题,也可能是训练数据中存在的问题。AI图像处理的解读受程序员自身文化因素影响,包括他们的世界观、价值观、人生观、审美偏好以及文化规范等。如果在训练数据时不能充分展示某些族群特有的文化元素,AI系统就难以理解或准确解释这些视觉形象。解决人工智能视觉处理过程中的偏差问题,需要提高训练数据的代表性和多样性,确保训练数据涵盖所有民族和文化的背景信息。通过在训练数据集中包含尽可能多样化的图像,人工智能系统在处理不同民族的视觉形象时才能更加准确。AI图像处理与民族视觉形象之间的关系错综复杂,要应对这些挑战,需要不断努力提高AI技术的多样性和包容性,尤其是提高AI科学家编辑代码的水平和人文素养。
卷积神经网络(CNN)等AI图像处理大模型的工作原理与人类艺术视觉形象的制作有很大不同。AI图像处理大模型的运行基于由其架构和训练数据定义的算法和数学运算。它们根据固定的规则和学习到的模式处理输入的图像,执行分类、生成或转换等任务。相比之下,人类艺术视觉形象的创作是一个极具创造性和主观性的过程。艺术家们基于自己的想象力、情感、知识积累、个人经历,创造出独特而富有表现力的艺术作品的过程不是算法式的,而是直观和迭代式的。AI图像处理大模型在训练过程中从大量有标记或无标记的数据中学习,从数据中提取特征和模式,进行预测或生成新图像。人类艺术家对周围世界有着深刻的经验和理性感知,包括形式、色彩、构图和象征意义等。他们的创作过程是通过自己的理解把抽象概念转化为视觉形象。AI图像处理大模型通常是为了优化特定目标函数进行的训练。人类艺术家通过自己的作品表达主观情感、思想和叙事,旨在唤起他人的思考、反馈和解读。AI图像处理大模型受所训练数据的质量和多样性的限制,可能难以泛化到训练分布之外的未见场景或不寻常的场景。人类艺术家则有能力想象和创造现实世界中可能不存在的全新视觉形象。他们可以从广泛的生活来源中汲取灵感,以新颖的方式把各种元素组合起来,创作出原创艺术作品。尽管AI图像处理大模型在自动化与视觉内容相关的各种功能方面取得了长足发展,但它们仍缺乏人类艺术家在制作艺术视觉形象时所具有的细腻描述、深刻理解、创造力和情感深度。
坚持以人为本的AI图像处理和开发
李飞飞提出以人为本的人工智能系统的开发思想,使我们看到计算机科学家与人文结合的重要意义。
从人工智能图像处理到目前研究民族视觉形象,必须坚持以人为本。要从人类的发展和需求出发,始终围绕人类的需要研究各类问题,深刻把握人类的中心地位和各个民族之间的不同文化和不同价值取向,从人类的进化史理解AI图像处理的机制和机理。要深入研究各个民族视觉形象的历史、形成、特点、分类以及内在机制。为在计算机视觉分类、数据集建设中夯实人文社会科学基础,使AI图像处理视觉能更准确把握各民族和全人类共同的文化发展的特点,帮助人们更好推进不同民族之间的文化交往、交流和交融,必须加强AI图像处理大模型的发展机制。在推动民族视觉形象的AI图像处理开发和建模中,要发挥人类学家、社会学家、文化专家以及其他领域专家与计算机科学家、生命科学家之间的跨学科合作,形成全方位理解民族视觉形象的体制、机制,不断推进全球文化的发展和融合。建立由计算机科学家、程序编写人员、人类学家、社会学家以及各领域相关专家参与的模型监督审核机制、问责机制,确保人工智能能够按照人类的共同价值和需求开发相应的模型,使其能够正确反映社会发展的历史、现实和人类的需要,推动人类社会进步。
在创建和解释文化视觉形象时,算法偏差、数据隐私和文化敏感性等问题需要认真研究,确保AI技术为保护和促进文化多样性与保护人类文化遗产作出贡献。虽然AI有可能通过创新与合作提升各民族的文化视觉形象,但它也带来了一系列挑战,如文化同质化等。平衡AI在文化领域带来的机遇和风险,必须深入考虑伦理、法律和社会文化因素。AI对各民族文化视觉形象的影响取决于如何开发、部署和管理这些技术,以及在多大程度上遵循多样性、包容性和尊重文化遗产的原则。
在人工智能不断推陈出新的时代,人文科学、自然科学、社会科学不是各不相关的,而是高度联系的。这种联系会推动大科学体制机制的形成,并形成对人类前景、历史进程、现实发展和未来愿景的全面认识和勾画,最终为人类的文明延续和发展创造条件。民族视觉形象是个非常复杂的问题,它进化、成型、发展于各个民族的历史、政治、经济、文化、地理、环境、生态,以及世界观、人生观、价值观和审美观等。要了解民族视觉形象,必须深入了解各个民族的人文区位、世界观、人生观、价值观、审美观。至于视觉形象中表达的情感问题,则更加复杂。情感处理问题已经进入AI的研究视野,但还有很长的路要走。
我们已经进入了这样一个时代,即需要通过深刻认识人类自身、生命科学来推动自然科学、数据科学的发展,通过自然科学、数据科学的发展加深对生命科学、人类社会的认知,以及把上述过程综合起来深刻把握人类与自然的关系、人类与宇宙关系的时代。这个时代需要在教育、科技、人才的体制上进行深刻的变革。
(作者系中共中央党校(国家行政学院)社会和生态文明教研部教授)
热门跟贴