本篇论文摘要由AI工具根据论文原文生成,阅读原文请访问“广电猎酷”小程序“”板块。

苏州市广播电视总台(以下简称“苏州广电”)提前布局,以实施国家文化数字化战略作为融媒技术项目建设的着眼点,加快建设数字化内容服务体系,自主研发了新型数据管理平台——“星聚”智能化资源汇聚平台(以下简称“星聚平台”)。

本文作者:

宋力,王歆宇 苏州市广播电视总台

第一作者简介:

宋力(2003年—),男,苏州市广播电视总台技术研发中心高级工程师,学士。主要从事融媒生产、媒资数据管理方面的研究,曾参与过融合媒体云生产项目、4K超高清全域智能一体化融媒创新体系建设、星聚平台等重大项目。

NO.1

系统架构设计

星聚平台利用互联网、人工智能等最新的IT技术综合应用,对资源管理业务进行重新规划,提出更高的要求,以满足对海量数据分析、数据标签化、智能化管理的需求。为了提高系统性能,满足未来的横向扩展性,在系统架构设计层面,以基础资源层、数据处理能力层、前端应用服务层的三层架构来进行项目的整体规划和部署,形成了一套高安全、智能化、全聚合的创新数据管理平台。

在系统架构的底层,我们自主构建了一个IT 基础资源平台作为底层技术架构,对平台的资源服务进行统一设计,打造了一个符合现在及将来业务拓展需求的高标准的内容资源管理平台。如图1 所示,这一架构平台为上层的数据处理和应用服务提供了强有力的支撑和保障,能够有效提升系统的稳定性、安全性和可扩展性。

图1 平台系统架构

NO.2

系统功能设计

2.1 全类型数据管理

与传统媒体行业媒资系统相比,该系统支持全类型数据格式。如图2 所示,它不仅涵盖了多格式视频、音频和图片等视觉资源,也覆盖了文档、电子报纸、富文本等多样化的数据文件。这种全面的格式支持使得星聚平台能够满足及适应各种行业的数据管理需要,也成为星聚平台实现复杂数据管理和推动项目成功的关键。

图2 全类型数据

2.2 多渠道汇聚

星聚平台突破了传统的PC 端上传入库模式,以创新技术拓展了数据资源的入库渠道。除了传统人工上传资源以外,平台还整合了5G 回传入库、新闻大数据采集、第三方资源平台合作以及人工智能生成等多元化手段,旨在整合多渠道和全类型的资源。

平台利用5G 模块以及定制自研开发的入库工具,实现超高清转播车和摄像机对现场活动高质量录像素材的实时高效上传、存储和归档。这一流程大幅缩短了内容制作的前期准备时间,从而加速了后续的节目编辑、制作和分发流程。

此外,该平台能够运用新闻大数据技术,自动抓取全网新媒体平台多渠道的重要热点新闻数据,为新闻策划与生产提供重要决策依据。同时与外部版权素材库对接,从而高效便捷地访问丰富的素材资源,还能避免版权侵权问题。该平台将多种渠道、多种类型的资源进行汇聚并有效管理,能够更好地满足内容创作过程中的多样化需求。

2.3 智能标签体系

星聚平台汇聚了不同类型的海量数据资源,包含了多样化的资源形式,如图片、音频、视频、文本等。面对如此海量的数据,传统的人工标签管理方式在准确性与效率方面已经不再适用。为此,平台采取人工结合智能打标的方式,建立了一个全面并且精准的智能标签体系,以更高效地对数据进行分类和标记。

智能标签体系通过整合智能识别、自然语言处理、知识图谱等前沿人工智能技术,有效地实现了对平台数据资源中关键元素的自动识别与理解。通过这些技术,系统能够从内容中精准地提取关键性标签,如主题、地点、时间和人物等。平台依托大数据分析和知识图谱技术,构建了标签知识训练模型,用来确定标签之间的相互关系以及它们与数据内容之间的关联。通过这种智能化处理技术,平台可以更有效地组织、管理和检索数据资源,使用户能够快速找到所需的信息。如图3所示,这些相互关联的标签和数据内容的智能分类也为搜索引擎优化、个性化推荐、数据挖掘等应用提供了强大的后台支持,为最终用户带来了更为丰富和精确的信息服务体验。

图3 智能标签

2.4 检索中心

2.4.1 多维度、全方位检索

星聚平台用户可以依据全文、标题、标签进行搜索操作,同时也可运用智能技术进行以图搜图、人脸搜索等高级搜索功能。此外,还支持用户设定多元条件,包括数据类型、主题、时间、关键词等,以实现更精确的目标数据检索。同时,语音识别、人物识别、图片OCR识别等智能技术以及相关应用,无论是文字、图片还是语音信息,均能被精确识别和检索定位,大大提高了检索功能的全面性和便捷性,从而极大地提高了平台数据利用率。

2.4.2 智能意图检索

星聚平台的意图检索功能是一种先进的检索机制,它不仅能根据用户输入的单个关键词,精准匹配检索结果,甚至能够解析出用户复杂查询背后的深层含义。这项功能通过实时分析用户的输入内容,准确理解用户真正的搜索意图,确保搜索结果的高度相关性。利用先进的算法结合强大的索引技术,该平台能够快速从海量多媒体内容中挑选出与用户意图最匹配的资源,实现在短时间内精确推送数据。这种算法包括但不限于自然语言处理(NLP)和机器学习,它们共同工作以理解、预测并响应用户的需求。平台的个性化推荐系统进一步增强了用户体验。它根据用户的历史搜索行为和表现出的兴趣偏好智能地调整内容推荐,确保用户始终能获取到有价值的信息,进而提高用户发现相关内容的可能性,满足用户日益复杂化、精细化的搜索需求。

2.5版权管理

星聚平台通过整合创新技术,坚定地加强版权素材的管理和应用。在确保内部版权内容安全方面,平台利用全网追踪技术、区块链、图片追踪技术以及全网大数据分析,为上传的文字和图片等素材的传播提供实时监控和追踪。这些技术确保每次内容的使用都能被记录,不仅迅速定位到版权内容的转载使用情况,而且能够固定侵权证据,强化版权确权与保护。在遇到侵权行为时,这一体系能够有效追溯并采取必要的法律措施,确保创作者和所有权人的权益得到维护。

此外,在拓展外部版权素材的应用方面,星聚平台与各大版权素材库进行对接,方便用户合法地获取多样化的高质量素材,从而避免版权侵权的风险。同时,平台还结合AI技术辅助内容创作,从而提高效率,拓展版权内容的实际应用范围。AI技术的引入不仅丰富了平台的素材库,提升了用户体验,还加强了版权内容的创新能力和市场竞争力,助力平台在版权管理和资源服务领域取得差异化优势。

NO.3

关键创新技术

3.1 智能识别技术

星聚平台充分发挥人工智能技术的强大潜力,为海量数据资源构建了一个综合多维度智能化管理系统。如图4所示,通过集成先进的识别技术,如人脸识别、语音识别、图像识别、 OCR识别等,根据不同类型数据运用相应的识别技术,精准提取资源标签,平台数据通过标签化处理变得易于检索和管理。其中,文字识别技术能够识别视频中的字幕和敏感词汇,而语音识别则能将音视频中的口语内容转换为文本,进一步丰富搜索和引用的维度。同时,人脸识别技术在资源管理中起到了核心作用。它不仅能够识别视频和图片中人物的基本特征,还能辨识出敏感人物,为内容筛选和最终发布提供了安全审核依据。

图4 智能识别

智能化管理的核心在于其高效和精细化的处理能力,它使得原先单一检索维度的数据资源得到深度优化,并最终实现价值的深度挖掘。智能标签提取技术通过分析大量的图片和视频数据,学习并识别出不同的元素和特征,比如地点、季节、时间和人物信息等。这些信息被用来生成准确的标签,从而极大地提升了识别精度和素材管理效率。通过这种智能处理,星聚平台为用户提供了更加丰富、优质的用户体验。

3.2 大数据分析技术

星聚平台利用全网大数据分析,提供了卓越的内容知识获取服务。通过专业的训练,建立起一个复杂的标签知识体系,有效连接各类素材和标签之间的关联关系。这个系统不仅提升了搜索和关联素材的准确度,而且丰富了素材管理的多维度特征,帮助用户挖掘和利用数据资料的深层价值,极大地助力融媒体生产业务的发展。同时运用大数据分析技术,对用户行为和内容资源使用相关信息,进行智能化的分析,记录用户收藏、下载等各种行为数据,分析用户偏好素材的类别等等,为平台提供精准的运营数据支撑。如图5所示。

图5 大数据分析

3.3 文件直通技术

星聚平台借助自主研发的创新专利技术——“文件直通隧道”,大幅提升了基于通用制作工具的存储管理和素材调用效率。该技术使得平台能够在超高清创制的时代,快速处理和管理超大视音频文件,通过存储系统层面的文件指针技术,实现素材一键“零秒”导入,从而显著提高融媒内容创制流程的效率。

苏州广电技术研发团队进一步扩展了这项专利技术的应用范围,成功实现了星聚平台与Premiere、DaVinci Resolve、剪映、大洋、索贝等市场主流视频编辑软件的紧密对接和技术融合,如图 6所示,让用户使用星聚平台时,可以与各种通用剪辑软件之间实现资源的无缝协同与调用,极大地简化了内容创制流程,并提高了工作便利性。这也确立了星聚平台作为苏州广电融媒内容创制体系核心资源平台的地位。

图6 “文件直通隧道”的制作模式

NO.4

应用情况

星聚平台不仅是苏州广电内部融媒生产核心平台,入库素材超36万条,标签数 1.8万个,存储总量 60TB,提升了融媒内容生产的效率,优化了资源管理,并为融媒创制与分发提供了强大的支撑。同时,在数字技术赋能经济方面,创新实现了多种业务模式,为苏州市文化宣传、新闻报道等方面提供了全方位的技术支撑与业务赋能。在苏州市委宣传部新闻中心“苏州媒资”项目应用中,以星聚平台为基础,为市委市政府实时提供全网重点新闻的报道情况和发布数量,成为全市新闻宣传工作统筹、协调、指挥的有力抓手。此外,在苏州市委市政府重点打造的中华文化惠民平台“苏州有戏”项目中,承担了戏曲数字化的基础设施建设,通过构建汇聚地方文化特色和城市精神面貌的视觉门户平台,为非遗戏曲文化的传承作出了卓越的贡献。

NO.5

结束语

星聚平台通过智能标签提取、人脸检索、图谱推荐、智能审核、AI创作等能力,解决敏感内容安全管控,实现多模态智能编目,盘活苏州文化资产数据,提供全网传播内容的智能聚类和推荐服务。2023年初,项目已基本完成全部的开发测试,并交付业务单元逐步上线使用,目前整个平台运行平稳。苏州广电将继续结合自身在媒体融合工作中的经验,加快技术体系的前瞻性布局和“四全”新型媒体的建设,在自主创新、项目研发上不断进行技术攻关与突破。今后该体系将努力服务于苏州市多个行业单位,发挥本地主流媒体在新技术上的引领作用,逐步推进产品在市场上的外延和拓展,从而取得更好的社会效益和经济效益。

end

参考文献

[1]刘知远, 韩旭, 孙茂松. 知识图谱与深度学习[M]. 北京: 清华大学出版社, 2020.

[2]杜雨, 张孜铭. AIGC智能创作时代[M]. 北京: 中国出版集团, 2023.

[3]郏东耀. 大数据与人工智能[M]. 北京: 清华大学出版社, 2022.

《广播与电视技术》、“广电猎酷”广告经营与商务合作代理:

北京中广信通文化传媒有限公司

联系人:李聪

联系电话:18518221868

好文共赏请转发 有话要说请留言