数据标注的未来
近年来,人工智能的兴起让数据标注成为了新的热词。短短的数年时间,数据标注经历了由诞生、发展到转型产业化的过程。在这一过程中,不可否认的是,数据标注的未来正在变得愈发明晰。

打开网易新闻 查看精彩图片

随着5G及物联网的普及和发展,未来人类产生的数据将以无法想象的速度增长,数据量的增加能极大促进数据标注产业的发展。
同时,伴随着半监督学习和无监督学习在近几年的兴起,算法对数据的标注需求也在不断下降,在实际应用中减少标记样本的使用能够大幅缩减人力、时间和资源的开销,从而降低生产本。同时在标记样本数量减少数十或数百倍甚至更多的情况下,算法能够取得与传统量标记样本训练的监督学习算法相近甚至更好的效果,提升了生产效率。
2020年,中国能够保存下来的数据大约在10EB左右,其中,大约有90%的数据可用于标记并分析,因此,共有9EB(约19亿GB)的数据;按照标注40元/GB计算,(1G的视频约为30分钟,共1800秒,每秒24帧,共43200帧,按照每帧0.1厘计算,每GB约40元),2020年中国数据标注行业市场规模约为760亿元人民币。
在如此庞大的数量加持之下,质量问题同样引人深思。未来的数据标注行业中,效率与精度必然成为行业发展的关键。在这样的背景之下,数据标注行业能否加速转型的脚步,人才培养变得尤为重要。
AI优评在人才培养方面走到了前列。通过与权威机构的合作,AI优评建立起一整套科学的人才评价体系,并为考评合格的人才颁发国家职业资格培训鉴定实验基地统一核发的《人工智能技术服务-数据标注与审核》高新技术能力证书。除此之外,AI优评还直接对接到了企业端,为企业直接输送考评合格的人才,以此为行业的发展做出自己的努力和贡献。