近年来,基于神经网络的机器学习模型已经在许多领域实现了应用,不断增长的网络参数量也使得模型的应用效果越来越好。然而,人们很快发现,更大的参数量必须辅以在大量标注数据上进行训练以防止模型的过拟合,而大规模数据的标注在现实中需要耗费大量的人力物力,同时,以前模型的网络结构也并不适合进行大规模数据的并行化训练,制约了神经网络模型的应用。而最近几年快速发展的预训练模型恰好弥补了这些缺陷。与传统神经网络的大量有标注数据训练不同,这些模型使用大量无标注数据预训练+少量有标注数据微调的训练范式,也可以在下游应用上达到很好的效果。同时,对于网络结构的改进使得模型在面对大规模数据训练时更加高效。在大数据时代,十分容易从互联网获得大量的无标注数据,使用它们进行预训练可以极大地降低因为数据造成的应用成本。而减少对有标注数据的依赖,也让预训练模型在一些标注较为缺乏的新兴应用领域有了施展身手的天地。尽管预训练模型诞生的时间并不长,但它们已经在许多场景中得到了应用,并且获得了令人欣喜的效果。预训练模型在大量无标注数据容易获得的机器学习任务上能得到成功应用的根本原因,就是充分有效地利用了这些数据。
分享
热搜
相关推荐
-
阿Q正传中令人窒息的台词,小人物的悲惨经历!
鸟鸟影视官 4653跟贴 -
AI信任危机之后,揭秘预训练如何塑造机器的「可信灵魂」
机器之心Pro -
NeurIPS 2023 | 模仿人类举一反三,数据集扩增新范式GIF框架来了
机器之心Pro -
全世界机器人共用一个大脑,谷歌DeepMind已经完成了第一步
机器之心Pro -
创新者因计算而相遇,《麻省理工科技评论》中国正式发布“2023年中国智能计算创新人物”
DeepTech深科技 -
从零手搓MoE大模型,大神级教程来了
量子位 29跟贴 -
18个月,OpenAI这支团队搞出了GPT-4o
机器之心Pro 2跟贴 -
李博文等利用机器学习+组合化学,加速发现用于mRNA递送的可电离脂质
生物世界 -
剑桥团队开源:首个预训练通用多模态后期交互知识检索器
机器之心Pro -
以色列财长:将废除与土耳其的自贸协定 加征100%关税
界面新闻 2.4万跟贴 -
手机搜索里找来的“西门子冰箱维修官方人员”,收了1580元每天跳闸断电……杭州夫妻忍不了
都市快报橙柿互动 1.7万跟贴 -
HuggingFace教你怎样做出SOTA视觉模型
量子位 -
CVPR‘24:与任务无关的多模态数据也能提升Transformer性能
量子位 -
后Sora时代,CV从业者如何选择模型?卷积还是ViT
机器之心Pro -
台立法机构发生激烈冲突有人扭打在地 女"立委"尖叫
环球网资讯 889跟贴 -
2024投什么?先来看看人形机器人吧|钛媒体创投家
钛媒体APP 43跟贴 -
末节只丢9分!森林狼痛宰掘金进抢七 华子27分
网易体育 8723跟贴 -
图们江出海口开通事宜:两位“大哥”达成共识,“小弟”怎么办?
科普大世界 78跟贴 -
71岁作家向他们的挺俄总理连开5枪
陶舜财经 1.4万跟贴 -
中央督察组进驻上海!通报典型案例
鲁中晨报 132跟贴
热门跟贴