哈喽,大家好,我是小方,今天,我们主要来看看大模型是怎么从“人工智障”练成“万能工具人”的,为啥ChatGPT能跟你聊得火热,而有些AI却像个只会背书的书呆子?

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

光有常识不够,得让AI懂得如何与人交流,这就是后期训练,也叫监督微调,研究人员会准备大量高质量的对话示例,手把手教AI怎么回应才是得体的,比如,人类问“推荐个电影”,AI不能只列片名,得给出理由,语气还得友好。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

学会了聊天,还得追求更精准、更聪明,这就到了强化学习阶段,目标是把AI从“助手”变成“高手”,这个阶段的核心方法是让AI“试错自学”,对于有标准答案的问题,比如数学题或代码纠错,AI会生成大量答案,系统自动判断对错,然后强化正确路径。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

这就好比给人配上了计算器和百科全书,比如,你想让AI分析一份最新的行业报告,直接把报告内容贴给它,或者让AI通过联网搜索获取最新数据,它得出的结论就会可靠得多。现在不少企业的内部知识库系统,就是利用这种技术,让员工能像对话一样快速查询专业资料,效率提升非常明显。

打开网易新闻 查看精彩图片

了解了AI的成长历程,我们也要清醒认识它的局限,最常被吐槽的就是“幻觉”,即一本正经地编造错误信息,这源于它的生成本质——根据概率预测下一个词,而非真正“理解”事实,此外,它的知识有截止日期,复杂逻辑推理也可能出错。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

说到底,大模型的训练就像培养一个超级实习生:先给它海量资料自学打好基础,再请教练培训沟通技巧,接着通过大量实践练习积累经验,最后配齐办公工具让它大展拳脚。

打开网易新闻 查看精彩图片

作为普通用户,我们不必深究技术细节,关键是学会如何更好地使用它,了解它的能力边界,让它真正成为提升我们效率的得力伙伴。技术浪潮扑面而来,保持了解,积极尝试,就是我们拥抱未来最好的方式。