打开网易新闻 查看精彩图片

01

在7月26日的上海中国人工智能大会上,腾讯发布了世界大模型、华为发布昇腾384的AI算力系统。

打开网易新闻 查看精彩图片

这是我们自己的中国AI基座,作为企业家、投资者,我们如何在AI基座上发挥经营价值,发掘投资价值?真正把AI运用到我们事业中?

02

举个例子,前段时间我在研究投资产品型的企业,平台型企业,还是生态型企业更好?或者是企业在某个阶段更适合投资?

于是,我让大模型帮我整理腾讯、华为、美的等公司从产品型-平台型-生态型的发展过程。

我发现Deepseek说在2016年3Q大战之后,腾讯开始开放战略。

但对于长期研究和投资腾讯的我来说,3Q大战是在2010年。

这就是典型的AI幻觉,我相信大家都碰到过和我一样的大模型错误情况,根据测评结果,DeepSeek-R1模型幻觉率高达21.02%,远远高于豆包大模型的4.11%,也高于DeepSeek另一款大语言模型V3的13.83%。

同时,推理模型的幻觉比非推理模型更严重,推理模型平均幻觉率为22.95%,非推理模型的平均幻觉率为13.52%。

打开网易新闻 查看精彩图片

看到这样的幻觉率,你会怎么想?大模型还能用吗?

对于还没有接触大模型的人来说,可能会有这种想法,但是对于在学习工作中,已经大量使用的人来说,看法可能就不太一样了。

就像孩子两岁学走路的时候,三步一摔,你会让他不要再学走路了?趴在地下爬就好了?

所以,我一开始总结了两个方法:

1、AI输出后,让人来调整。2、多个AI大模型之间来取舍。

但尝试过后,我发现,这样的反复调整对效率和效果的提升很有限,AI的潜力应该不止于此。

在继续深入研究后,我在网上看到一篇16页AI论文,找到了提升AI大模型的使用效率和效果的方法。

这篇论文叫《反思,重试,奖励:通过强化学习实现自我改进的大语言模型》。

打开网易新闻 查看精彩图片

核心观点,就是让AI像人一样,通过反思,重试,奖励从错误中学习成长!

在论文中,研究员用数学方程进行了实验,阿里通义千问15亿参数的模型在第一次解题的时候,正确率居然只有6%,就像初中数学三元方程100分满分只考了个6分,简直就是个学渣,看到这个结果,估计你是不是觉得大模型就是大忽悠?

接下来,研究员引入“反思机制”训练后,第二次的正确率跃升到了34.9%。

研究员肯定了AI的进步,再让它根据第一次的反思重试一遍,第三次解题成功率提升到45%,有了巨大的跃升。

接下来,还有一个更让我脑洞大开的对比数据。

打开网易新闻 查看精彩图片

经过这种“反思,重试,奖励”学习方法训练的小模型,在能力上超过了参数量比自己大十倍的更高级模型。

研究团队用通义千问的70亿参数模型进行训练,结果发现,会“反思”的70亿AI小模型,表现都超过了不会反思的720亿大模型。

这就相当于一个善于反思的中等能力本科生,超过了一个更聪明、知识储备多出十倍、但缺乏反思能力的博士生。

在《腾讯传》写到,2003年一个从金山软件加盟腾讯的产品经理说,金山软件是一年迭代一次,经常出现产品难产和大量bug,而腾讯产品是每月迭代一次。

迭代速度,也决定了两家企业的成长速度,金山软件成立于1988年,比腾讯早了整整十年, 2007年在香港上市,腾讯在2004年香港上市,昨天市值5万亿港币,金山软件是488亿。

雷军在分享自己小米创业经历的时候说,在创业之前,大量研究腾讯、阿里等企业成功经验,所以,小米在做MIUI手机系统的时候,是每周迭代一次。

打开网易新闻 查看精彩图片

马化腾把腾讯的产品方法论总结为“小步快跑,试错迭代”,每一次产品的更新都不是完美的,但是如果坚持每天发现、修正一两个小问题,不到一年基本就把一件作品打磨出来了。

03

在AI时代,我身边有些朋友在使用大模型的时候,看到AI的回答有错误,不是重新生成,就是直接放弃,自己来修改。

但经验稍多的研究员,就会给大模型指出明确的错误和调整的方向,例如缺少了对同行的分析、缺少未来三个月可能潜在的风险分析。

所以,在投资研究和产品市场调研上,大模型帮我大幅度提升投研和整理资料的效率,给了我很多独特研究的视角和分析框架。

我公司在运用AI之后也减少50%初级和中级研究员的成本,但是有个大问题,就是数据幻觉非常严重。

比如我搜集新能源车2024年销量,经常出现多个数据失真或者是错误引用,甚至编造名人言论,这是非常致命的。

所以,我们目前让初级研究员用大量时间去完成数据和资料的校验。

当然,对我们更多的人来说,如何去掌握“反思,重试,奖励”的AI工作法,让大模型更好地提升我们的效率和效果?

我总结有五种方式。

1、AI输出后,让人手动来校验数据和资料。

打开网易新闻 查看精彩图片

2、逼问大法,先不给出明确的问题,开放式逼问AI问题在哪?例如数据错误,时间错误?让AI自己找出问题来优化。

3、多个AI大模型之间来取舍,可以同时让Deepseek、豆包、元宝混元、kimi进行回答,我一般是把我的身份、问题、结果、格式描述清楚,发给不同AI进行对比,这样就可以取长补短。4、喂饲料:喂给AI高质量的数据,比如给大模型投喂过去五年的腾讯年报,券商研究所的研究报告,行业分析报告,然后根据这些报告,帮我梳理投资报告,这种高质量的一手数据就能大幅减少数据幻觉,回答质量会高很多。

5、也是一种最好的方式,就是用大模型做评委,定出评审标准,来评判其他大模型的报告结果。

我原来只是用前三种,但在借鉴AI工作法的“反思,重试,奖励”后,重点提升4、5的方法,让人类和AI互相学习成长。

就像在人工智能大会上AI深度学习之父、2024年诺奖获得者辛顿说的:大语言模型的学习、思考类似人类大脑,人类与AI的思考终将同频共振。

打开网易新闻 查看精彩图片

所以,在接下来的AI时代,我们不用纠结AI是否“能用”,而是专注于如何让它“更有用”,迭代的速度,永远会比初始的聪明更重要。

未来的赢家,一定会属于那些率先学会与AI共思共生的智者。

责任编辑| 罗英凡

图片均来源于网

本文不构成任何投资建议,股市有风险,投资需谨慎

■ 免责声明

本文涉及有关上市公司的内容,为作者依据上市公司根据其法定义务公开披露的信息(包括但不限于临时公告、定期报告和官方互动平台等)作出的个人分析与判断;文中的信息或意见不构成任何投资或其他商业建议,市值观察不对因采纳本文而产生的任何行动承担任何责任。