文 / 蒋深
随着人工智能技术的突破和算力的不断提升,大模型的应用也变得越来越广泛。用不用AI已经不是一个选择题,而变成了一个必答题。
这几年来,人工智能在多个领域的应用不断扩展,尤其是在自然语言处理(NLP)、计算机视觉、自动驾驶、医疗健康等领域,深度学习和生成模型的突破为各行业带来了变革,也带来了新的想象空间。
但真正的考验,其实才刚刚开始。
对很多企业来说,问题在于:面对几千款大模型,到底应该选哪个?选了一款大模型,可不懂行业怎么办?大模型算力成本高昂,企业如何负担?
一面是企业级的AI需求开始大量涌现,另一面则是选择困难,这成为很多企业数字化决策部门头疼的一件事。
选择大模型,到底难在哪儿?
作为企业,选择使用AI大模型与否,牵一发而动全身。一旦选择错了,不仅意味着巨大投入打了水漂,而且还可能意味着在同业竞争中落了下风。
实际上,很多企业之所以选择困难,最大的痛点在于,大模型能否与行业的know-how相结合。
每个行业的业务逻辑、术语和流程具有极高的专业性。AI模型虽然能生成通用答案,但如何深度嵌入行业,形成定制化解决方案,对很多AI公司来讲都是一块难啃的“硬骨头”。
比如在金融行业中,AI需要理解复杂的风险评估指标;而在医疗领域,准确诊断要求模型深入学习疾病特征和治疗路径。当前,企业多通过数据标注、微调模型等方式弥补这一差距,但这些方法代价高且见效慢。
哪怕生成式AI的产品迭代速度极快,但面对企业级的需求,想要在成本、功能上找到完美契合自身用例的模型依然十分困难。不同的行业都有独特的流程和规则,而这些往往不是通过简单的通用算法优化或数据处理就能掌握的。
更何况,企业自己组建团队来开发和调整,且不提专业门槛,所需付出的成本是非常高的,这一点就可能把大量中小企业排除在AI应用的门外。
在这些问题上,许多企业都在探索有效的解决方案。那么,有没有一种解决方案,既可以让企业轻松上手直接使用大模型,又能根据企业自身需求方便地进行调整?现如今,一家全球知名的云厂商,给企业带来了一个堪称“0选择成本”的解决方案。
在近期举行的re:Invent 2024大会上,亚马逊云科技带来了可谓满满一货架的AI产品:其中涵盖了从最底层的AI算力芯片、模型训练和推理,到中间层的上百个世界顶流基础模型,再到最上层的开箱即用的生成式AI应用,技术栈涉及各个领域。
换句话说,亚马逊云科技直接发布了一个AI完整版解决方案:对于亚马逊云科技的企业用户来说,在这里可以一站式集齐企业所需要的全部人工智能产品类型。
其中间层的“大模型超市”,就像山姆超市一样,通过严格甄选、大量采购、专业管理等优势,提升了产品质量,提高了选择效率,成本却可以降低很多,做到了“闭着眼睛买就可以”。亚马逊云科技的“大模型超市”,就起到了类似作用。
“选择很重要(Choice Matters)”,正是这次大会的关键词。可见作为全球领先的云厂商,亚马逊云科技对于客户的需求和痛点也有深刻洞察。
在大会上,亚马逊云科技新任CEO马特·加曼(Matt Garman)在他的主题演讲中就谈到,“我们发现,并非所有客户都希望使用单一模型。他们更倾向于根据需求选择多种不同的模型。有些客户偏好使用开源模型,比如Llama或Mistral,这使他们能够自行进行微调;有些客户的应用程序需要图像处理模型,例如Stability或Titan提供的模型;还有许多客户尤其钟爱最新的Anthropic模型,因为不少人认为这些模型在通用智能和推理能力方面的表现堪称市场最佳”。
由此可见,企业的模型选择困难,很大原因不在于市面上的模型太多,而是因为能够精准匹配的模型太少,或者说无法更好地满足企业的AI需求。而亚马逊云科技提供的一站式模型超市,针对企业使用大模型的难点和痛点进行专业研发和平台搭建,如此便可以在很大程度上缓解企业的大模型焦虑与选择困难。
实现“大模型自由”,到底要靠什么
解决了使用什么大模型,只是企业“上AI”第一步。必须记住,企业为什么要使用大模型?并非盲目追求技术潮流或无端增加技术投入成本,而是为了切实提升企业自身的核心竞争力,借助这一技术创新来优化业务流程、提高生产效率、增强决策能力,从而带来实质性的价值增长和竞争优势。
今天来看,“用AI”和“上云”的进程十分类似。在云技术推广之初,很多企业对这项技术都有过疑虑,或者怕花钱,或者怕麻烦,甚至怕添乱。还有一些原因,许多人可能想都想不到。
举个例子,在亚马逊云科技创业初期,由于合规性、审计、监管、安全、加密等考量,大部分的银行客户表示愿意采用云计算,但称可能永远不会上云。不过,亚马逊云科技没有放弃这些金融客户,而是花了十年时间来解决银行客户清单上的每一个问题。
在大会上,马特·加曼也说道:“今天,我很自豪地说,许多大型金融公司都是我们的客户。因此,当你在创新时,重要的是要记住,你真的要从客户开始。你要问他们什么对他们重要,但你不仅仅是交付客户要求的东西。你要为他们发明。”
事情本来就该如此。AI企业级应用的目标,是为行业赋能,而不是增加复杂性。从这点来看,亚马逊云科技的“大模型超市”的优势就很明显了。
从发布自研大模型Amazon Nova,到宣布与擅长视频生成模型的Luma AI以及擅长代码生成的poolside等大模型开发商达成合作,再到耗费重金投资Anthropic这样的顶尖大模型开发商,便可看到,亚马逊云科技整体策略是,在自主研发的基础上,不断为开发者提供一个多样化的大模型选择平台,用以构建AI应用,以满足企业用户的各种不同需求。
相比上线单一的大模型,上线一个随去随用的“大模型超市”,当然更方便企业用户解决各自的业务痛点,从而为企业赋能。
换句话说,在亚马逊云科技的“大模型超市”里,企业用户几乎可以实现“大模型自由”,或者说,“免于大模型的恐惧”。他们可以按照企业不同部门的需求来调用不同的模型,并根据所在行业的特点形成个性化解决方案。
上大模型,如何降本增效?
对企业来说,是否采用大模型,还有一个很重要的考量,即投入产出比。也就是说,能帮助企业降本增效的AI,才是有实际商业价值的。
企业首先会考虑,哪些业务环节可以通过AI来优化。这要求对现有流程有深入的理解,并能够准确评估引入AI可能带来的变化。
比如在医疗领域,AI可以帮助进行影像诊断,但前提是必须了解医学图像的专业标准以及医生的工作方式。在金融行业,AI可以用于风险评估,但这需要理解复杂的金融市场动态和监管要求。
此外,不同行业的数据结构和质量差异很大,有些行业如制造业可能拥有大量历史数据,但数据格式老旧、分散;而新兴行业如社交媒体则可能面临数据量庞大但噪声高的问题。因此,AI模型不仅需要具备强大的学习能力,还需要能够灵活应对各种数据环境。
对于上述种种问题,企业上大模型之后,是否能够在进一步降低成本的同时高效地解决?
面对这些集成了巨大复杂性的“投入产出比”问题,亚马逊云科技在今年的大会上,直接剧透了下一代算力芯片Trainium 3。该芯片将采用3nm先进制程工艺,提供两倍于Trainium 2的算力,以及40%的单位能效提升。
除了更高性价比的算力供给之外,亚马逊云科技还在致力于利用工具和架构层面的优化,降低企业开发的AI应用在调用大模型的过程中消耗的算力资源。
而从市场数据来看,目前也已经佐证了亚马逊云科技“大模型超市”的价值:根据Menlo Ventures的报告,采用亚马逊云科技模式的Anthropic在AI模型市场的份额翻倍至24%,而OpenAI的份额从50%下降到34%。
现在,在亚马逊的“大模型超市”货架上,不仅上架了“亚马逊云科技自营”的Nova系列,同时还上线了亚马逊云科技投资的Anthropic的Claude系列。此外,Amazon Bedrock还提供了Meta的Llama、AI21 Labs的Jurassic、Mistral AI、Technology Innovation Institute的Falcon RW 1B和英伟达NIM微服务等100多种业内一流的大模型。
在“自营”和“大店”之外,亚马逊云科技的“大模型超市”上还有第三方中小卖家,它们足够懂得行业的需求,也能最大程度地避免幻觉的出现。比如金融领域的Palmyra-Fin,翻译明星Solar Pro,多模态方向的Stable Diffusion、音频生成方向的Camb.ai,生物学方向的ESM3生成式生物学模型,也全部在Amazon Bedrock上架。
在降本的同时,也最大程度地提升了效率。
更安全、更稳定的大模型,如何实现?
还有非常重要却往往容易被忽略的一点,就是企业级的大模型应用和消费级的人工智能应用,有一个非常重大的区别,那就是企业级需求第一位的是安全和稳定。
你可以想象,一个用户对于AI给出的答案出现明显错误时,可能一笑置之,或者重新进行提问,但当这种问题屡屡发生在企业级大模型身上,毫无疑问会酿成严重的后果,既有可能企业因此失去宝贵的客户资源,也有可能使企业运营陷入重大困境。总之,这几乎是不可原谅的错误。
当模型生成的内容与事实不符、虚构或不准确,这就是所谓大模型的幻觉。对于商用企业来说,大模型的幻觉将直接影响企业的具体经营业务。所以,企业使用大模型,普遍会把更安全、更稳定作为一个选择标准。
但也必须承认,到目前为止大模型的幻觉问题并未得到完全解决,大模型在具体的行业应用上还是可能存在不专业的概率。
企业对安全性与稳定性的高要求,也是亚马逊云科技汲汲以求的目标。从目前来看,此前介绍的亚马逊云科技的“大模型超市”其实就为企业客户提供了一个稳定选择——在Amazon Bedrock Marketplace中,提供了超过 100个来自全球供应商的基础模型产品,用户可以在Amazon Bedrock上选择并且对这些新模型进行测试,并结合Bedrock上的知识库、Guardrails等一系列功能,再将其部署到企业的AI应用当中。
亚马逊云科技这些产品矩阵的存在,能够确保企业获得最为专业和精准的服务。
这还不够,亚马逊云科技还专门针对大模型的幻觉问题上了“双重保险”。
在今年的re:Invent大会上,亚马逊云科技专门推出了自动推理检查功能(Automated Reasoning checks),它能够防止因模型幻觉而导致的事实性错误。当你启用这些自动化推理检查功能时,Amazon Bedrock可以对模型所做出的事实陈述进行准确性检查,这一切都是基于可靠的数学验证,并且还会展示得出结论的依据。
全球专业服务公司普华永道也正在使用自动推理检查功能来创建高度准确、可信且有用的AI助手和智能体,并将其纳入到为金融服务、医疗保健和生命科学领域客户提供的特定行业解决方案中,包括验证AI生成的合规内容是否符合美国食品药品管理局(FDA)和其他监管标准的应用程序。
复盘AI近几年来的进展,到今天为止,生成式人工智能已经从实验室走向了普及化,越来越多的企业都开始感受到人工智能所带来的改变。但是面对门槛极高的AI技术和各种各样的AI模型,企业到底应该如何选择?
一定程度上,选择即战略。正如本次大会的关键词一样——选择非常重要(Choice Matters),能否做好选择,将关系着所有企业在AI时代的未来。
2025年1月7日至10日,拉斯维加斯CES大展期间,亚马逊云科技将为大中华区的创新者们呈现一场精心打造的非凡体验。诚邀您共赴盛宴~
长按扫码▼立即报名
热门跟贴