人工智能慢慢有了修成正果的样子|人工智能|人形机器人|图灵|机器翻译

本文核心观点：

大模型真正的本质是人机接口——万物皆可Chat。
人工智能正以“非图灵标准”的方式，越来越像人一样相互如此地不同。
真正能落地的人工智能应用越来越像机器，而不是像人。

前言：最近，被业界称为AI四小龙之一的云从科技发布了一季度的财报，其亏损情况令人惊讶。一季度的营收仅为 3700 万，同比下滑了 31%，和 2022 年相比，更是同比下滑了 83%，净亏损额高达1.2亿，居然是收入的3倍多。AI四小龙老大的商汤科技，曾经市值超过 3200 亿港币，如今只有 500 多亿，跌去了超过 80%。2024 年营收 37 亿，净亏损却达到了 43 亿，同样是亏损额显著超过了营收。在人工智能一片热潮之中，这些国内主要AI企业实际经营情况令人担忧。工智能领域特别容易让人产生误解，作出商业上的错误判断，真正找到可以有效落地的商业模式是很不容易的。我在过去写的很多文章中一直呼吁人们冷静和理性对待人工智能方向。

令人欣慰的是，宇视等从事人工智能视频业务的公司寻找到了比较好的商业模式，在这个领域经营一直比较成功。

2025年五一节前，我在十三朝古都西安参加了宇视的2025合作伙伴大会。我参加过很多次宇视的产品发布和合作伙伴大会，这一次可以说是收获最大和受触动最深的一次。对人工智能的认知也提升了很大一个台阶。

一、对人工智能的众多疑惑消散后的新认知

29号上午参观完众多宇视合作伙伴基于梧桐大模型研发的应用，以及主论坛的主题演讲后，我就有些心潮起伏的感觉。我在来之前最想看的就是这些细分的应用，甚至最希望看到一些场景极为特别的细分应用。这种期待在宇视的梧桐大模型2年前刚发布时就有了。这次的确在很多采用宇视平台的伙伴公司展台上看到了想看到的应用场景。

智慧电力

智慧零售

智慧化工

农田巡检机器狗

河流污染检测

一氧化碳等有害气体激光检测器

智慧校园

小区异常情况检测——案例：货物不能走客梯

安全生产

越是特别细分的应用场景，越是能够体现出梧桐大模型的优势。因为这类应用场景以过去的技术并非绝对不能实现，只是因其应用面太狭窄，专门为其开发软件在成本上很难平衡。在过去一年中，宇视已经与超过3000个合作伙伴，应用于超过5000多个不同场景。依托宇视的梧桐大模型平台，可以不需要专业编程人员，合作伙伴直接就可以将自己特定的应用场景素材输入平台，训练出自己细分领域的特殊模型。

这种产品设计是极为重要的，通过这种方式极大降低非标准化应用的成本，才有可能扩展相应领域的业务应用。而一些媒体总结经营状况不太好的AI企业原因时，把做了太多非标准化业务，导致成本过高，从而使得毛利率状况恶化作为最主要的原因。如果做人工智能的企业，自己不能利用人工智能降低非标准精力的成本，那么就失去了采用人工智能技术的意义和价值。不能仅把人工智能当作一个新潮的与过去所有产品都不同的全新概念，最基本的商业逻辑其实都是一样的。人工智能这个概念特别容易让人忘记最基本的商业逻辑。

过去媒体在谈中国人工智能优势时，大都意识到行业垂直应用是我们的优势领域，但这种优势到底该如何变现才是最重要的问题，尤其要避免在做这种垂直应用时，很容易同时伴随的非标准化带来成本剧增的大坑。对这个问题的解答，虽然可以有理论和技术上的各种设想或想象，但最终还是需要靠千千万万应用一线的客户才会给出最清晰的答案。

例如，电力线巡检的应用，需要特定地检测几类危险场景：工程车辆施工是否会影响电力线的塔架；电力线和塔架是否有倾斜；周围是否有山火等险情。而在小区发现一些异常情况，如有人违反规定将货物走客梯，需要保安及时发现并疏导等。

还有一些特定的、如大鵟及雪豹等珍稀野生动物保护应用，可能需要在野外安装可见光和红外相机，判断出特定要监测的珍稀动物出现并拍照。

国际爱护动物基金会感谢宇视，伤员大鵟[kuáng]，猛禽医院术后康复

珍稀动物雪豹

通过参加这次活动中获得的丰富信息，我对人工智能的本质终于可以整理出一个系统的全新理解，使我过去对人工智能存在的诸多疑虑有一个相对清晰的答案了：

大模型真正的本质不是“通用人工智能”，而是一个通用的、呈现出似乎有语义理解能力的人机接口。—— 这是我听到宇视总裁张鹏国提出的新理念“万物皆可Chat”时产生的灵感。
人工智能正以“非图灵标准”的方式越来越像人一样相互如此地不同。—— 这是我对宇视梧桐行业大模型发展到现在大量细化应用场景时产生的灵感。我从四十年前开始研究人工智能时，就对人工智能业界流行的图灵标准很难接受。不仅感觉它太模糊，而且人本身相互之间就不像，怎么可能有一个通用的测试来评价机器是否像人呢？我所说的“人工智能越来越像人”的准确含义，是人工智能在大模型的基础上，出现越来越细分的巨大差异，就如人一样相互之间千差万别。就像我们在中学里学习的都是统一和通用的知识，到大学就会出现专业差异，最终要到实际工作中，还是需要针对差异化的专业细分领域学习更专业的知识和技能。对于“通用人工智能AGI（Artificial General Intelligence）该如何理解？它是否有可能实现？”等问题，我们并无兴趣讨论。只是需要指出的是：人工智能的真正落地和实用，关键在于差别，而不在于通用。
真正能落地的人工智能应用越来越像机器，而不是像人。—— 人类创造一切机器都是为解决市场上的实际问题的，但在人工智能领域却特别容易掺杂进人们想象中的某种意义上“像人”的人工智能，甚至幻想出很多连人都做不到的事情。例如，人类有一个情侣的不可能三角：颜值、能力和性格不可能同时达到最优。但是，人们却总是幻想能开发出颜值、能力和成本同时达到最优的机器人；人不是万能的，却总是去幻想万能的机器人。

二、北航辛弃疾的最佳演讲

很少能在一个本来算程式化的企业活动中有这样的灵感大爆发。我现场听过宇视总裁张鹏国的很多次演讲，感觉这次演讲是我听到过的最出色的一次。临近午夜，张总与我在微信上热烈交流了当天的感受。

张总号称“北航辛弃疾”，对他来说讲清楚技术不难，写出好诗词也不难。但如何将一个突破性的技术新趋势用最简洁且吸引人的概念表达出来，需要特别的灵感，甚至特别的历史时间点。他说可能只有回到老家才会有灵感，现场演讲中他提到自己是从酒店走到会场的。我一查地图，走过来得将近一个小时，在老家的土地上走这一个小时应该会有很多感触，回到根才能理解到根。

风起于青萍之末，浪成于微澜之间。人工智能已经发展很多年，大模型火爆全球是从2022年底开始，为什么现在却说是“风起”？因为过去人工智能的发展，可能都只是真正的风起之前突发的一次次飞尘漫天、遮天蔽日的阵风，而今却是人工智能慢慢修成正果之后开始的、方向已经明确的信风。

窥一斑可见全豹，赏一花即晓春来，一叶落而知千秋。

张总在演讲中说，DeepSeek把他对诗词的自信全打掉了，这应该是人工智能成熟的一个侧面。人工智能与人们的直觉想象可能正好相反，很多被认为富有人类智慧的能力，却被证明人工智能实现起来却更容易。例如写报告、写新闻稿、法律咨询、金融精算、写诗、绘画、生成视频、下棋，甚至是科学研究发现新的蛋白质折叠结构......这些在过去被认为是高智商的工作，人工智能却是更早、更易实现的。而一些被认为是人类相对比较简单、文化水平不高的人都可以做的工作，例如做家务、货车司机等，人工智能实现起来却很难。这是下一代人工智能要解决的问题。

大模型本身就是从机器翻译中发展出来的，所以它最主要的能力就是语义理解和生成。机器翻译中的生成是按语义尽可能一对一地在不同语种间转换。而一旦将这个模型摘出来进行充分的发展，就会爆发出完全不同的能量。

首先，大模型生成的不再是严格按输入的信息内容一对一翻译的内容，而是可以将其看作命令或要求进行扩展式的生成。对此人们已经充分感受到了，它可以根据输入的一句话的要求生成相应的报告、图片或视频，也可以生成演讲的PPT等。

二是输入的内容也不限于人类的语言文本，也可以是图像、视频等多模态信息。更让人震撼的是，它还可以输入各种动物——鸟兽的语言，将其翻译成人类可理解的语言，也可以将人类的语言翻译成动物能直接理解的语言。可以听懂鸟语，号令百兽的神话故事即将变为现实。

回到本文开头就提出的核心观点，未来是否会出现奇点此处我们并不去讨论，但对人工智能的未来，以及什么才是真正的人工智能，已经可以建立起比较清晰的图景了：

像人一样具备一些通用的基础智能。
像人一样针对不同应用有千差万别的优化专业能力。
像人类创造的一切机器一样，以最优的性价比实现特定应用。在这一点上，最不应该追求“像人”。如果在这一点上和人一样，我们为什么要去创造人工智能，直接创造人不就得了？那不是最像吗？当一个机器拥有了一切像人的特性，也就具有了人类的一切缺点和毛病。人类创造机器本来就是为克服人类自身缺点和毛病的。