AI已经开始融入我们生活的各个角落,比如智能家居、自动驾驶、语音助手等。

虽然目前我们对AI的认识还停留在朦胧和初步了解的阶段,但掌握一些基础知识总不会有坏处。接下来,我们用最通俗的语言来认识AI究竟是什么:

AI:人工智能

(Artificial Intelligence)

简单来说:人工智能类似于人类或超越人类,具备“脑”(软件)和“身”(硬件)的基本构成。它能够模仿人类的思考、判断,并做出决策,具备视觉、听觉、语言表达、感知以及行动能力。其实现依靠摄像头、雷达、麦克风、扬声器、机械组件等硬件与算法、模型等软件相结合。

AIGC:生成式人工智能

(Artificial Intelligence Generated Content)

简单来说:与传统固定计算方式不同(比如计算器1+1必定等于2,因其输入输出规则已被事先设定),AIGC通过海量数据和不断训练的模型,用一种类似人类思考的方式学习知识、理解输入与生成输出,从而能独立“思考”并给出多样化的答案。

实现AIGC的三大要素是

  • 数据:大量且多样的内容
  • 算力:强大的硬件支持
  • 算法:不断训练和优化的模型

AIGC主流场景应用

  • 文本生成:如 ChatGPT、Deepseek、豆包、腾讯元宝
  • 图像生成:如 Midjourney
  • 音频生成:如讯飞智作、海绵音乐、Suno
  • 视频生成:如即梦、可灵、Runway、Sora
  • 数字人:例如虚拟形象、虚拟主播(现在还不够成熟)
  • 口型同步:如 Descript、HeyGen、即梦、可灵
  • 代码生成:如 GitHub Copilot

prompt :提示词、指令

简单来说:就是我们常用的提示词或指令,就是让这些通用类AI工具工作的命令和要求,最简单的方法就是直接问:“什么是人工智能?”(对于目标性明确的问题,直接提问即可。)但如果能事先将自己的问题描述得更具体,得到的答案也会更加精准。

对于较复杂的文本生成指令,可以按照以下结构描述

  1. 定位角色:例如“你是法律专家,精通合同法等领域”
  2. 定位主题:例如“我需要关于知识产权保护的内容”
  3. 定位要求:例如“输出形式为报告,参考某某文献,框架包含……,字数要求……”

如果结果不完全满足要求,还可以提出改进建议,比如“某部分写得很好,无需改动;而另一部分需要增加案例说明,调整方向为……”。
目前,大多数系统都具备上下文记忆功能,随着训练和细分不断完善,日常提问即可得到越来越贴近需求的答案,只是可能需要反复确认细节。

对于“文生图或文生视频”的指令,即由文本生成图像的操作,也需要更细致的描述,如:

  • 画面的构图或运镜
  • 人物的具体特征
  • 场景的详细描述
  • 动作的描述和行动轨迹

  • 可以先通过文本生成AI构思提示词,再用图像生成工具实现最终效果。

Agent:智能体

简单来说智能体是针对特定应用场景细分的AI工具。例如,当我们遇到更专业的问题(如法律问题)时,通用型AI工具可能无法满足需求,这时可以借助专门构建了法律数据体系、应用模型和工作流的法律智能体,其回答会更加精准。

智能体平台:扣子、Hugging Face

Workflow:工作流

简单来说:工作流是将涉及多种模型和复杂指令操作的任务,通过预先设计好的流程进行整合,使得下一次操作时无需从头逐步设置,就能直接获得预期结果。

工作流平台:RunningHUB

AI可以帮我们做什么?

对于个人:

  • 当你有一个想法或问题需要解决
  • 当你需要在短时间内输出或优化一个工作方案
  • 当你想快速了解一本书的主要内容

通过AI生成应用,你可以轻松实现写作、方案策划、PPT排版、内容优化等任务。虽然AI能提供多种方案和答案,但最终的选择权和使用权仍然在我们自己手中。

对于企业:

各行业与AI的结合已成为发展必然趋势。无论是医疗、制造,还是其他领域,AI都将逐步渗透到各个环节,推动业务升级和效率提升。(后续我会根据行业细分场景来看AI到底如何应用落地)

结语

AI的浪潮已经到来,就像当年互联网席卷世界一样。如果你还不了解或不懂得如何利用它,就可能会错过这场革命性的机遇。掌握基本知识、勇于尝试应用,是迎接未来的关键。

AI没有想象的那么复杂,

因为TA就像比互联网更具象化