1行代码实现模型推理的「模型即服务」产品|ai|推理|模型即服务|模型推理|算法

云栖大会阿里发布的模型即服务的“魔搭社区”主要解决人工智能解决方案或产品场景里面的模型部署，训练，升级等全生命周期的问题和服务。

新见闻MaaS用户是谁，解决什么场景问题

AI爱好者，研究者，开发者，使用者：通俗点就是日常工作需要天天和算法模型打交道的人们
场景问题：在实际问题中的模型使用方式及过程低效的问题，其实还是实现MLOPS(机器学习统一开发和统一部署)

打开网易新闻查看精彩图片

再对MLOPS深入一些介绍就是完整的算法模型的全生命周期，由以下5个阶段
基于业务目标的模型框架搭建
获取及准备需要处理的数据（数据解决方案）
构建模型工程及开发模型
部署发布算法模型
监控、迭代、优化模型

模型即服务的案例范例

场景1：0基础小白用户（潜在客户），把自己一张照片上传到modelscope，云端推理服务完成运算，返回结果给用户，就能快速感知了解到当前模型能解决的问题和实际应用效果。

我手动测试了一个图像描述的模型，一张医院大楼图片被描述成了“在北京”还真是不尽如人意。
然后又试了一个中文搜图的功能，第一次搜秃头的鹦鹉直接提示不合规，可能超出他们词库范围了，然后用逛公园的猩猩花费了40秒，返回了85张猩猩的图片，整体上有一半以上符合我的预期

场景2：模型开发者（卖家），把自己做好的模型上传到modelscope就上线对外发布。然后其他开发者通过安装modlescope的library基础环境，然后运行的时候直接指定对应模型在modelscope上的id就能快速运行相应的模型。

号称“2行代码，使用所有模型”

模型微调

总结实现流程路径就是，针对一个已经有的标准模型，upload自己的初始数据集，相当于进行微调训练得到新的“微调模型”然后新的输入验证新的输出。
举的例子是一个“文本生成模型”由联想补充解释模型，通过新的古诗词数据集微调之后变成了古诗生成模型。

也是强化模型进行自迭代的一个思路，在暖通节能里面随着性能降低，或者气候交替就需要这个思路去迭代整体的制冷系统模型

所谓「大」模型

数据对象：十万亿级别参数
训练方式方法：高效训练框架+加速训练+水平扩展多种分布式范式
训练过程：512GPU* 10天

SOTA预训练模型

State of the arts 的缩写，指的是在某一个领域做的Performance最好的model，一般就是指在一些benchmark的数据集上跑分非常高的那些模型。

扩展：
SOTA model：并不是特指某个具体的模型，而是指在该项研究任务中，目前最好/最先进的模型。
SOTA result：指的是在该项研究任务中，目前最好的模型的结果/性能/表现。

云端模型生态飞轮

这个理念确实很棒，第一步推动社区生态的是达摩院，把自己成熟稳定的模型都公开放出来提供给所有AI爱好者参与进来，使用和体验MaaS，然后可以基于社区的模型训练自己的数据集后进行新的微调模型生成，然后期许与新模型的回流上传到模型社区，进一步增大算法模型领域的影响力，在通过免费的算力，一些体验的阿里云其他的云生态服务产品进行简易化配置指导（目测有很多一键增加gpu算力，或者扩充数据集上限等等云服务产品可以被便携购买）然后就“情不自禁”的购买了阿里云生态的服务，再反哺社区的运营投入，社区再进一步强大，吸收更多优质模型开发者。如此循环，影响力不断扩大。成为ai一哥。

一些思考：很多商业机密的“SOTA model”的上传到社区基本不可能，例如一些摄像头厂商做的很完善的包括自动抄表的视觉模型，这些都是给硬件加持价值的模型，上传肯定不行，能公开就说明肯定可以本地免费使用的。只能是上传一些商业价值有限的，但是对整体人类文明推动或者触发交叉创新的模型公布出来可以有意想不到的效果。

商业变现思考