大家好,我是冷逸。
今年,在Agent这条路上,MiniMax一直在疯狂死磕。
3月,他们的MaxClaw在全球龙虾饲养热潮中大杀四方;4月,他们率先推出MaxHermes;5月,他们又推出了视频AgentMiniMax Hub;上个周,他们更是把MiniMax Agent升级成了(MiniMax as a Jarvis)。
真的,如果要论对Agent研发的疯狂程度,MiniMax绝对是国内模型厂商里最执着的那一个。
今天,我想跟大家重点聊一聊MiniMax Hub,并带大家沉浸式体验一下这款Agent。
关于MiniMax Hub
先说是什么。
龙虾或者其他画布式创作产品,相信大家都已经体验过。
MiniMax Hub是什么?简单来说,你可以理解为是AI视频版的Claude Cowork或Codex。
它以Desktop应用在本地运行,调用素材和输出产物全在本地;内置了Seedance 2.0、hailuo 2.3、Kling、Image 2、banana 2、Midjourney、MiniMax Speech等图音视频模型,无需手动接API;还支持Skills,可以自建和接第三方。
如果你用过龙虾的话,可以把Hub理解是“装上了身体(操作界面)和手(一站式多模特模型)的龙虾”——龙虾能做的它都能做,而且有完整的多模态创作能力。
给大家看一个简单的用例,你就明白了。
比如,我用Image2设计了一款AI蓝牙耳机「Aura」,我想让Hub帮忙做一支产品宣传视频。我只需要把创作需求和产品图发给它就行。
接下来,Hub会陆续进行澄清需求、调用skill、制定待办事项以及多轮思考与执行。
左边是画布视图,右边是Chat区
这个工作范式,你一看就知道,是Desktop Agent那套。
比如,这是我这个case的待办事项,一共有6步。
它跟Claude Code、Codex这些Agent一样,也会在你的本地建一个工作文件夹(默认路径C:\Users\Administrator),这里面有skills,有项目,有model-prompts,以及各种AGENTS.md。
Hub有很多个子Agent,比如图片编辑、图片生成、视频生成、音频生成、音乐生成、视频剪辑等,会根据任务进行灵活调用。
最终,给我交付的是一整套产物。
有产品简报。
有脚本。
以及最终的成片。
如果需要修改,左边就是画布视图,可以随时修改。
简单来说,MiniMax Hub就是你的AI视频员工,你给任务,它列计划并交付产物。配合skill,还能把直接视频塞进你的剪辑软件。
一手体验
接下来,我们沉浸式体验一下这个产品,并给大家分享一些我总结的高级玩法。
0)前置准备
首先要想体验,我们需要前往海螺国内版或国际版,下载并安装MiniMax Hub。
入口:hub.minimaxi.com
安装后,登录海螺AI账户。Hub和网页版海螺共用一个账户,积分规则也是一样的。
新用户,有500的免费积分,大概可以生成30s的Seedance 2.0视频和100张的Image 2图片。
登录后,先简单认识一下产品界面。
和大多数Desktop Agent一样,左边是功能导航,左下角是设置,中间是Chat窗口,可以调用skills,也可以上传素材。
Hub上传素材,支持直接拖拽,也支持点选文件。
它支持的模型有很多,图片有Banana、Image、Seedream、Midjourney、Kling等;视频有Seedance、Hailuo、Veo、可灵、Wan;音频有MiniMax Speech、Music。
主流的图音视频模型,几乎都在。
1)与Agent对话创作
Agent是Hub产品的大脑,它有主Agent,也有子Agent。可以读参考文件、读网页/社媒链接以及多个会话并行等等,只要电脑能做的事情,它都能做。
所以,在Hub上进行创作,更多是Vibe创作,跟其他AIGC工具的体验是完全不一样的。
比如,昨天MiniMax发的新货:Mavis。
我们直接把文章链接给它,让Hub帮我阅读、总结,并调用Image 2模型生成10页PPT。
任务:仔细阅读这篇文章https://mp.weixin.qq.com/s/TIL7o92f71DsPPLWT4_37A,用G Image 2模型帮我制作10页PPT。
这最终的PPT质量是真高。
让AI写了一段分镜脚本,我连脚本表格都懒得整理,直接截图,丢给Hub,跟它说:
根据这张图的脚本设计,帮我制作一支30s的恶搞视频,主题是“华强买Token”。
最终出来的视频,还不错。
在社媒上刷到一个超有意思的爆款创意视频,一栋写字楼“大变招商广告”。
我想参照着做一个这样的视频,直接把社媒链接甩给Hub,让它帮我们分析,并仿制出一个视频。
最终出来的视频效果,真的不错。
好家伙,它还自动把《星际穿越》的BGM都给安排上了。
这就是用Agent创作的优点,你不用管什么素材格式、任务描述、提示词要求、模型选择这些复杂的东西,你可以怎么方便怎么来。
反正它是一个Desktop Agent,只要电脑能干的活,它就能干。
2)用Skills进行创作
Skills这块,Hub的支持是非常宽松的。
它支持自己创建skill,也可以把创作过程保存为skill,以及安装第三方的开源skill。
比如,Hub的Skill广场,有个叫「剪映导出」的skill,经常剪视频的朋友,强烈推荐安装一下。
它可以把Hub生成的素材、成片以及剪辑工程文件,一键导入到剪映草稿。之后,打开剪映就可以直接预览编辑了,非常好使。
又比如,这个「超现实广告」skill,特别擅长制作各种脑洞大开的广告视频。
装上这个skill后,不再需要我去描述画面提示词。我只用给产品图,让它调用这个skill制作视频就行。
来看下最终的产物,这创意确实很强,我自己手搓很难达到这样的效果。
再给大家看一个卫衣的广告,Hub+skill会自己理解产品、剧情,生成脑洞满满的视频产物。
如果Skill广场没有你想要的,你也可以直接问它,比如我让Hub帮我搜一下关于Midjourney提示词的skill。
很快就找到了几个,还不错,直接就装上了。
3)用画布手工创作
除了用Agent+Skill进行自动创作外,Hub也支持在画布进行手动创作。可以自由添加节点,支持台词、脚本、图片、音频和视频等产物生成,并且都可以自由组合。
比如,我们来创建一个播客视频,两个节点:生图→生视频,主题是橘猫和哈士奇就token涨价争论不休。
很快,就得到了一段搞笑的视频。
整个体验下来,MiniMax Hub这款多模态Desktop Agent(桌面Agent)确实很有意思。
作为Desktop Agent,它的能力场景比Web/APP产品要更广;同时,又能像Claude Code一样挂载各种skill,大幅降低AI视频的创作门槛。
通过MiniMax Hub,人人都能Vibe出高质量作品。
另外,他们家支持的模型也很多,生图有香蕉、Image 2,生视频有Seedance 2.0、Hailuo 2.3、Kling V3等,生音频又有自家的Speech 2.8……这些都是AIGC领域的顶尖模型。
尤其是Seedance 2.0,在Hub上使用,还可以享受3.5折优惠!
感兴趣的朋友,可以来体验一下。
传送门:https://hub.minimaxi.com
热门跟贴