开源 AI 视频生成,本地部署超香

各位科技爱好者和内容创作者们,今天给大家挖到宝了!Lightricks 团队推出的 LTX Desktop 开源桌面端 AI 视频生成工具,直接打破了 AI 视频生成对高端云服务和企业级硬件的依赖,咱普通创作者也能轻松玩转高质量 AI 视频生成,这波真的太顶了!

打开网易新闻 查看精彩图片

先跟大家说说这款工具的核心定位,它是基于 LTX 模型打造的开源桌面应用,最牛的一点就是支持本地视频生成,当然对硬件有一定要求,要是硬件不达标也能切换到 API 模式,Windows 和 macOS 用户都能安排,就是 Linux 目前还没官方支持,稍显遗憾。目前工具还处于 Beta 测试阶段,前端架构还在优化中,大家用的时候可能会遇到一些小改动,这点提前跟大家说一声。

说到核心功能,LTX Desktop 直接把 AI 视频生成的玩法拉满,文生视频、图生视频、音频生视频全都不在话下,还有超实用的视频编辑重制(Retake)功能,搭配专属的视频编辑器界面,还能创建视频编辑项目、填充时间线间隙,不管是从零开始造视频,还是对现有视频进行二次创作,都能满足需求,创作者的脑洞再也不用被工具限制了!

打开网易新闻 查看精彩图片

很多朋友最关心的肯定是硬件要求和运行模式,这里给大家讲得明明白白:如果你的电脑是 Windows 系统,搭配了支持 CUDA 且显存≥32G 的 NVIDIA 显卡,就能开启本地生成模式,模型权重会直接下载到本地,全程不用依赖网络,创作超自由;但如果你的 Windows 电脑没有 CUDA 显卡、显存不足 32G,或者是 Apple Silicon 芯片的 macOS 电脑,就只能用API 模式,这时候需要准备好 LTX API 密钥,不过 API 模式下的视频分辨率和时长会受官方 API 限制,这点要注意。

系统要求方面也给大家梳理清楚了,Windows 本地生成需要 Win10/11 64 位系统,除了达标显卡,内存至少 16G(32G 更推荐),还要留足硬盘空间装模型权重和生成的视频;macOS 的 API 模式则需要 Apple Silicon 芯片、macOS13 及以上系统,再加上稳定的网络就够了,门槛不算高。

工具的文件存储位置也很清晰,Windows 用户的应用数据(设置、模型、日志)存在 % LOCALAPPDATA%\LTXDesktop\,macOS 用户则在~/Library/Application Support/LTXDesktop/,模型权重会放在 models 子文件夹里,就是这个文件夹会比较大,下载的时候可能需要点耐心。第一次打开工具时,会弹出模型许可条款的确认页面,内容是从 Hugging Face 获取的,所以得保证网络通畅。

打开网易新闻 查看精彩图片

想要生成视频,文本编码配置是必经步骤,这里有两个选择:一是用LTX API 密钥做云端文本编码,这个功能是完全免费的,还能提升推理速度、节省内存,强烈推荐大家用,密钥在 LTX 控制台就能免费生成;二是下载本地文本编码器,适合不想用 API 的朋友,能实现纯本地操作,不过只有支持本地生成的 Windows 电脑能用。

再说说大家关心的 API 密钥和隐私问题,LTX API 密钥的用途分两种,云端文本编码和提示词优化免费,而 API 模式的视频生成、Retake 功能是付费的,密钥会存在本地应用文件夹,大家一定要妥善保管。另外还有两个可选的 API 密钥,fal API 密钥能在 API 模式下实现 Z Image Turbo 文生图,Gemini API 密钥则能解锁 AI 提示词建议,大家可以根据需求自行配置,使用这些第三方 API 时,相关数据会发送到对应平台,注意隐私就好。

从技术架构来看,LTX Desktop 的设计相当硬核,分为三层架构,各司其职又配合默契:第一层是渲染层,用 TypeScript+React 做的 UI 界面,通过本地 8000 端口和后端通信,还能通过预加载桥和 Electron 交互;第二层是 Electron 层,基于 TypeScript 开发,负责应用的生命周期管理和系统集成,比如文件对话框、用 ffmpeg 做原生导出、管理 Python 后端进程,而且渲染层做了沙箱隔离,安全性拉满;第三层是后端,用 Python+FastAPI 搭建的本地服务器,统筹视频生成、模型下载和 GPU 调度,只有用 API 功能时才会调用外部接口,技术实力这块儿,Lightricks 果然没让人失望,毕竟是做出 Facetune、Videoleap 的团队,旗下的 LTXV-13B 模型还实现了生成速度比同类快 30 倍的突破。

对于想参与开发的技术大佬,LTX Desktop 也提供了完善的开发环境支持,需要准备 Node.js、uvPython 包管理器、Python3.12 + 和 Git,Windows 和 macOS 都有对应的一键搭建命令,运行、调试、类型检查、后端测试的命令也都很简洁,想做二次开发的朋友可以冲。

还有大家关心的隐私问题,LTX Desktop 只会收集最基础的匿名使用数据,比如应用版本、运行平台、随机的安装 ID,用来优化开发,不会收集个人信息和生成的视频内容,而且这个分析功能默认开启,大家可以在设置里手动关闭,隐私保护这块儿做得很到位。

最后说说授权和贡献,这款工具采用 Apache-2.0 开源协议,第三方相关说明和模型许可都能在对应文档里看到,模型权重需要单独下载,可能会有额外的许可条款。如果大家想参与项目贡献,可以参考项目的 CONTRIBUTING.md 文档,目前因为前端架构在重构,大型的 UI 相关贡献可能会被暂拒,这点大家留意一下。

目前 LTX Desktop 已经更新到 1.0.1 版本,作为一款开源的 AI 视频生成工具,它既实现了本地部署的自由,又兼顾了硬件不足时的 API 方案,不管是个人创作者还是小型团队,都能找到适合自己的玩法,而且背靠 Lightricks 的硬核技术,后续的更新和优化值得期待!感兴趣的朋友可以去 GitHub 的 Lightricks/LTX-Desktop 仓库看看,解锁 AI 视频创作的新方式~