奔跑财经3月18日消息,全球最大稳定币发行商Tether,其AI部门近日悄然发布了一项可能颠覆行业格局的“黑科技”——QVAC Fabric。
该框架能将百亿参数级别的大型语言模型(如3.8B、13B)直接部署到旗舰手机和消费级显卡上运行,让此前只能在云端运行的“庞然大物”真正走进个人设备。
手机GPU推理快11倍,内存占用暴降90%
根据官方披露,QVAC Fabric集成了自研的BitNet LoRA微调与推理框架,可跨平台支持AMD、Intel显卡、苹果Metal生态及各类移动GPU。实测数据显示,在旗舰设备上,基于GPU的推理速度比传统CPU方案快2到11倍,同时内存占用相比全精度模型暴降90%。
这意味着,用户可以在不更换手机、不增加散热负担的前提下,在本地运行更复杂的AI模型,或同时处理更多任务,彻底突破手机等移动设备在散热和内存上的天然瓶颈。
目前,Tether团队已成功在iPhone 16上完成对130亿参数模型的微调,并在Pixel 9、Galaxy S25等旗舰机型上实现了38亿参数模型的本地运行与微调。这标志着“端侧AI”正式从营销噱头或简单演示,迈入了可处理复杂任务、实现真正个性化与领域适应的实用阶段。
Tether转向基建,代码已开源
此举是Tether从单一稳定币发行商向更广泛数字基础设施运营商转型的关键一步。该公司已向能源、比特币挖矿、媒体等领域投入数十亿美元,如今将“边缘AI工具链”纳入版图。
值得注意的是,相关QVAC与BitNet LoRA代码已在GitHub上开源。一旦QVAC成为开发者和中小实验室将大模型部署到消费硬件的主流选择,Tether将在受银行监管影响较小的技术栈中,建立起强大的生态影响力和技术话语权。
短期内,这更多是叙事而非盈利层面的影响。但宏观趋势已清晰:随着更多AI工作负载向边缘设备迁移,基础设施的主导权正从集中化的超大规模云厂商(如AWS、谷歌云),向控制关键工具链和硬件抽象层的玩家转移。
Tether正发出明确信号:它希望成为这样的关键玩家,并利用其雄厚资金实力,打造降低对单一云服务商或司法管辖区依赖的基础设施。
热门跟贴