一家台湾公司用十年前的芯片工艺,做出了让英伟达和AMD都侧目的AI加速器。Skymizer发布的HTX301显卡,能在单张PCIe卡上运行7000亿参数的大语言模型,功耗却只有240瓦——不到主流AI加速卡的一半。
这张卡的核心配置看起来像是穿越来的:28纳米制程芯片,搭配LPDDR4和LPDDR5内存,完全没有HBM高带宽显存或GDDR方案。Skymizer把这种"复古"组合塞进了一张标准的PCIe加速卡,六颗HTX301芯片协同工作,总内存容量达到384GB。
打开网易新闻 查看精彩图片
性能数据同样反直觉。官方声称HTX301能以每秒30个token的速度生成文本,算力仅0.5 TOPS,内存带宽100GB/s。这个数字放在今天的AI芯片市场几乎不值一提,但Skymizer靠专门针对大语言模型优化的HyperThought平台和下一代LPU IP,把开源的llama.cpp性能甩开了9%到17.8%。
关键卖点在于本地部署。Skymizer瞄准的是那些对云端大模型有顾虑的企业——数据隐私风险、不可预测的计算成本、以及被迫绑定 hyperscale GPU 集群的被动局面。HTX301支持agentic AI应用,覆盖编程、自动化和垂直领域工作流,宣称无需依赖大规模GPU基础设施就能完成任务。
这家公司想证明一件事:跑超大模型不一定需要最先进的制程和最贵的显存。当行业集体追逐3纳米和HBM3E时,Skymizer用压缩算法和架构优化,让老旧技术重新获得竞争力。至于市场买不买账,还得看实际落地表现。
热门跟贴