投资人对人形机器人的实用性表示失望
在参观了世界机器人大会后,一些投资人对人形机器人的实用性表示失望。他们认为,尽管硬件性能有所提升,但人形机器人在工业和家用场景中未能展现足够的实用性,且各家公司在软件层面难以拉开差距。投资人更期待能自主执行多任务的机器人,而行业内模块化设计趋势显现,但标准化尚未形成,部分公司通过模块化尝试降低成本和提高产品适应性。
HuggingFace开源低成本AI机器人LeRobot
HuggingFace开源了一款名为LeRobot的低成本AI机器人方案,用户可以利用约200美元的组件自行组装机械臂,并在个人电脑上训练和控制其神经网络。LeRobot基于Koch v1.1机器人套件,使用6电机机械臂和摄像头作为视觉传感器,并提供了详细的组装、配置和训练指南。项目开源了所有硬件和软件,未来计划推出更具性价比的Moss v1版本。
MIT科学家发现量子纠缠在高温下会突然消亡
MIT与加州大学伯克利分校的计算机科学家在开发量子算法时意外发现,量子纠缠在某一特定温度以上会完全消失,这一现象被称为「突然消亡」。研究通过数学证明表明,在热平衡状态下的高温量子系统中,纠缠完全消失,不受系统规模影响,与原子间相互作用相关。这一发现挑战了量子算法的适用性,表明在某些高温情况下,量子特性可能完全丧失。
英伟达推出NIM Agent Blueprints服务
NVIDIA推出了NIM Agent Blueprints服务,为企业提供可定制的生成式AI工作流工具,首批用例包括客户服务、药物研发和PDF数据提取。这些Blueprints与NVIDIA NeMo框架和NIM微服务集成,允许企业使用自身数据构建AI应用,并通过数据驱动不断优化。全球合作伙伴如埃森哲、思科、戴尔等支持该平台,加速企业生成式AI的部署和应用。
Midjourney宣布进入硬件领域
Midjourney公司宣布正式进入硬件领域,并已组建了硬件团队。该团队由苹果Vision Pro前硬件工程经理艾哈迈德·阿巴斯领导,可能专注于为AR和VR创建计算生成的世界,基于其文本转换为3D模型的技术。Midjourney的硬件产品可能会有全新的形态,与现有硬件产品不同,探索新形态因素的机会。
新一代轻量级ControlNeXt技术提升视频生成控制
由贾佳亚团队开发的ControlNeXt技术,在生成速度、精准控制和用户友好性上实现了显著优化。该技术仅使用不到ControlNet 10%的参数,便能高效地控制图像和视频生成。通过轻量级卷积模块和交叉归一化技术,ControlNeXt减少了计算成本和内存占用,实现了更快的训练收敛和推理速度,挑战了Scaling Law,展示了少算力、大模型的潜能。
谷歌Imagen 3图像生成技术超越竞争对手
谷歌的Imagen 3使用潜空间扩散模型,大幅提升了图像生成的质量,尤其在处理高分辨率图像时能够保持细节和一致性。在文本提示处理上,Imagen 3展现出卓越的能力,能够捕捉细微差别,生成高度一致的图像。在多个评测中,Imagen 3的表现优于DALL・E-3和SD3,特别是在提示-图像对齐和用户偏好方面。
谷歌AI实时生成游戏技术瞄准万亿市场
谷歌推出的GameNGen引擎,利用AI技术实时生成游戏画面,逼真度足以欺骗60%的玩家。该技术无需编程,能够自动生成游戏环境和交互,有望颠覆2000亿美元的游戏产业,大幅降低开发成本。GameNGen的潜力不仅限于游戏,还可能对虚拟现实和自动驾驶产生深远影响,尽管在图形密集型游戏和通用引擎开发上仍面临挑战。
OpenAI新一轮融资估值超1000亿美元
OpenAI正在进行新一轮的融资,估值超过1000亿美元,由Thrive Capital领投,微软也参与其中。这笔资金将用于支持AI算力和运营,特别是为了开发新的大模型“草莓”和“猎户座”。尽管OpenAI年收入达到34亿美元,但由于研发和运营成本高昂,公司财务状况仍然面临压力,预计到2024年底可能亏损50亿美元。
英伟达Blackwell芯片在AI性能测试中领先
英伟达的Blackwell芯片在MLPerf基准测试中表现出色,相较于H100芯片,在Llama 2 70B模型上实现了4倍的性能提升,对GPT-MoE模型性能提升更是达到了惊人的30倍。这一进步得益于Blackwell采用的FP4精度和8TB/s的高内存带宽,显著提升了推理效率。同时,NVLink技术的支持使得Blackwell能够实现大规模的扩展,为AI领域的发展提供了强有力的硬件支持。
*内容来源于互联网信息整理,仅供参考
热门跟贴