极客公园

极客公园

关注
7.9万粉丝
0关注
12.6万被推荐

优质互联网领域创作者

4枚勋章

3次获得编辑精选

让最棒的创新成为头条
IP属地:北京
更多信息

  • 5 月 7 日,宇树科技宣布,旗下人形机器人官方共享应用平台 UniStore 正式全面开放。该平台定位为全球首个人形机器人任务动作应用商店,将通过标准化接口与生态建设,降低机器人应用的开发与使用门槛,推动人形机器人从功能机时代向智能机时代跨越。
    UniStore 平台的上线,为开发者和用户搭建了类似智能手机应用商店的交互渠道。用户可以像下载手机 App 一样,轻松获取并安装各类机器人任务动作应用,从而解锁人形机器人在工业、服务业等多元场景中的潜力。这一举措意味着具身智能领域的应用生态正式进入规模化发展阶段,通过软硬件解耦,让机器人能够快速适配不同行业需求。(来源:CNMO 科技消息)
  • 美团推「养虾社区」;OpenAI 推出三款实时语音模型;宇树机器人在韩国佛门「受戒」,法名「迦悲」

    2小时前
    图片
  • 美团推「养虾社区」;OpenAI 推出三款实时语音模型;宇树机器人在韩国佛门「受戒」,法名「迦悲」| 极客早知道

    2小时前
    图片
  • Genesis AI 发布新模型:机器人开始挑战西红柿炒鸡蛋

    15小时前
    图片
  • # 极客有话说# 2026 年,OpenClaw 爆火后热度迅速下降,而各大厂却悄然押注 “AI 员工” 赛道。4 月 8 日,GenSpark 4.0 发布,其愿景为 “让 AI 员工无处不在”,在一众产品中脱颖而出,引发关注。
    GenSpark 通过三次关键转型,精准把握 AI 发展变化。与其他大厂产品相比,GenSpark 4.0 在企业级运行环境、工具体系、交互方式上更具优势。实测中,它能一站式完成资料收集、翻译、研究到初稿生成等工作。其从用户工作流角度出发,提供一站式 Agent 服务,或引领 “AI 员工” 发展方向。 比 OpenClaw 更火的 「Agent 员工」赛道,杀出一个新王者|AI 上新
  • 5 月 7 日消息,「小米技术」公众号今天下午宣布,小米 AI 实验室新一代 Kaldi 团队全新推出 OmniVoice,不仅在中英文场景达到顶尖性能,更在多语言任务中展现出超越商用系统的实力,是业内首个覆盖数百语种的语音克隆 TTS 模型。 OmniVoice 多语言语音克隆 TTS#
    官方表示,该模型在低资源小语种上具备极强的泛化能力,你想得到的所有语种几乎都可以用 OmniVoice 来合成。OmniVoice「最亮眼的突破」是其极简的模型架构。它仅用一个双向 Transformer 网络,就能直接实现文本到语音的转化,省去了多余的结构和环节:没有文本的单独建模,没有复杂的混合结构,也没有多层级的 token 预测,是目前最简单的非自回归 TTS 模型。 OmniVoice 的语音合成质量优于目前同类主流模型,同时,训练和推理速度极具优势,一天完成 10 万小时训练,用 PyTorch 推理就可以达到 40 倍实时,轻松适配各类应用场景。 在这种实力的背后,是两项「关键设计」:一是通过全码本随机掩蔽策略,显著提升模型的训练效率,进而全面提升模型能力;二是引入大语言模型作为模型的预训练参数,首次在非自回归 TTS 模型中有效利用大语言模型,让语音合成的可懂度大幅提升,解决「读不准」的问题。 IT 之家从官方介绍获悉,在多语言测试中,即便仅基于开源数据训练,在 24 语种的测试中,其语音相似度和可懂度均超越多款商用系统;在 102 种语种的测试中,它的语音可懂度逼近甚至优于真实语音;即便对于训练数据不足 10 小时的小语种,OmniVoice 也能实现高质量的语音合成,大大降低了低资源语种的语音合成门槛。 该模型还具备多项实用功能: 自定义音色设计:无需参考音频,只需描述音色属性(如性别、年龄、音调、方言、口音等),就能生成符合预期的音色,还支持耳语等特殊风格。 带噪参考音频适配:针对实际使用中参考音频音质不佳的问题,OmniVoice 能自动过滤噪声,提取清晰的音色特征,即便在嘈杂环境下录制的音频,也能克隆出高质量语音。 丰富语气表达:支持插入笑声、叹气等语气符号,让合成语音更有表现力,更贴近真人交流。 发音精准纠正:针对中英文多音字、专有名词易读错的问题,用户可通过简单设置,纠正发音错误,提升语音合成的可靠性。(来源:IT 之家)
  • 消除「AI 学习门槛」,这个 Agent 想让普通人「无脑上手」

    17小时前
    图片
  • 550 亿美元!马斯克的「芯片工厂」开始成为现实

    17小时前
    1跟贴
    图片
  • 5 月 6 日消息,今天下午,星空卫视通过官微发布《关于星空卫视暂停卫星传输服务的公告》。
    公告称,星空卫视因运营困难,卫星公司通知 5 月 8 日将暂停卫星传输服务,对此深表歉意。星空卫视的品牌价值、内容制作能力与频道资源依然宝贵,正在积极寻求战略投资与业务重组的机会,并欢迎有意向的合作伙伴与之接洽,共同探讨包括频道资产收购、内容平台合作、品牌转型运营等在内的多种可能。 公告最后提到:「我们期待以新的模式延续星空卫视的初心与使命。」 查询公开资料获悉,星空卫视(STAR Xing Kong)是星空华文传媒所持有的电视频道,原为美国新闻集团(News Corporation)旗下星空传媒专为中国大陆而开设的以综艺娱乐为主的 24 小时普通话电视频道,2002 年 3 月 28 日正式开播。 (来源:CnBeta)
  • 5 月 6 日消息,至少 30 年来,苹果每赚一美元,投入研发的资金首次超过 10 美分,这也是这家 iPhone 制造商为人工智能宏大愿景砸下重金的最有力信号之一。
    苹果第一季度研发支出占营收的比例达到 10.3%,高于上一财季的 7.6% 和去年同期的 9%。尽管当期营收同比大涨 17%,创下 2021 年以来单季最快增速,但研发开支增速达到营收增速的两倍,同比增幅近 34%。 苹果首席执行官蒂姆・库克执掌公司 15 年后即将卸任,如今终于在人工智能领域投入了投资者自 2022 年末生成式 AI 热潮开启以来一直期待的资源力度。深水资产管理公司执行合伙人吉恩・芒斯特表示,苹果此番加码研发,正逐步拉近与科技巨头云厂商的差距。他指出,谷歌、微软、Meta 和亚马逊本财季研发支出平均同比增幅达 29%。 芒斯特称:「在人工智能研发投入上,苹果正在追赶其他科技巨头。这一迹象表明,苹果对推出全新 AI 产品已产生紧迫感。」 上周苹果公布的财报业绩超出分析师预期,同时上调营收展望。财报电话会议上,苹果重点提及两大看点:iPhone 与 Mac 需求激增,以及人工智能基础设施需求空前旺盛引发的全球存储芯片紧缺。 研发开支的大幅增长也受到了库克的关注。今年 9 月,他将把公司最高管理权移交至长期负责硬件业务的高管约翰・特纳斯。库克在财报电话会议上表示:「我们显然在加大投资力度。」他指出,研发投入增速远超公司整体业务增速,苹果正持续布局各类产品与服务研发。 (来源:IT 之家)
    上市公司交流圈
  • 5 月 6 日消息,据晚点 LatePost 消息,Kimi(月之暗面)即将完成新一轮 20 亿美元((现汇率约合 136.8 亿元人民币))融资,投后估值突破 200 亿美元((现汇率约合 1367.98 亿元人民币))。本轮融资由美团龙珠领投,中国移动、CPE(中信产业基金)等参投,其中仅龙珠就出手超 2 亿美元。
    Kimi 于 1 月和 2 月,密集完成 3 轮融资,分别融资 5 亿美元、 7 亿美元和 7 亿美元。算上最新这笔融资,不到半年 Kimi 已融资超 39 亿美元,最新估值相比去年 11 月的约 43 亿美元翻了 4 倍有余。至此 Kimi 累计融资额已超 376 亿人民币,成为大模型创业公司中累计融资最多的公司。 据此前报道,4 月 20 日,月之暗面发布并开源了其最新模型 Kimi K2.6,该模型在代码编写、长程任务执行及 Agent 集群能力方面实现了全面升级。 据介绍,Kimi K2.6 在博士级难度的完整版「终极人类考试」(Humanity's Last Exam)、评估真实软件工程能力的 SWE-Bench Pro 以及 Agent 深度检索基准 DeepSearchQA 等测试中,均取得了行业领先的成绩,表现持平或优于 GPT-5.4、Claude Opus 4.6 和 Gemini 3.1 Pro 等闭源模型。(来源:晚点 LatePost)
  • 传月之暗面新融 20 亿美元,估值超 200 亿美元;豆包曝光首个全模态理解模型;开播 24 年后, 星空卫视停播|极客早知道

    1天前
    图片
  • 比 OpenClaw 更火的 「Agent 员工」赛道,杀出一个新王者|AI 上新

    1天前
    14跟贴
    图片
  • # 极客有话说# 美西时间 4 月 28 日,魔法原子在硅谷举办全球首届具身智能创新大会 GEIS,推出新一代人形机器人 MagicBot X1 和灵巧手 MagicHand H01,首次展示其世界模型 Magic - Mix 及数据闭环能力,并披露长期营收目标。
    魔法原子发布的 Magic - Mix 由两个核心引擎构成,旨在解决机器人在复杂环境中的理解与决策问题,配合构建数据飞轮及全场景落地推动数据循环。此外,其选择在硅谷办会,尝试连接中国技术与海外资源,以开放协作扩大产业半径,彰显了中国智造在具身智能领域成为全球重要力量的野心。 魔法原子进军硅谷背后:世界模型野望与生态卡位
  • # 极客有话说# 这个春天 AI 视频迈向新阶段,行业话语权向专业影视公司转移。3 月 30 日,爱奇艺发布专业级影视制作平台纳逗 Pro,将领先基座模型与影视制作经验结合,瞄准电视剧、院线级内容创作全流程。
    通过深度测试发现,纳逗 Pro 能打破专业内容生产重资产壁垒,精准实现影视级画面生成;解决普通 AI 视频靠运气出片问题,借助素材泛搜提供专业参考;推出针对编剧、美术等环节智能体,解决专业内容生成壁垒;实现全产业链协作,还将打通创作分发闭环。其开启了 AI 影视创作专业级竞争下半场。 实测纳逗 Pro:能做专业影视级内容的智能平台长啥样
  • # 极客有话说# 桌面级 CNC 公司「造物时代」已完成 A 轮数亿元融资。其创始人张邱溪从自身刚需出发,将工业级数控机床浓缩至桌面,以创新产品快速上位,有望将桌面级 CNC 推向大众。
    张邱溪认为桌面 CNC 已到关键跨越节点。造物时代沿 3D 打印路径构建 “硬件 + 软件 + 内容生态” 闭环:对硬件进行消费级重构,用 AI 降低软件使用门槛,搭建内容生态。未来,造物时代希望推动产品价格下探,让 CNC 走进大众家庭,成为家庭工坊的基础设施。 对话造物时代:刚拿下数亿融资,桌面 CNC 的拐点到了
  • 5 月 6 日消息,据《金融时报》刚刚报道,国家集成电路产业投资基金(简称「国家大基金」)正在与 DeepSeek 洽谈主导其首轮融资事宜,其最终估值有望定在 450 亿美元(IT 之家注:现汇率约合 3077.95 亿元人民币)左右。
    就在数周前的谈判早期阶段,外界对 DeepSeek 的估值还处于 200 亿美元左右,而现在直接翻了一番。《金融时报》认为,尽管该公司目前仍以模型研发为主、商业化力度有限,但投资者仍看好其发展潜力。 消息人士透露,参与此次融资谈判的其他潜在投资者中,还有中国科技巨头腾讯。不过,本轮融资的最终参投方阵容尚未尘埃落定。 另一位潜在人选是 DeepSeek 创始人梁文锋,知情人士透露他也将在本轮中以个人名义出资一部分。公开资料显示,梁文锋实控 DeepSeek 约 89.5% 股份,长期以来占据绝对主导地位。 国家大基金 2024 年从财政部、地方政府及国有银行等处共募集到约 470 亿美元资金,重点投资半导体设备和材料。目前大基金注资的对象均为国内芯片行业的核心选手,包括中芯国际、长江存储等关键制造企业。一旦本轮融资落地,这将是它首次公开注资本土大语言模型厂商。(来源:IT 之家)
  • 5 月 6 日消息,据外媒 Carscoops 报道,比亚迪援引英国汽车制造商和贸易商协会数据称,截至 4 月,比亚迪在英国已售出 12754 辆纯电动汽车,市场份额超过 7%。凭借这一成绩,比亚迪已成为英国最大电动汽车品牌,排名高于宝马、特斯拉、大众等竞争对手。
    比亚迪还表示,公司已经成为英国私人买家中最畅销的电动汽车品牌。值得一提的是,比亚迪车型并不能享受英国政府补贴。英国电动汽车补贴最高可为部分车型减免 3750 英镑(现汇率约合 34797 元人民币),适用车型包括福特 Puma Gen-E、日产 Leaf 和纯电 MINI Countryman。 比亚迪认为,销量增长得益于覆盖面较广的产品阵容。比亚迪在英国销售的车型,涵盖 18675 英镑(IT 之家注:现汇率约合 17.3 万元人民币)的 Dolphin Surf(海鸥)到 47025 英镑(现汇率约合 43.6 万元人民币)的 Sealion 7(海狮 07 EV)等各级车型。 比亚迪英国公司的负责人 Bono Ge 表示:「随着燃油价格持续高企,越来越多驾驶者正转向电动汽车,把电动汽车视为更明智、更经济的选择。我们很高兴看到英国电动汽车市场同比增长 22%,也更自豪的是,比亚迪在短短三年多时间里成为英国领先电动汽车品牌。」 今年以来,比亚迪在英国销量同比增长 124%,达到 26396 辆。这个成绩已经超过多家欧洲车企:雪铁龙 12142 辆、Cupra 15171 辆、达契亚 10250 辆。比亚迪也高于菲亚特、路虎、MINI 和雷诺等品牌,后者今年累计销量分别为 2320 辆、25313 辆、18814 辆和 23645 辆。(来源:IT 之家)
  • # 极客有话说# Anthropic 发布 Opus 4.7 后,引发关于 token 消耗及成本的讨论,其中两个与中文相关的说法备受关注:中文在新 tokenizer 下几乎没涨价,古文比现代汉语更省 token。为此作者进行测试验证。
    测试发现,在 Claude 和 GPT 上中文 token 消耗高于英文,而 Qwen 和 DeepSeek 则相反,且 Opus 4.7 的 tokenizer 升级主要使英文 token 数膨胀。这源于 tokenizer 分词方式差异,中文适配西方技术基础设施存在代价,如整字编码虽降成本但可能丢失部首语义线索,历史中这类意外与巧合并不鲜见。
  • # 极客有话说# 5 月 4 日,豆包在 App Store 页面更新付费版本服务声明,将推出包含更多增值服务的付费订阅体系,设三档定价。此消息引发热议,在国内 C 端订阅难做、大模型价格战激烈的当下,豆包商业化闯关备受关注。
    豆包付费专注复杂任务和生产力场景,采用 “基础免费 + 进阶付费” 模式。字节此时入场,是因免费换规模边际效益到头,且国内 AI 付费用户教育已完成。豆包虽有技术优势,但面临用户续费率低、付费价值可替代、算力成本高及价格战等难题,其付费订阅长期能否跑通仍充满不确定性。 在中国市场搞「付费订阅」,豆包咋想的?
正在载入...
正在载入...