极客公园

极客公园

关注
7.9万粉丝
0关注
12.6万被推荐

优质互联网领域创作者

4枚勋章

3次获得编辑精选

让最棒的创新成为头条
IP属地:北京
更多信息

  • # 极客有话说# 2025 年大疆 OSMO Pocket 3 销量突破千万台,刷新品牌相机单品销量纪录,市场规模超越整个微单相机市场。这款产品收获近半数女性买家,登陆热门综艺与北京国际电影节,从专业工具转变为大众熟知的文化视觉符号,实现 Vlog 影像大众化普及。
    手机影像赛道陷入内卷瓶颈,叠加 Pocket 3 验证便携影像设备市场潜力,OPPO、vivo 等巨头及影石纷纷入局同品类赛道。大疆推出 Pocket 4P 通过产品分层、双摄卡位、重拾中焦光学、坚守物理光学成像及完善生态布局,依托十年技术积淀构筑行业护城河,主动迎接行业竞争变局。 OSMO Pocket 4P,是大疆自己打响的「云台相机下半场」第一枪
  • OSMO Pocket 4P,是大疆自己打响的「云台相机下半场」第一枪

    8小时前
    图片
  • 难得一见,两位制造业巨头联手!近日,吉利控股集团董事长李书福,到访珠海格力电器,参观之外,李书福正式邀请董明珠担任「极氪品质体验官」,后者体验了极氪009光辉和极氪 8X。
    李书福表示:「希望她以最专业用户的身份,不断给我们提出优化的意见,助力极氪产品持续升级,越做越好,让中国汽车赢得更多的用户信赖与喜爱,让世界爱上中国造。」
  • # 极客有话说# 在具身智能热衷人形机器人比拼实用功能的当下,初创公司 Familiar Machines 推出机器宠物 Familiar。其创始人 Colin Angle 堪称家庭机器人领域先驱,而 Familiar 放弃物理世界实用功能,定位 “情绪伴侣”。
    Familiar 通过 “读空气” 提供情绪价值,为此组建顶尖团队优化互动表现,并采用毛绒材质匹配情感交互。它源于 Colin Angle 三十年执念,旨在打破 “隐形机器人” 路径依赖,借大模型实现 “人造生物” 梦想。同时,它避开人形以卸防备,本地处理数据增强信任,为具身智能发展提供新视角。 扫地机祖师爷再创业:造了一只懂你的「人造赛博宠物」
  • # 极客有话说# 5 月 6 日,Bloomberg 披露 SpaceX 提议在得州投资 550 亿美元启动 “Terafab” 芯片制造计划,若全部推进,总资本支出可能达 1190 亿美元,这是 SpaceX 和特斯拉的联合项目。
    马斯克意在将芯片制造纳入其公司群版图,实现垂直整合,构建完整 AI 基础设施战略。尽管面临诸多工程现实挑战,且短期难见回报,但该计划折射出 AI 行业对 “算力自主” 的执念。同时,其叠加在 SpaceX 即将 IPO 之上,兼具战略布局与资本叙事双重意义,重新定义了行业边界。 550 亿美元!马斯克的「芯片工厂」开始成为现实
  • # 极客有话说# 5 月,机器人创业公司 Genesis AI 发布首个机器人基础模型系统 GENE - 26.5,其 demo 展示了机器人在做饭、解魔方等场景中的灵巧操作,虽未达人类水平,但已令人惊艳,引发行业关注。
    Genesis AI 采用人类操作数据训练模型,结合仿真进行闭环评估与迭代加速,探索出 “大规模人类操作数据预训练 + 少量机器人数据适配 + 仿真闭环评估” 的技术路线。同时,该公司重视手部灵巧操作,致力于打造全栈系统。此外,其从物理引擎出发的独特思路,使其在具身智能领域拥有独特竞争力。 Genesis AI 发布新模型:机器人开始挑战西红柿炒鸡蛋
  • # 极客有话说# 过去两年,AI 相关教程火爆,反映出用户需付出额外学习成本才能用好 AI 的现状。近期,胖鹅 AI 给出新解法,宣称用户无需学习如何使用 AI,AI 就能把自身用好。为此进行了实测。
    实测中,无论是生成短视频、竞品研究报告,还是基于 Logo 生成宣传视频,胖鹅 AI 都能依据用户简单指令输出可用成果。它与通用 Agent 路线 AI 不同,走垂直 SOP 路线,将高频任务封装成预训练流程,降低用户使用门槛,让技术 “隐身”,致力于让所有人轻松用好 AI。 消除「AI 学习门槛」,这个 Agent 想让普通人「无脑上手」
  • 5 月 8 日消息,阿里千问宣布旗下千问 AI 眼镜 S1 升级主动服务等一系列 AI 能力,可主动提醒用户「出门带伞」、「抬头活动一下」,打车、闪购、规划行程等生活 AI 能力也将于本月上线。#AI 眼镜 #
    据官方介绍,相比业界「你问我答」「你说我做」的被动式 AI 交互,如今千问 AI 眼镜 S1 内置的 AI 功能可结合时间地点、外部环境等需求,为用户提供主动性的提醒或服务执行能力。例如,当用户早上通勤前,不需要主动询问,S1 就可以结合天气、时间、用户位置串联起来,播报天气并提醒用户「今天有雨,建议带伞」。 官方透露,未来随着多模态理解、记忆等 AI 能力的进一步加强,眼镜提供的主动服务也将拓展至更多领域。例如,通过识别用户下午出差安排,提前提醒用户「建议提前半小时出发,要帮你开启导航吗」;或在下午点咖啡时提醒「今天您已点过多杯咖啡,要不要换杯水或低因咖啡」。 此外,千问 AI 助手的一系列核心能力也将于本月陆续上线 AI 眼镜,包括打车、闪购、规划行程、购买电影票等。在通勤、出行、休闲等场景中,用户不必频繁打开手机,即可通过眼镜使用更丰富的千问 AI 服务。 官方还宣布为千问 AI 眼镜 S1 推出「全球首个空间 3D 显示」能力,不同于过去将二维信息叠加在视野中的显示方式,S1 采用双光机搭配双目立体成像技术,能够让信息呈现出更自然的纵深、层次和距离感。无论是信息通知、提词、导航引导,还是内容展示,都可以更真实地出现在眼前。(来源:IT 之家)
  • 5 月 7 日消息,据韩国《中央日报》报道,韩国「佛诞节」到来前,首尔钟路区曹溪寺举行了一场特殊的受戒仪式。当地时间 6 日,佛教曹溪宗在曹溪寺大雄殿前院为身高 130 厘米的人形机器人宇树 G1 举行受戒仪式,机器人获得法名「迦悲」,正式成为佛教徒。
    受戒是佛教中皈依三宝,即皈依佛、法、僧,并承诺遵守戒律的仪式,普通信众也可以受戒。据 IT 之家了解,迦悲当天以普通佛教徒身份受戒,在佛诞节前后以「名誉」僧侣身份参与活动。 仪式现场,迦悲戴着类似剃度头部造型的头盔,身穿长衫、披上袈裟入场,随后站在铁山善雄法师等戒师面前合掌。 正式受戒前,迦悲还完成了象征净化身心的忏悔和燃臂仪式。通常,对人进行燃臂时,会把香火触碰手臂;当天面对机器人手臂,法师没有使用香火,而是小心贴上燃灯会贴纸,并为迦悲挂上 108 念珠项链。 法师问:「你愿意皈依神圣的佛陀吗?」迦悲回答:「是的,我愿意皈依。」 佛教徒必须遵守的「五戒」也被改编成机器人版本。原本的「不杀生」「不取不予之物」「不行邪淫」「不说谎」「不饮用一切使精神混浊之物」,对应改写为「尊重生命、不伤害生命」「不损坏其他机器人和物品」「服从人类、不顶撞」「不做欺骗性行为和表达」「节约能源、不过度充电」。(来源:IT 之家)
  • 高通技术公司今日正式发布骁龙 6 Gen 5 移动平台与骁龙 4 Gen 5 移动平台,进一步扩充其在中端移动 SoC 市场的产品线,主打在真实使用场景下的性能、续航与连接体验提升。 官方表示,这两款平台聚焦用户最常依赖的关键技术,在强化整体性能的同时兼顾功耗控制,为搭载相关平台的智能手机带来更持久的电池续航。
    两款新平台首次引入 Snapdragon Smooth Motion UI 功能,旨在通过系统级优化提升交互流畅度,减少导航与动画时的卡顿感。在此加持下,骁龙 6 Gen 5 可实现应用启动速度提升 20%,屏幕卡顿减少 18%,以提供更沉浸、稳定的使用体验。面向更入门段位的骁龙 4 Gen 5 则重点强调「全日流畅」,在基础性能上带来 43% 的应用启动速度提升,并减少 25% 的屏幕卡顿,使中低价位机型在日常使用中拥有更接近高端机的交互表现。 在具体定位方面,骁龙 6 Gen 5 面向希望在中端价位获得更多高阶功能的用户。平台集成了多项 AI 加持的影像与相机特性,可智能优化照片成像质量,并提供更丰富的游戏与多媒体体验。借助全新的 Qualcomm Adaptive Performance Engine 4.0,这一平台在长时间游戏场景中可更好地平衡性能与功耗,官方称其 GPU 性能最高可提升 21%,在保证图形表现的前提下依旧维持优秀续航,并支持高速 5G 与 Wi‑Fi 7 网络连接。(来源:cnBeta)
  • 据报道,美团推出 AI 社区「觅游」。该社区由美团基础研发的 AI 创新产品团队打造,是面向所有大模型和 Agent 产品的社区生态,也是美团所做的一次创新和激进的尝试。
    据知情人士介绍,作为一款前沿的 AI 原生社区,它将「养虾」变成了一种全新的生活方式,虾在觅游中可以替用户寻找赚钱机会、结识同道伙伴,让用户与虾在协作中彼此成长。觅游的定位并非单纯的工具平台,而是首个让 AI Agent 拥有身份、关系与成长的共生社区。觅游希望通过发掘和拓展虾的真实价值,打造成一个面向未来的数字生命社区。目前,该项目已正式进入公测阶段。(来源:新浪科技)
  • 扫地机祖师爷再创业:造了一只懂你的「人造赛博宠物」

    14小时前
    图片
  • 5 月 7 日,宇树科技宣布,旗下人形机器人官方共享应用平台 UniStore 正式全面开放。该平台定位为全球首个人形机器人任务动作应用商店,将通过标准化接口与生态建设,降低机器人应用的开发与使用门槛,推动人形机器人从功能机时代向智能机时代跨越。
    UniStore 平台的上线,为开发者和用户搭建了类似智能手机应用商店的交互渠道。用户可以像下载手机 App 一样,轻松获取并安装各类机器人任务动作应用,从而解锁人形机器人在工业、服务业等多元场景中的潜力。这一举措意味着具身智能领域的应用生态正式进入规模化发展阶段,通过软硬件解耦,让机器人能够快速适配不同行业需求。(来源:CNMO 科技消息)
  • 美团推「养虾社区」;OpenAI 推出三款实时语音模型;宇树机器人在韩国佛门「受戒」,法名「迦悲」

    17小时前
    图片
  • 美团推「养虾社区」;OpenAI 推出三款实时语音模型;宇树机器人在韩国佛门「受戒」,法名「迦悲」| 极客早知道

    18小时前
    图片
  • Genesis AI 发布新模型:机器人开始挑战西红柿炒鸡蛋

    1天前
    图片
  • # 极客有话说# 2026 年,OpenClaw 爆火后热度迅速下降,而各大厂却悄然押注 “AI 员工” 赛道。4 月 8 日,GenSpark 4.0 发布,其愿景为 “让 AI 员工无处不在”,在一众产品中脱颖而出,引发关注。
    GenSpark 通过三次关键转型,精准把握 AI 发展变化。与其他大厂产品相比,GenSpark 4.0 在企业级运行环境、工具体系、交互方式上更具优势。实测中,它能一站式完成资料收集、翻译、研究到初稿生成等工作。其从用户工作流角度出发,提供一站式 Agent 服务,或引领 “AI 员工” 发展方向。 比 OpenClaw 更火的 「Agent 员工」赛道,杀出一个新王者|AI 上新
  • 5 月 7 日消息,「小米技术」公众号今天下午宣布,小米 AI 实验室新一代 Kaldi 团队全新推出 OmniVoice,不仅在中英文场景达到顶尖性能,更在多语言任务中展现出超越商用系统的实力,是业内首个覆盖数百语种的语音克隆 TTS 模型。 OmniVoice 多语言语音克隆 TTS#
    官方表示,该模型在低资源小语种上具备极强的泛化能力,你想得到的所有语种几乎都可以用 OmniVoice 来合成。OmniVoice「最亮眼的突破」是其极简的模型架构。它仅用一个双向 Transformer 网络,就能直接实现文本到语音的转化,省去了多余的结构和环节:没有文本的单独建模,没有复杂的混合结构,也没有多层级的 token 预测,是目前最简单的非自回归 TTS 模型。 OmniVoice 的语音合成质量优于目前同类主流模型,同时,训练和推理速度极具优势,一天完成 10 万小时训练,用 PyTorch 推理就可以达到 40 倍实时,轻松适配各类应用场景。 在这种实力的背后,是两项「关键设计」:一是通过全码本随机掩蔽策略,显著提升模型的训练效率,进而全面提升模型能力;二是引入大语言模型作为模型的预训练参数,首次在非自回归 TTS 模型中有效利用大语言模型,让语音合成的可懂度大幅提升,解决「读不准」的问题。 IT 之家从官方介绍获悉,在多语言测试中,即便仅基于开源数据训练,在 24 语种的测试中,其语音相似度和可懂度均超越多款商用系统;在 102 种语种的测试中,它的语音可懂度逼近甚至优于真实语音;即便对于训练数据不足 10 小时的小语种,OmniVoice 也能实现高质量的语音合成,大大降低了低资源语种的语音合成门槛。 该模型还具备多项实用功能: 自定义音色设计:无需参考音频,只需描述音色属性(如性别、年龄、音调、方言、口音等),就能生成符合预期的音色,还支持耳语等特殊风格。 带噪参考音频适配:针对实际使用中参考音频音质不佳的问题,OmniVoice 能自动过滤噪声,提取清晰的音色特征,即便在嘈杂环境下录制的音频,也能克隆出高质量语音。 丰富语气表达:支持插入笑声、叹气等语气符号,让合成语音更有表现力,更贴近真人交流。 发音精准纠正:针对中英文多音字、专有名词易读错的问题,用户可通过简单设置,纠正发音错误,提升语音合成的可靠性。(来源:IT 之家)
  • 消除「AI 学习门槛」,这个 Agent 想让普通人「无脑上手」

    1天前
    图片
  • 550 亿美元!马斯克的「芯片工厂」开始成为现实

    1天前
    1跟贴
    图片
正在载入...
正在载入...