亲爱的数据

亲爱的数据

关注
22.0万粉丝
5关注
12.1万被推荐

香港浸会大学公司治理硕士

13枚勋章

12次获得编辑精选

《我看见了风暴:人工智能基建革命》一书作者
IP属地:北京
更多信息

  • 马斯克深夜爆料:AI5 已杀青,AI6 已开工,AI9 都在路上了!9 个月一代,比 iPhone 还卷!
    1)AI5 设计完成。 2)台积电 3 nm + 三星 2 nm 双工艺,性能直接干到 AI4 的 50 倍,内存翻 9 倍。 3)2027 年量产上车,FSD 和 Optimus 机器人一起“吃”算力。 4)165 亿美元(≈1149 亿人民币)大单已签,三星美国工厂为 AI6 待命,2028 年见。 5)老马放话:目标 9 个月迭代一次,AI7/8/9 排队中,未来要造“地球上产量最高的 AI 芯片”。 6)原文: “我们的 AI5 芯片设计已接近完成,AI6 处于早期阶段,但但未来还将推出AI7、AI8、AI9.…目标是在9个月内完成设计周期。 加入我们,共同研发我预测将是迄今为止全球产量最高的 AI芯片!” 7)网友:特斯拉这是把摩尔定律按在地上摩擦!
  • 为了AI,把底层的广域网重做一遍吗?
    2026-01-09
  • 1分钟完成曾需10小时的汽车风阻验证,将数周的科研课题攻关压缩至数小时,十倍级提升科研效率……
    12月25日,在百度AI Day活动上,百度公布超级智能体百度伐谋的最新进展:发布一个月以来,已有超2000家企业申请试用,覆盖物流、制造、AI4S等领域,帮助上述行业客户高效探寻全局最优解。会上,百度伐谋还宣布围绕通用性、生产级、持续性等方向进行产品能力升级,并正式发布“同舟生态伙伴计划”,面向高校实验室及行业软件企业开放核心能力,以生态共创的方式加速推进AI进产业。 百度伐谋是百度智能云推出的全球领先的可商用自我演化超级智能体。它通过大语言模型的推理能力与大规模进化搜索技术,模拟生物界几亿年的进化过程并压缩至几天甚至几小时,从而发现过去人类从未发现过的全局最优解,还能根据条件变化自动迭代,给出最优的动态方案。 百度创始人李彦宏此前曾表示,中国拥有全球最齐全的工业门类和丰富的应用场景,如果能用先进技术大幅提升这些场景的效率,对经济增长的贡献将显而易见。正是基于这一愿景,百度伐谋旨在消除产业发展的“隐形天花板”,将过去锁在少数精英头脑里的顶尖算法,转化为每一家企业都能即刻调用的基础设施。 “人工智能正在跨越从‘智能涌现’走向创造真实价值的‘效果涌现’的新临界点。AI不再仅仅是实验室里的炫技演示,而是深入产业核心,成为解决实际难题、驱动生产力变革的原生推动力”,百度智能云AI与大模型平台总经理忻舟在致辞中表示。 伐谋三大能力升级,加速进化算法产业落地实践 百度伐谋负责人李安南介绍,自11月发布以来,伐谋和超2000家企业进行场景共创,涌现出包括农业货运规划、高校AI4S课题攻关、制造业排产优化及基础求解器策略寻优等大量创新场景。
  • Andrej Karpathy版本的2025年度AI大回顾

    2025-12-21
    图片
  • 图灵奖得主的离巢与野心,Yann LeCun携5亿欧元入场豪赌
    2025-12-21
  • 花10亿买英伟达GB200只是开始,隐藏成本有多高?
    2025-12-05
    2跟贴
  • 📢 开源狂魔 Mistral 又深夜放大招!4 个多模态新模型一次梭哈:
    🌟 Mistral-Large-3 675B 总参数|41B 激活|MoE 架构 直接硬刚 DeepSeek-V3.1 & K2,视觉+文本双杀,性能怪兽上线! 🌟 Ministral-3 小钢炮系列 3B / 8B / 14B 全密度模型,各给 3 个口味: pretrain|instruct|reasoning 对标 Qwen3-VL,本地跑也丝滑,小参数大能量! ✅ 全开源!可商用! #AI圈过年 #多模态卷王 #Mistral杀疯了
  • kimi开源了哪些模型?截至目前25 年 11 月
    月之暗面(Moonshot AI)至少已把以下 5 类模型/代码正式开源,均可商用或科研使用: 1.Kimi-Audio(通用音频基础模型) 含语音识别、音频理解、语音对话等 SOTA 级能力,一并放出模型权重、训练/推理代码与评测工具包 。 2Kimi K2 系列(代码与 Agent 任务专用) Kimi-K2-Base:纯预训练版 Kimi-K2-Instruct:指令微调版 权重以 Apache-2.0 协议托管在 Hugging Face,同步给出 FP8 权重、DeepSpeed-ZeRO3 训练脚本和 LoRA/QLoRA 一键微调示例 。 3.Kimi-K2-Thinking(长思维链推理/智能体模型) 支持 200-300 步连续工具调用,原生 INT4 量化,推理速度提升约 2 倍;模型与量化代码均已开源 。 4.Kimi-Dev(代码模型,6 月发布) SWE-bench Verified 60.4% 成绩拿下开源 SOTA,采用 MIT 协议,权重与训练代码全公开 。 5.kimi-cc(社区贡献的“Claude-Code 换核”项目) 把 Claude Code 默认模型替换为 Kimi K2,显著降低调用成本。
  • 那些智能体framework也在努力竞标:Dify
    什么是智能体Framework? 一句话讲清楚: 智能体 framework = 帮你快速把“大模型 + 工具 + 记忆 + 工作流”组装成一个可运行智能体的开发框架。 它不是模型,而是模型外的一层“运行逻辑 + 调度系统”。为什么需要它? 因为一个 LLM 本身只是“能理解/生成文本”。 但一个真正的 Agent 还要: 1.会调用工具(API、数据库、插件) 2.会执行多步推理,会处理状态(memory、上下文) 3.会被 workflow 编排,会与外部系统通信(消息队列) LLM 不擅长做这些。所以就出现了智能体框架,把这些能力“产品化”。
  • AK大神的AI工具三板斧
    安德烈·卡尔帕蒂@karpathy 我开始养成了一种习惯,用LLMs阅读各种内容(博客、文章、章节等)。通常第一步是手动阅读,然后进行“解释/总结”的第二步,最后是问答的第三步。与直接继续阅读相比,我通常能获得更深入或更全面的理解。这个习惯正在逐渐成为最有效的使用方式之一。 另一方面,如果你是一名试图解释或传达信息的作者,我们可能会越来越多地看到一种转变,即从“我正在为另一个人写作”转变为“我正在为LLM写作”。因为一旦LLM“理解”了内容,它就可以针对性地、个性化地将其传达给用户。
  • 百度超节点
    昆仑芯M100、M300低调露脸,256与512卡超节点先打前站,数字一律缺席,统统“明年见”。后面还藏着千卡、四千卡更大版图,只留一条模糊的影子。
  • 市面上流行的两种多智能体,底层完全不一样?
    它们表面都叫multi-agent, 但底层逻辑和目标完全不一样。 第一种:多智能体系统的思想来源 (真正意义的multi-agentsystem) 这类系统的核心是“协作自治”,也就是: 多个智能体各自具备推理能力、 感知能力、部分自主决策能力, 但它们需要通过沟通与协调,共同完成复杂任务。 每个Agent都有“思考+行动”循环 (Perceive→Plan→Act→Reflect)。 它们之间是通过消息、任务或上下文在协作, 而不是被人硬性调度。 系统中存在一定的自组织特征, 比如动态任务分配、竞争、协商。 比如,Manus; 底层是一个“协作架构”: 模型可以是同一个(比如都基于GPT-4), 但因为角色、记忆、目标函数、观察窗口不同, 它们形成了自治体之间的行为差异。 所以重点不在“模型不同”, 而在于交互模式的自治和 emergent behavior(涌现协作)。 第二种:多个模型+多角色包装 这是一个更“工程化”“可控”的版本: 把多个模型(不同功能、不同接口) 包装成多个角色或子Agent, 每个负责一个固定任务, 由一个中控系统(orchestrator)协调。 每个“子智能体”是一个API调用或固定模型; 没有真正的自治意识,而是执行明确分工; 谁调用谁、顺序如何,都是人工设定好的。 比如一个AI平台:图像生成,调用Qwen-Image; Prompt优化,用GPT-4; 评估子智能体,调用质量打分模型; 再加一个调度中心(Orchestrator)。 这其实是“多模型流水线”, 形式像multi-agent,但逻辑是multi-module。
  • AIGC赛道融资:靠啥聪明玩法,让VC秒点头?2025Q4科技观察
    2025-11-10
  • Coatue(寇图资本)的“Fantastic40”榜单,该榜单筛选出了寇图资本认为未来五年在创新和增长方面最具潜力的40家公司,分为大两类。
    一、“Publics(上市公司)”板块 这部分包含30家在科技、工业、能源等领域具有高增长潜力的上市公司,涵盖了全球科技:硬件制造商、软件服务商等: 1.头部科技与算力生态:英伟达、微软、谷歌、亚马逊、台积电、AMD、ARM、ASML(光刻机巨头等。 2.消费+互联网:特斯拉、Meta、Netflix、腾讯、阿里巴巴、Spotify、Uber等。 3.企业服务与软件:SAP、ServiceNow、Snowflake、甲骨文、Palantir、Intuit(财务软件服务商)等。 4.其他领域:博通、GE Vernova(通用电气能源转型业务)、小米、Intuitive(达芬奇手术机器人公司)、海力士(存储芯片厂商)、CrowdStrike(网络安全公司)、Constellation(能源转型公司)、AppLovin(移动应用营销平台)、电商Shopify等。 第二个板块:“Privates(私营公司)” 这部分包含10家私营企业相关主体,聚焦前沿科技、加密货币与金融科技等赛道: 1.加密与区块链:Bitcoin、Ethereum。 2.前沿AI与科技:OpenAI、Anthropic、字节跳动、Databricks、X(前Twitter)。 3.航天与金融科技:SpaceX、Stripe、Revolut。这个榜单筛选逻辑是这样, Coatue通过分析超150家科技、工业、能源领域的公/私营公司,从增长潜力和风险(如估值营收增长等)两个维度筛选出这份榜单。
  • 微软 SAMBA 模型重新定义长上下文学习能力
    SAMBA 模型的创新性:SAMBA 通过结合 Mamba 和 SWA 两种不同的机制,克服了纯注意力模型和纯状态空间模型的局限性,实现了长序列处理的高效性和记忆回忆的能力。 SAMBA 的性能优势:SAMBA 在多个基准测试中显著超越了现有的大型语言模型,包括在 MMLU、HumanEval 和 GSM8K 等评估中的得分。 SAMBA 的可扩展性:SAMBA 能够扩展到数十亿的参数量,并且在长序列上的泛化能力得到了验证,能够在无需额外训练的情况下,处理比训练时长度更长的序列。 SAMBA 的实用性:SAMBA 不仅在长文本理解方面表现出色,还能够在实际应用中提供高吞吐量和高速流式生成,这对于处理大量数据的实时系统具有重要意义。
  • 嵌入模型:文本“已死”,多模态尚有红利,2025Q4科技观察
    2025-10-27
  • Crusoe再融资13.8亿美元,估值近百亿美元:AI数据中心隐形独角兽

    2025-10-26
    图片
  • (一)经典的商业创新周期(S-Curve模型)和“创新者困境(Innovator’s Dilemma)”
    这个图其实是在讲两者之间的关系。 “S形曲线”描述了一个新技术或新业务从诞生 → 成长 → 成熟 → 衰退的生命周期: Birth(诞生):创新刚出现,技术还不成熟。 Growth(成长):市场开始接受,业务高速增长。 Maturity(成熟):增长趋缓,竞争加剧。 Decline(衰退):市场饱和,旧模式逐渐失效。 (二)中间红框:“Innovator’s Dilemma” (创新者的困境) 这是最关键的一段。 它指的是:当一家公司的第一条曲线(旧业务)发展到成熟期时, 公司往往很难投入资源去开创新的曲线(新业务), 因为旧业务仍然在赚钱。结果呢? 如果它继续守着旧曲线,很快会被新技术取代; 但如果提前押注新曲线, 短期利润会下降,股东和团队都会质疑。 这就是“创新者的困境”: 成功的公司反而最难创新。 当下,云计算(AWS、Azure、GCP) 现在就是旧的“第一条曲线”; 而 AI-native infra 基础设施, 正在形成新的“第二条曲线”。 总有公司踩在第二条曲线的起点上。
正在载入...
正在载入...