北大AI鱼博士

北大AI鱼博士

关注
7粉丝
0关注
2074被推荐

北大人工智能博士,斯坦福创业导师

7枚勋章

北大人工智能博士,斯坦福创新创业导师
IP属地:北京
更多信息

  • MiniMax预计在2026年1月9日于港交所上市,股票代码为00100.HK。
  • OpenAI 应用CEO Fidji发表最新博客,讲解了对2026年的愿景展望以及OpenAI将在2026年重点布局的领域
    2026 的核心产品方向:个人超级助理(Personal Super-Assistant) ChatGPT 不需要成为你“花时间最多的 App”而要成为 “为你创造价值最多的 App”。 1️⃣ 从“聊天机器人”到“超级助理” 2026 年的 ChatGPT 将发生结构性变化:理解你的长期目标;记住上下文;主动推进事情;在你生活和工作的关键节点介入 从 reactive → proactive 2️⃣ 个性不再是统一模板 OpenAI 明确提出:Personality & tone 必须可定制,每个人都应该:拥有一个“自己喜欢交流的 AI” 这是 AI 个性化的产品级承诺,而非模型层噱头。 3️⃣ 关键能力组合(非常重要) ChatGPT 将系统性强化: Memory:长期记忆 → 深度个性化⚡ Pulse:代表你主动行动 Connected:连接人、服务、应用(隐私安全前提下) Multi-player:群聊、协作、共创 Multimodal,最终目标:每个用户都拥有一支“AI 助手团队”,由一个超级助理统一协调。 博客原文:
  • 【天风海外李泽宇】谷歌Gemini 3.0模型卡提前放出快评——多模态、知识库能力大幅超越GPT与Claude
    Google尚未发布新一代大模型 Gemini 3 Pro,但官网已经上线模型卡,并同步披露与 Gemini 2.5 Pro、Claude Sonnet 4.5 与 GPT‑5.1 的对比测试结果。整体看,Gemini 3 Pro 在多模态能力上大幅领先目前其它旗舰模型,并在数学、科学推理及长上下文等核心能力上有较为明显的跨代提升。 在涉及图像理解能力的逻辑推理上(Humanity’s Last Exam、ARC‑AGI‑2、AIME 2025、MathArena 等)上,Gemini 3 Pro 大幅超越自家 2.5 Pro,GPT‑5.1、Claude 4.5 。 AIME 2025 等高难数学榜单中,Gemini 3 Pro 在“有代码执行”场景下达到满分,显示其在 工具调用+数学推理 组合能力上已经具备行业顶级水准。 多模态与视频理解:延续 Google 传统优势,视频场景领先两档档在 MMMU‑Pro、ScreenSpot‑Pro、Video‑MMMU 等多模态基准中,Gemini 3 Pro 相比 Gemini 2.5 Pro 有明显跳升,并普遍高于 GPT‑5.1 与 Claude 4.5。在截图理解上,Gemini 3 Pro达到72.7%,大幅超越其它旗舰模型的36.2%。 特别是 Video‑MMMU 维度上,Gemini 3 Pro 在视频信息抽取与知识问答上表现突出, Agent & 代码:综合实力强,部分专项仍与 GPT‑5.1/Claude 形成互有胜负 在 LiveCodeBench Pro、SWE‑Bench Verified、t2‑bench、Vending‑Bench 2 等“代码+智能体”基准上,Gemini 3 Pro 的 Elo/成功率普遍高于旧版本,并在多数维度与 GPT‑5.1 非常接近。 但在部分单项(如 SWE‑Bench Verified 测试,Claude 4.5 仍保持小幅领先),表明行业在真实软件工程类任务上尚处于“多强并立”格局,尚未出现一骑绝尘的模型。 长文本与检索:128k 上下文可用性增强,复杂检索任务能力改善。幻觉极低。 在 MRCR V2、FACTS Benchmark Suite 等长上下文与检索基准上,Gemini 3 Pro 相对 2.5 Pro 提升明显,在 128k 长度下仍能保持较高准确率。并且在SimpleQA Verified上,其得分超过72%,大幅领先非Anthropic Sonnect4.5的29%与GPT5.1 的35%。 长任务执行能力:整体也胜于GPT 5.1 与Sonnet 4.5 我们怎么看未来生态与商业化?我们认为尽管在代码能力上Gemini 3Pro尚未完全超于竞争对手,但在多模态能力、文本Rag能力上3Pro已经大幅超越,叠加 Google 自有搜搜索+Workspace+Android 生态,有望在搜索AI mode商业化、文档问答、企业AI等场景实现市场开拓能力的大幅提升,并且涌现大量多模态新场景。继续看好谷歌与谷歌链的受益者。
  • 离了大谱:纽约时报起诉OpenAI
    要求他们交出: 2000 万条 ChatGPT 用户的私人聊天记录... 理由是: “我们想看看有没有用户用 ChatGPT 来绕过纽约时报的付费墙。”
  • 最新消息:英伟达现在的市值超过了以下总和:
    相当于 2 个加拿大 相当于 166 个冰岛 相当于 1.5 个德国 全部美国地区性银行的总和 全球所有亿万富翁财富的 3 倍 整个 NFL 的 35 倍 有史以来卖出的所有披萨 ️ 亚马逊上所有商品的总和 Visa + Mastercard + PayPal 的总和 NASA + SpaceX + 波音的总和 丰田 + 索尼 + 任天堂的总和 欧洲四大银行的总和 ️ 全球所有石油公司的总和 全球所有黄金储备的总和 洛杉矶所有房地产的总和 曼哈顿整个房地产市场 整个加密货币市场 全部 54 个非洲国家的总和
  • 【】
    享誉世界的物理学家,诺贝尔物理学奖获得者,中国科学院院士 清华大学教授,清华大学高等研究院名誉院长,杨振宁先生因病于2025年10月18日在北京,享年103岁。 享誉世界的物理学家、诺贝尔物理学奖获得者,中国科学院院士,清华大学教授、清华大学高等研究院名誉院长杨振宁先生,因病于2025年10月18日12时00分在北京逝世,享年103岁。 杨振宁先生1922年出生于安徽合肥,1929年随父母来到清华园。1938年考入西南联合大学,1942年入清华大学研究院,1944年获理学硕士学位,1945年作为清华大学留美公费生赴美留学,就读于芝加哥大学,1948年获博士学位后留校工作。1949年加入普林斯顿高等研究院,1952年任永久研究员,1955年任教授。1966年任纽约州立大学石溪分校爱因斯坦讲座教授,创立理论物理研究所(现名为杨振宁理论物理研究所),并在该研究所工作至1999年。1986年起应邀担任香港中文大学博文讲座教授。1997年起任新成立的清华大学高等研究中心(现名为高等研究院)名誉主任,1999年起任清华大学教授。 杨振宁先生是20世纪最伟大的物理学家之一,为现代物理学的发展作出卓越贡献。他与米尔斯提出的“杨-米尔斯规范场论”奠定了后来粒子物理标准模型的基础,被认为是现代物理学的基石之一,是与麦克斯韦方程和爱因斯坦广义相对论相媲美的最重要的基础物理理论之一。他与李政道合作提出弱相互作用中宇称不守恒的革命性思想,并获得1957年诺贝尔物理学奖,共同成为最早获得诺贝尔奖的中国人。他发现了一维量子多体问题的关键方程式“杨-巴克斯特方程”,开辟了统计物理和量子群等物理和数学研究的新方向。他在粒子物理、场论、统计物理和凝聚态物理等物理学多个领域取得的诸多成就,对这些领域的发展产生深远影响。他是十余个国家和地区科学院的外籍院士,获颁国内外二十余所知名大学的名誉博士学位,还获得了美国国家科学奖章、富兰克林奖章、昂萨格奖、费萨尔国王国际科学奖、中国国际科技合作奖、求是终身成就奖等众多荣誉。 杨振宁先生毕生心系家国,为祖国的科教事业作出了杰出贡献。1971年他首次回新中国访问,掀起大批华裔学者访华热潮,被誉为架设中美学术交流桥梁第一人,后又向中央领导同志提议恢复和加强基础科学研究。他亲自募集资金设立“对华教育交流委员会”,持续资助中国学者近百人到美国进修,这些学者成为后来中国科技发展的中坚力量。他为促进国内科技交流和进步做了大量工作,为中国重大科学工程和科教政策制定建言献策、发挥了重要影响。回到清华之后,他把高等研究院的发展作为自己的新事业,为清华大学物理学等基础学科的发展和学校人才培养事业倾注了大量心血、作出了极大贡献,对中国高等教育的改革发展产生了重要影响。 杨振宁先生的一生,是探索未知的不朽传奇,是心怀家国的永恒回响。“宁拙毋巧,宁朴毋华”是他的治学态度,也是他的人生态度。正如他钟爱的诗句“文章千古事,得失寸心知”,杨振宁先生的百年人生是一部闪耀在人类群星中的千古篇章。 杨振宁先生永垂不朽! 来源:清华大学
  • 从燕园到钱塘:北大AI创业营“开往春天”的产业实践
    2025-10-01
  • 聚焦量子科技与智能创新:智能科普中国行—央企在行动
    2025-09-27
  • 【】
    温州,这座以“敢闯敢试”闻名的城市,再次走在了时代前沿!就在9月3日,温州市正式揭牌设立市人工智能局,并举行了全市人工智能创新发展大会,这标志着温州正式吹响了进军AI新赛道的号角。 这次大会不仅宣布了温州市人工智能局的成立,还发布了一系列重磅文件,包括《温州市加快建设人工智能创新发展先行市的实施方案(2025-2027年)》、多项扶持政策和重点领域三年行动计划。这套“一方案一政策一清单”体系,旨在从降低创新成本、鼓励研发投入、支持企业发展等多个维度,为AI产业提供全方位保障。 温州市委书记张振丰强调,人工智能是引领新一轮科技革命的战略性技术,温州要抓住AI机遇,将其作为城市跨越赶超的新动能,实现产业涅槃重生。温州将聚焦“3412”工作体系,通过打造三大支撑体系、四大核心产业和十二个领域的AI赋能,推动“温州制造”向“温州智造”迭代升级。 温州发展AI有着得天独厚的优势,包括AI创新生态、数据、算力、应用场景、制造转化等。未来,温州将重点打造“AI示范应用第一城”,聚焦“AI+医疗”“AI+交通”等八大重点领域,建设标杆应用场景,让AI技术更好地赋能千行百业。同时,温州还将通过建设孵化空间、强化产研对接、优化要素供给等举措,打造最佳的AI创新创业生态,让温州成为AI人才的沃土。 重点关注: 1、温州市正式成立人工智能局,旨在加快建设人工智能创新发展先行市,抢占AI发展新赛道。 2、 温州发布《加快建设人工智能创新发展先行市的实施方案》,并提出“3412”工作体系,从政策、产业、应用等多个层面全面布局AI发展。 3、温州将聚焦八大重点领域,打造“AI示范应用第一城”,推动“温州制造”向“温州智造”转型升级。
  • 【】
    谷歌刚刚投下了一枚重磅炸弹:正式发布其最先进的图像模型——Gemini 2.5 Flash Image!大家可能对它的另一个名字更熟悉:。 没错,就是那个前段时间在LMArena盲测中以史上最大分差一骑绝尘,被全球网友票选为「最强图像模型」的神秘选手。现在,它终于揭开了面纱!谷歌CEO劈柴和DeepMind大佬Demis Hassabis都亲自下场“带货”,展示了其惊人的P图能力,随意换装、加配饰,效果堪称“言出法随”,P图师的饭碗这次可能真的危险了。 Gemini 2.5 Flash Image的核心能力主要有四点: 1. 角色一致性:可以在不同场景、风格和姿势中保持同一角色的外观,让个人制作电影的时代又近了一步。 2. 提示词编辑:用自然语言就能实现精细的局部修改,比如模糊背景、去除污渍,甚至给黑白照片上色。 3. 原生世界知识:模型不只懂美学,更懂现实世界。它能像人一样理解和推理,比如预测气球碰到仙人掌会发生什么。 4. 多图像融合:能将多张图片中的元素无缝融合成一张全新的创意构图。 最关键的是价格!每张图片生成成本仅需0.039美元,折合人民币不到3毛钱!这个价格直接对OpenAI等竞争对手形成了降维打击。网友戏称:“谷歌这是请奥特曼吃香蕉呢~” 重点关注: 1、谷歌发布了其顶级图像模型Gemini 2.5 Flash Image(代号nano-banana),该模型在LMArena盲测中以历史性优势夺冠。 2、模型具备四大核心能力:角色一致性、完全基于提示的图像编辑、原生世界知识和多图像融合,极大地提升了图像生成和编辑的控制力与创造力。 3、其价格极具颠覆性,每张图片成本不到3毛钱,对Adobe Photoshop等传统工具和OpenAI等AI竞争对手构成了巨大挑战。
  • 【】
    “一天之内,由一个人制作出百万美元级别的MV。” 这听起来像是天方夜谭,但正随着AI的发展成为现实。正如那句引言所说:“我们创造了最智能的机器,却失去了最简单的感知。” AI的发展正在重塑一切。 就在刚刚,创始人陈坤在社交媒体上投下一枚重磅炸弹:AIpai迎来全新升级!在原有的文字和图片理解能力之上,正式加入了对音乐和视频的理解。这意味着AIpai已经进化为一个真正的多模态创作平台,为创作者带来了无限的可能性。 还记得两个月前AIpai作为“AI视频创作新物种”诞生时的惊艳吗?它不是一个冷冰冰的聊天机器人,而是一个能与你并肩作战的创意伙伴。你不再需要精通复杂的影视知识或掌握各种AI工具,你只需要拥有天马行空的想象力和审美。 现在,这种合作模式再次被颠覆。你可以直接丢给AIpai一首音乐,让它根据旋律和节奏生成情绪匹配的画面;你也可以上传一段视频,让它学习其中的风格、色彩和运镜。你的创意表达不再局限于文字和图片,声音和动态影像同样可以成为你与AI沟通的语言。 AIpai的核心理念,是“你的创意想象力 ✖ AIpai的影视专业能力”。这次升级,无疑是为这个公式加上了强大的催化剂。从一个简单的想法,到故事、分镜、角色、画面、视频,再到配音、配乐和最终剪辑,整个流程将变得更加无缝和直观。 当AI能理解你的全部感官,创作的边界便不复存在。 重点关注: 1、重磅升级:AIpai在原有的文生视频基础上,新增了对音乐和视频的理解能力,正式迈入多模态创作阶段。 2、全新工作流:创作者现在可以使用音乐来定义视频的情绪基调,或用参考视频来指定视觉风格,极大地拓宽了创意输入的维度。 3、降低门槛:AIpai致力于成为创作者的AI伙伴,让用户专注于创意本身,而AI负责复杂的技术实现,此次升级让这一理念贯彻得更为彻底。
  • 【】
    马斯克又来“背刺”付费用户了!今天凌晨,他在X平台突然宣布, Imagine的视频生成功能,现在向全球用户限时免费开放!这距离他宣布Grok 4免费还不到一周时间。 Grok Imagine这个功能月初刚发布,可以将文字或图片直接转换成带原生音频的15秒视频。原本这是每月30美元的SuperGrok和3美元的Premium+X订阅用户专享的功能,现在突然免费,马斯克也并未提及是否会为老用户退款。 消息一出,网上瞬间炸开了锅。不少用户已经晒出了自己的作品,效果褒贬不一。有网友成功“复活”了老照片,让年轻版的马斯克和他弟弟1996年的合影动了起来,效果惊艳。也有人几秒钟就生成了马斯克和刺猬一起喝咖啡的动画,杯子上还有特斯拉的Logo。 但翻车现场也不少。很多用户抱怨G-Imagine频繁崩溃,生成的视频里人物直接“换脸”成陌生人,而且自带的音频被吐槽是“噩梦般的声音”。智东西的实测也遇到了连接断开、音画不同步(猫叫但猫没张嘴)、音频乱配(给迎宾机器人配上工厂轰鸣声)等问题。 尽管体验不完美,但马斯克接连将核心功能免费,无疑是在加速降低AI的使用门槛,与等巨头争夺用户。只是这种反复“背刺”付费用户的行为,恐怕会动摇早期支持者的信任。 重点关注: 1、马斯克旗下xAI的视频生成工具Grok Imagine,已于今日起全球限时免费开放。 2、该功能此前为付费订阅内容,此举引发了部分付费用户的不满。 3、目前用户对Grok Imagine的评价两极分化,虽然创意十足,但在稳定性和生成质量上仍存在不少问题。
  • 京沪AI双城记:当WAIC的“国际范”遇上WRC的“学院派” | 78期
    2025-08-14
  • 【】
    当全球人工智能的版图在中国徐徐展开,上海和北京,无疑是其中最耀眼的两颗星。一座是世界人工智能大会(WAIC)的永久举办地,代表着AI与百业融合的广度与应用;一座是世界机器人大会(WRC)的中心,象征着AI在硬核科技与前沿研究上的深度与高度。 主讲嘉宾: 马梦佳,TEDxXuhui策展人,上海盛马文创创始人,IdeaCafé主理人 刘霄,领骏资本投资合伙人,前经纬创投、光源资本核心成员 分享嘉宾: 郭晓乐,中国科学院大学人工智能校友联合会(筹)负责人,资深产业投资人 胡延平,上海财经大学特聘教授,智能科技产业专家 北大AI鱼博士的微博直播 AI大伽百人谈 | 从WARC到WRC—AI双城计
  • 【】
    北京时间2025年8月8日凌晨,OpenAI不负众望,正式发布了其划时代的最新模型——GPT-5,一场席卷全球科技圈的AI大战就此全面引爆! 消息一出,全球科技巨头迅速做出反应,整个行业闻风而动。马斯克的xAI几乎在第一时间就打出应对牌,宣布其最强的Grok-4“专家”模型向所有用户免费开放!这波操作被市场解读为在GPT-5的强大光环下,为保住用户而采取的最直接、最激进的竞争策略。 与此同时,另一巨头谷歌也并未沉默。其DeepMind CEO Demis Hassabis近期高调展示的“relentless (毫不留情)”发布清单——从世界模拟器Genie 3到地球级模型AlphaEarth——此刻看来,更像是在为正面迎战GPT-5提前储备的“弹药库”。 现在,正如网友所预言的,“奥特曼搞出了大动静”,而友商们也确实没有“消极怠工”。GPT-5的发布,就像一颗深水炸弹,不仅掀起了滔天巨浪,更直接开启了顶级AI模型的“价格战”。神仙打架,用户狂欢,我们正亲眼见证一个由顶尖技术竞争驱动的AI普惠新时代的到来! 重点关注: 1、GPT-5重磅发布:北京时间2025年8月8日,OpenAI正式推出GPT-5,标志着AI技术竞赛进入了一个全新的纪元。 2、市场迅速反应:作为直接回应,马斯克的xAI宣布其顶级模型Grok-4免费,谷歌等也展示出强大的产品矩阵,AI市场竞争骤然升级。 3、用户价值最大化:GPT-5的发布及其引发的连锁反应,正以前所未有的力度推动顶级AI技术向公众免费或以更低成本开放,用户成为这场技术竞赛的最大受益者。
  • 【】
    1. 产业进入量产拐点 本届博览会的参展企业数量、展品数量和新品规模均创历届新高,显示人形机器人已从“概念展示”走向“可供货、可量产”的阶段,供给端的拐点正在形成。 2. 价格区间全面铺开 从近百万元的高端机型到几万元的入门型号,价格梯度完整覆盖科研、工业和家庭市场,意味着不同消费能力的用户都开始有了选择空间。 3. 公共平台与模块化加速落地 青龙3.0等通用平台的出现,使硬件与外设形成可复用的基础层,有利于不同场景快速迁移应用,缩短研发与部署周期。 4. 场景演示更贴近实际工位 除了格斗、踢球等表演外,展会大量出现搬运、分拣、巡逻、检测等贴近工业与服务业的真实作业流程,逐步从吸引眼球走向可计量的生产替代。 5. 零售和服务网络开始成型 4S店和主题餐厅的开业,把机器人从展会带入日常商业空间,形成展示、体验、销售、维保一体化的闭环模式。 6. 渠道商推动市场节奏 大型零售与互联网平台加大投入,结合销售、物流、金融与投资资源,推动行业在价格、标准和规模化上的加速。 7. 关键部件走向标准配置 六维力传感器、灵巧手等核心部件逐渐成为高性能人形机器人的标配,国产供应链的完善加快了部件到整机的协同优化。 8. 应用路线呈双轨并行 情感陪伴、家庭交互等面向个人用户的产品,与面向工业、安保等场景的高性能机型同步发展,形成互补的市场格局。 9. 政策与标准提供支撑 具身智能被纳入政府工作报告,产业链的感知、决策、执行环节正加快标准化建设,为资金、研发与落地提供制度保障。 10. 短期可观察的变化趋势 预计未来一年,人形机器人的入门价会继续下降,交付量显著增加;工业示范线与园区安保应用将更常见;零售与维保网络有望在更多城市复制,资本将持续布局关键部件与数据服务。
  • 「奥特曼发布GPT5」
    首先,GPT-5 在集成模型中,这意味着不再需要模型切换器,它决定何时需要更努力地思考。 它非常智能、直观且快速。 每个人都可以使用它,包括免费套餐,带推理! 评估不是最重要的——最重要的是我们认为模型的用处——但它在评估上表现良好。例如,SWE-bench 和许多其他指标创下新高。 这是迄今为止我们有史以来最可靠、最真实的模型。 今天向免费、Plus、Pro 和 Team 用户推出。下周到企业和教育。 在免费套餐中提供此功能对我们来说是一件大事;博士级智能,适合所有人! 此外,用户还可以获得更高的速率限制。 专业用户获得 GPT-5 pro;真的很聪明!——Dr.KRIS
正在载入...
正在载入...