1. 腾讯混元发布混元图像3.0图生图模型
腾讯混元团队发布混元图像3.0图生图模型,模型总参数量80B,采用混合专家架构,支持图片编辑、多图融合等多样化视觉创作功能。
→早读课解读:国产大规模视觉生成模型能力再上新台阶,通过混合专家架构在保证模型能力的同时提升效率,在专业图像编辑与合成场景更具实用性。
→行动建议:专业设计师、电商美工、内容创作者可将其用于高效的图片二次创作、风格迁移、素材合成等工作流,提升视觉内容产出效率与创意可能性。
2. 京东购物智能体 JoyGlance 登陆 Rokid 智能眼镜
京东科技旗下购物智能体 JoyGlance 正式上线乐奇 Rokid 智能眼镜,通过深度融合 JoyAI 大模型与 Rokid 的技术,购物流程被简化为“说、看、付”,并采用金融级安全方案保障支付安全。
→早读课解读:AI购物助手与AR眼镜深度结合,通过“语音+视觉”的交互方式,实现了所见即所购的沉浸式购物体验,将购物行为从手机屏幕解放至现实空间。
→行动建议:AR硬件厂商、零售品牌可关注此“AI+AR”的购物新范式,探索如何将商品信息、推荐与支付环节无缝融入用户的实体环境视野中。
3. 阶跃星辰完成超50亿元B+轮融资,刷新纪录
阶跃星辰完成超50亿元B+轮融资,刷新国内大模型赛道单笔融资纪录。融资将用于基础模型研发与AI+终端战略落地,重点攻坚基座模型、全模态融合和视觉语言动作(VLA)三大方向。
→早读课解读:资本持续重仓国内顶级大模型公司,表明市场对通用人工智能底层技术突破及“AI+终端”软硬件一体战略的长期看好。
→行动建议:产业链相关企业(芯片、硬件、应用)可关注其基座模型与VLA技术的开放进展,探索合作机会;投资者需理性看待高估值下的技术商业化路径。
4. 苹果新版Siri计划正式发布,采用谷歌Gemini架构
苹果公司的人工智能战略正迎来里程碑式的转折,与谷歌在 AI 领域的合作即将开花结果,基于谷歌 Gemini 架构的新版 Siri 计划于2月下半月正式发布。
→早读课解读:科技巨头从竞争走向竞合,苹果借助谷歌顶尖大模型能力快速补强其AI助手,将极大提升Siri的智能水平,并可能重塑移动端AI助手市场格局。
→行动建议:iOS应用开发者需关注新版Siri的能力开放接口(如有),评估其对应用交互方式与功能集成可能带来的新机会。
5. 上海交通大学发布光学领域垂直大模型Optics GPT
上海交通大学发布的Optics GPT是光领域垂直大模型,通过深度学习光学专业知识,为科研、设计与教学提供高可靠性的智能化支持,其轻量化部署、高认知素养和强应用落地能力,重塑了光学领域的研发范式。
→早读课解读:垂直领域大模型在轻量化与高专业精度上取得突破,为特定学科(如光学)的科研、工程与教育提供了可信赖的AI协作者,加速知识迭代与创新。
→行动建议:光学及相关领域的研究人员、工程师、教育工作者可将其作为专业辅助工具,用于文献解读、方案设计、仿真计算与教学答疑,提升专业工作效率。
6. 全球首个大规模跨本体视触觉多模态数据集“白虎-VTouch”发布
国地中心与纬钛机器人联合发布全球首个大规模跨本体视触觉多模态数据集“白虎-VTouch”,旨在解决机器人精细化操作中触觉感知的难题,填补了该领域数据空白,为全球开发者提供了重要资源。
→早读课解读:高质量、大规模的多模态(视觉+触觉)数据集是推动机器人灵巧操作研究的关键基础设施,此举将加速机器人从“看得见”到“摸得着、操作准”的进化。
→行动建议:机器人、具身智能领域的研究机构与企业应充分利用此数据集,训练和验证机器人抓取、装配等精细化操作算法,推动技术实用化进展。
在这个星球,你可以更加系统的学习AIGC相关知识:
1. ChatGPT和AI绘画(Midjourney+Stable Diffusion+Photoshop beta)基础+进阶全攻略;
2. ChatGPT和AI绘画最直接变现案例;
3. 与200+行业先行者链接,积累你的专属人脉资源;
4. 社群保姆级一站式服务,包教包会包讨论;
现在加入,立享99元早鸟价优惠,星球用户每涨100人,价格上调100元,直到恢复499元原价!
这个风口抓不抓的住,就看你愿不愿意迈出第一步了!
越晚加入成本越贵!最后两个名额又要涨价了!
热门跟贴