03杂志跨页 SenseNova-U1 Pro 以一句提示词生成 GQ 风格「007 · 阿斯顿·马丁 DB5座驾档案」横版跨页,涵盖车辆详细规格参数表、多角度实拍图集、车主历史时间轴、电影片场注记等,版式还原度达到商业出版可用水准。如此包含了复杂多栏混排与长文本段落控制的出版与品牌设计场景,也是目前图像生成模型最难实现的能力维度之一。
打开网易新闻 查看精彩图片
04学术海报,PK 对标 GPT-Image-2 SenseNova-U1 Pro 一键输出 SenseNova U1的论文海报,信息密度极高,包含架构图、基准表格与可识别二维码;GPT-Image-2版本留白偏多、密度偏低。
打开网易新闻 查看精彩图片
GPT-Image-2生成
打开网易新闻 查看精彩图片
SenseNova-U1 Pro生成
05电影分镜,PK 对标 GPT-Image-2 基于同一段深夜暗巷追逐戏的提示词,SenseNova-U1 Pro 可以输出16000×24000+ 像素、含40-60格的导演级分镜稿,每格附景别、机位与情绪标注;GPT-Image-2仅输出1024×1536,放大后存在细节失真,分镜形式简单,情绪表现力也偏弱。分辨率上百倍的差距,对专业创作场景有着极大影响。 针对这一场景林达华表示:“思考、理解和创作在一个大脑里面统一,就像编剧和导演融为一体。” SenseNova-U1 Pro 的这一突出能力,也将为商汤短片智能体 Seko 进行复杂的剧集创作提供强大支持。
打开网易新闻 查看精彩图片
GPT-Image-2生成
打开网易新闻 查看精彩图片
SenseNova-U1 Pro生成
行业普遍预测,OpenAI 即将在近期发布国际前沿模型,并同样将“设计”锚定为重点发力方向。商汤在此预告 SenseNova-U1 Pro 全新旗舰模型,不但是与顶尖 AI 巨头的正面对垒,也向外界释放了一个信号,表明在编程以外,“设计”正在成为顶级多模态模型的下一个主要赛场。 当模型能力突破工业红线,其产业空间极为广阔,将给产品开发、平面设计、工业设计、视频制作、城市和园区规划等行业带来变革性升级。 对于商汤而言,SenseNova-U1 Pro 所承载的远不止于此,它还将成为数字智能与物理智能融合的技术基座,驱动 AI 走向更广阔的物理空间。
热门跟贴