来源:市场资讯
(来源:AI新榜)
1. Claude Opus 4.7发布,评分碾压还是大翻车?
今天凌晨,Anthropic正式发布Claude Opus 4.7,官方介绍,其重点提升落在指令遵循一致性、长任务稳定性和自主纠错能力上,Opus 4.7可以在更少的用户监督下,处理更棘手的编程工作。
同时,Opus 4.7的视觉能力和编程能力也大幅度提升。其最大图像分辨率从约115万像素提升至约375万像素,是前代的3倍多,编程能力也登顶AI领域的"程序员考试"SWE-bench,比前代4.6高出21%,也比GPT-5.4高出近7%。
尽管如此,此次发布也引发了部分吐槽,在海外社区Reddit的ClaudeAI板块,Opus 4.7性能严重倒退的吐槽已经获得1.4k点赞,300多条吐槽,X上也有用户表示Opus 4.7幻觉问题频出。
2. GPT-Image 2实测泄露:效果炸裂,文字生成不再乱码
4月16日,圈内无数人翘首以盼的OpenAI下一代AI生图模型GPT-image 2开启了对Plus用户的灰度测试,一石激起千层浪。
无数人称其生图效果好到炸裂,不仅生成的文字再也不乱码,图片质量也提升巨大,目前流传出来的内测案例里,GPT-image 2可以生成完全以假乱真的Web截图、TikTok模板、小红书页面等等。
3. OpenAI发布Codex大更新:从编程助手到“全流程龙虾”
4月17日,OpenAI的桌面端应用Codex进行了一次版本大更新,将其从传统的编程助手,变成了支持整个软件开发周期的Agent工具。
根据官方公告,Codex已经能够观察用户的屏幕,操控电脑鼠标,记住用户的偏好和历史操作,自己给自己排日程,在后台干活,同时完全不影响前台用户的鼠标键盘的使用。
这一更新目前已经面向使用ChatGPT账号登录的桌面端用户逐步推送,而部分个性化功能将稍后向企业版、教育版以及欧盟和英国地区用户开放。
4. 阿里首个世界模型推出:快乐生蚝,边拍边改
4月16日,成立恰满一个月的阿里ATH(Alibaba Token Hub)事业群,发布全球首个主动式实时交互的世界模型产品,HappyOyster(直译为“快乐生蚝”)。
HappyOyster能够根据提示词生成可交互的3D世界场景,同时还能马上使用WASD和上下左右方向键,就能实时控制角色位移、调整镜头视角。
同时,与传统一次性生成的AI视频工具不同,HappyOyster能够在生成全过程中持续听取并相应指令,实现实时且不断演化的流式世界建模,也即“边拍边改”
5. 小扎做了个AI分身替自己开会,CEO自动化变成现实了
4月13日,英国《金融时报》爆料称,Meta正在推进一项内部AI项目:基于其老板扎克伯格日常的一举一动、说话的语气语调,理念的公开演讲与生命,开发其AI克隆体,以打破高管与近7.9万名员工之间的沟通壁垒,构建更加高效、紧密的企业沟通生态。
爆料称,扎克伯格本人每周回头图5到10小时时间,参与代码编写、数据校准以及交互测试等工作,力求让AI分身在表达风格、思考逻辑等方面与自己高度一致。
这一项目目前仍处于早期开发阶段,尚未确定正式上线的时间。
6. 我国日均词元调用量突破140万亿
4月16日,国家统计局副局长毛盛勇在国新办新闻发布会上表示,截至今年3月,我国日均词元(Token)调用量突破140万亿,比上年末增长超40%。智能化发展的引领作用不断增强,我国人工智能商业化、规模化运营取得了阶段性突破。
7. OpenAI发布药物发现模型,表现超过95%人类专家
4月17日,OpenAI发布专为生命科学领域打造的前沿推理模型GPT-Rosalind,在多个科研任务中,GPT-Rosalind碾压一众模型,达到了全球顶尖,甚至在部分预测任务上,GPT-Rosalind的表现超过95%人类专家。
OpenAI官方表示,将基于GPT-Rosalind与各大医学药物机构展开合作,帮助研究人员缩短新药研发所需的漫长周期。
8. 腾讯发布首款漫剧制作工业级AI平台
4月16日,腾讯视频正式发布首款面向精品漫剧制作的工业级AI平台——WorkRally(我可接力)。
该平台面向2D/3D动漫,AI仿真人剧等内容,覆盖从剧本解析、分镜生成、内容生产到资产管理与团队协作的漫剧生产完整链路,围绕“专家级Agent、S+级影视动漫技能库、智能流水线”三大核心能力,对内容生产流程进行了整体重构。
热门跟贴