打开网易新闻 查看精彩图片

掌握AIGC脉动,把握科技脉搏。动点科技每天收集汇总全球AIGC进展与热点,每天5分钟带您了解AIGC,希望与您共同玩转 AIGC,解码行业发展新风向,开启智慧新时代!

文 |动点科技

排版|恩惠

本文预计阅读时长5分钟

本期焦点:豆包、英伟达、武大、Google、奔驰

01

字节跳动发布豆包视觉理解、3D生成等新模型

在12月18日举办的火山引擎 Force 大会上,字节跳动正式发布发布豆包视觉理解模型,为企业提供极具性价比的多模态大模型能力。豆包视觉理解模型千tokens输入价格仅为3厘,一元钱就可处理284张720P的图片,比行业价格便宜85%。

此前,豆包视觉理解模型已经接入豆包App和PC端产品。会上,豆包3D生成模型也首次亮相。该模型与火山引擎数字孪生平台veOmniverse结合使用,可以高效完成智能训练、数据合成和数字资产制作,成为一套支持 AIGC 创作的物理世界仿真模拟器。

豆包大模型多款产品也迎来重要更新:豆包通用模型pro已全面对齐GPT-4o,使用价格仅为后者的1/8;音乐模型从生成60秒的简单结构,升级到生成3分钟的完整作品;文生图模型2.1版本,更是在业界首次实现精准生成汉字和一句话P图的产品化能力,该模型已接入即梦AI和豆包App。

另外,火山引擎也升级了火山方舟、扣子和 HiAgent 三款平台产品。其中,火山方舟发布了大模型记忆方案,并推出 prefix cache 和 session cache API,降低延迟和成本。火山方舟还带来全域 AI 搜索,具备场景化搜索推荐一体化、企业私域信息整合等服务。

02

英伟达发布Jetson Orin Nano Super 套件,助推AI 应用开发

英伟达发布新的Jetson Orin Nano Super 套件,与前代产品相比,Jetson Orin Nano Super实现了性能提升,在大语言模型性能上提升了1.37倍到1.63倍,视觉模型性能提升了1.36倍到2.04倍,视觉转换器性能则提升了1.43倍到1.69倍。Nvidia 表示,这款开发套件是构建聊天机器人、视觉 AI 代理以及基于 AI 的机器人的理想选择。

如果你关心硬件,那么配置也相当到位。它搭载了六核Cortex-A78AE CPU,主频达到1.7 GHz,板载8GB内存,并配备了1020 MHz的GPU,拥有1024个CUDA核心和32个Tensor核心,能够提供最高67 TOPS(稀疏)或33 TOPS(密集)的AI算力。自 2019 年推出以来,Jetson Nano 系列一直以其低成本和高性能受到业余爱好者和开发者的欢迎。

03

武汉大学成立人工智能学院,会聚焦四个领域

武汉大学人工智能学院正式揭牌成立,标志着该校在人工智能领域的研究和教育迈上了新台阶。新成立的学院由中国科学院院士、武汉大学校长张平文教授担任首任院长。该学院依托武汉大学丰富的学科资源和重点研究机构,将聚焦于数理基础与数据科学、机器学习与智能科学、智能自然科学和智能社会科学四个领域。

在学科建设和科学研究方面,学院致力于实现 “AI + 理学”、“AI + 工学”、“AI + 医学”、“AI + 人文社科” 等多领域的交叉创新,推动前沿科技的突破与发展。同时,学院的师资队伍建设也在稳步推进,设立了人工智能理论系、人工智能应用系以及人工智能研究院和实验教学中心,未来将通过引育拔尖人才来提升师资水平。

04

AI视频生成技术供应商爱诗科技完成近3亿元A+轮融资

8个月内,爱诗科技完成A2至A4轮融资,总金额近3亿元人民币。此前,A2轮融资由蚂蚁集团投资,近期A3、A4轮融资由北京市人工智能产业投资基金、国科投资及光源资本投资,光源资本继续担任独家财务顾问。融资将主要用于提升技术研发能力、扩展算力资源以及建设人才团队,加速产品功能迭代与市场覆盖,持续推动AI视频生成技术普惠。

截至目前,爱诗科技的核心AI视频生成产品PixVerse全球用户数超1200万,月活跃用户数近600万。自2024年10月PixVerse V3版本发布后,“毒液变身”等创意特效功能席卷海内外社交媒体,为亿万用户提供了前所未有的AI视频生成体验。PixVerse不仅在文生视频和图生视频能力上保持全球领先,还上线了Video to Video(视频生视频)功能,可基于实拍视频或影视片段进行延长生成,进一步拓宽了AI视频创作的可能性。

05

Google 明确只要有人工监督,客户即可在“高风险”领域使用其 AI 作出决策

Google 通过更新使用政策的形式明确表示,只要有人工监督,客户可以在“高风险”领域(如医疗保健)使用其生成式人工智能工具来作出“自动决策”。

根据该公司周二发布的《生成式 AI 禁止使用政策》更新版,客户可以在一定条件下使用 Google 的生成式 AI 作出可能对个人权利产生重大不利影响的“自动化决策”,例如在就业、住房、保险和社会福利等领域。这些决策只要在某种形式上有人类监督,就被允许实施。

在人工智能领域,自动化决策是指 AI 系统基于事实或推断数据作出的决策。例如,AI 可能会根据申请人的数据作出是否批准贷款的决定,或者筛选求职者。

Google 之前的条款草案表示,涉及生成式 AI 的高风险自动化决策应当全面禁止。但 Google 向 TechCrunch 透露,其生成式 AI “实际上从未禁止”过高风险领域的自动化决策,前提是有人工监督。

Google 发言人在接受采访时表示:“人工监督要求一直存在,适用于所有高风险领域。”他补充说:“我们只是对条款进行了重新分类,并更清楚地列举了一些具体例子,目的是让用户更加明了。”

针对那些影响个人的自动化决策,监管机构对 AI 的潜在偏见表示关切。例如,研究显示,用于审批信用和抵押贷款申请的 AI 系统可能会加剧历史上存在的歧视问题。

报道称,因为自动决策系统可能会影响到个体,监管机构对此类人工智能系统的潜在偏见问题表示关注。研究表明,用于信用和抵押贷款审批的人工智能系统可能会加剧历史上的歧视问题。

06

Hey Mercedes:奔驰免费升级 MBUX 语音助手,邀 300 万车主体验 ChatGPT 车载聊天

梅赛德斯-奔驰(Mercedes-Benz)昨日(12 月 17 日)发布博文,宣布即日起,超过 300 万车主可以通过 MBUX 语音助手,和 ChatGPT 展开 AI 聊天。该功能利用微软必应搜索引擎获取最新信息,并通过微软 Azure OpenAI 服务中的 ChatGPT 技术生成自然语言回复。车主可以提问各种问题,涵盖流行文化、地理、科学、健康和历史等领域,而且系统具备上下文理解能力,可以根据之前的对话内容进行更精准的回复;用户还可以通过语音助手查询天气、股票、新闻和体育赛事等日常信息。此次更新标志着 ChatGPT 技术首次应用于梅赛德斯-奔驰的量产车型,用户只需说出“Hey Mercedes”即可激活语音助手,首批支持德语、英式英语和美式英语三种语言,其他市场的用户可以通过更改系统语言进行体验。

07

OpenAI 称目前尚无推出视频生成模型 Sora API 的计划

OpenAI 今日表示,目前没有推出其视频生成模型 Sora 的应用程序接口(API)的计划,该模型可基于文本、图像生成视频。在 OpenAI 开发团队成员的在线问答活动中,OpenAI 开发者体验负责人 Romain Huet 明确指出:“我们目前还没有推出 Sora API 的计划。”

本文为动点科技整理,未经授权不得转载,如需转载或开白请在后台回复“转载”。

- - - - - - - - END - - - - - - - -

*想要获取行业资讯、和志同道合的科技爱好者们分享心得,那就赶快扫码添加“动点君”加入群聊吧!群里更有不定期福利发放!

精彩好文值得推荐!

一键转发,戳个在看!