这里是“AI新榜”的月更栏目:AIGC月刊。每月更新,以下是我们梳理汇总的2024年9月AIGC行业趋势、AI热点要闻、新上线的AI工具和AIGC热门应用案例。希望能带给你一些启发和思考,也欢迎在评论区和我们交流你的所思所想。
9月AIGC行业趋势
1. “智能时代”即将到来
人类正在进入一个由人工智能驱动的新时代。
OpenAI首席执行官Sam Altman在近期发表的文章《The Intelligence Age》提到,“智能时代”(Intelligence Age)即将到来,人工智能将在“未来几十年”带来巨大的经济收益。他预测AI系统将很快成为个人助理,提供定制教育,甚至帮助医疗保健,最终AI系统甚至可能独立完成科学发现。
不过这样的“超级智能AI”(Superintelligent AI)可能需要更长的发展周期,但Sam Altman预估它会在未来“几千天内”出现。
可以看到的是,作为推动AI发展的核心动力,深度学习技术正在持续进步。OpenAI新发布的o1模型标志着AI推理能力的重大突破,未来几年内,o1可能将发展到与GPT-4相当的水平。
除了模型层,智能硬件方面也迎来了突破迭代。Meta计划为Ray-Ban智能眼镜增加AI新功能,如拍照提醒和实时翻译,未来还计划增加实时视频处理功能。这表明AI技术正在与我们的日常生活深度融合,提供更智能化和便捷的体验。
Sam Altman博客:https://ia.samaltman.com/
2. 影视行业加速拥抱AI
AI视频模型在9月持续爆发。MiniMax、阿里通义万相、字节豆包等公司都发布了新的视频生成模型,Adobe也宣布计划在今年内推出Firefly文生视频模型。当前全球短视频市场需求不断增长,这意味着编辑、电影制作人或内容创作者需要在更短的时间内完成更多工作。Adobe表示,引入生成式AI可以让创作者更轻松、更快速地完成工作。
值得一提的是,越来越多的影视从业者开始拥护AI了。
9月9日,快手宣布启动“可灵AI”导演共创计划,李少红、贾樟柯等9位导演将依托可灵AI的技术能力,制作出品9部AIGC电影短片。随后,蓝色光标公司宣布其自研的AI行业模型Blue AI心影创作平台将首批接入可灵AI视频大模型API。
海外AI厂商与影视公司的合作也提上了日程。Runway宣布与狮门影业达成合作,将使用狮门影业的影片目录训练一个定制视频模型,这一消息在好莱坞引起震动。此外,Runway宣布设立一个500万美元的基金,旨在资助多达100部使用其AI视频模型的电影项目。
9月底,好莱坞知名导演詹姆斯·卡梅隆官宣加入Stability AI董事会。AI真的要颠覆影视行业了吗?
尽管AI视频生成技术仍存在技术上的限制,劳工罢工等忧虑未彻底解决,但随着技术创新更迭,AI将对影视内容的创作、制作和分发方式产生深刻影响,新的讲故事的方式已经在路上了。
你可能错过的10大AI热点
1. MiniMax发布AI视频生成模型
8月31日,MiniMax发布首款AI高清视频生成模型技术abab-video-1。随后,海螺AI网页端上线视频创作功能,用户可在首页点击“创作视频”,即可限时免费用文本生成视频。
MiniMax创始人闫俊杰表示,后续会在数据、算法本身进行更新迭代,比如现在只提供了文生视频,未来或将提供图生视频、文+图生成视频、可编辑、可控性增强等。
海螺AI地址:https://hailuoai.com/
2. Apple Intelligence中文版明年上线
9月10日,在iPhone 16系列发布的同时,苹果重点强调了全新的Apple Intelligence。今年12月,Apple Intelligence将先以美国英语版本进行测试,中文、法语、日语和西班牙语版本将于明年推出,届时国行版iPhone将会体验到苹果AI功能。
3. 消息称字节跳动正在探索AI耳机、眼镜等智能硬件
9月11日,据晚点LatePost消息,字节跳动仍然没有放弃对硬件的探索,并尝试将大模型和硬件结合,既自己开发AI硬件,也会与外部硬件公司合作。报道称,字节跳动AI硬件团队第一款自研产品为智能耳机,该产品将植入豆包大模型,并与对话类AI应用豆包App结合,戴上智能耳机后,用户可通过语音对话随时使用豆包。
4. OpenAI发布全新o1模型
9月13日,OpenAI发布全新模型o1预览版,即之前被多次曝光的“草莓”。据介绍,o1是第一个具备推理能力的模型,能够解决编程和数学等复杂问题。不过o1暂不具备浏览网页、处理文件和图像等功能,短期内GPT-4o的能力更强大,但o1代表了AI能力的新水平。
目前,o1-preview已面向ChatGPT Plus、Team用户、企业用户开放。另一款更小、更高效、成本更低的版本o1 mini也同步上线,计划向所有免费用户开放。
5. 网信办发布《人工智能生成合成内容标识办法(征求意见稿)》
9月14日,国家互联网信息办公室发布关于《人工智能生成合成内容标识办法(征求意见稿)》公开征求意见的通知。其中第四条提到,服务提供者提供的生成合成服务属于《互联网信息服务深度合成管理规定》第十七条第一款情形的,应当按照下列要求对生成合成内容添加显式标识。
(一)在文本的起始、末尾、中间适当位置添加文字提示或通用符号提示等标识,或在交互场景界面或文字周边添加显著的提示标识; (二)在音频的起始、末尾或中间适当位置添加语音提示或音频节奏提示等标识,或在交互场景界面中添加显著的提示标识; (三)在图片的适当位置添加显著的提示标识; (四)在视频起始画面和视频播放周边的适当位置添加显著的提示标识,可在视频末尾和中间适当位置添加显著的提示标识; (五)呈现虚拟场景时,应当在起始画面的适当位置添加显著的提示标识,可在虚拟场景持续服务过程中的适当位置添加显著的提示标识; (六)其他生成合成服务场景应当根据自身应用特点添加具有显著提示效果的显式标识。
此外,全国网络安全标准化技术委员会于9月9日发布了《人工智能安全治理框架》1.0版。
6. 腾讯元器支持打造公众号专属AI智能体
目前,腾讯元器AI智能体已支持配置到公众号。公众号运营者可在腾讯元器上低门槛创建专属智能体,授权公众号历史文章到知识库,一键配置到公众号内,为用户提供陪伴、互动、答疑、知识交流等功能,提升公众号用户体验和公私域运营效率。
腾讯元器官网:yuanqi.tencent.com
7.操控1327个AI美女账号屠版小红书?假的
近期,批量生产的AI美女占领小红书的消息在业内炸开了锅。有网友在群聊中宣称,自己用账号矩阵管理软件操控1327个账号,直接屠版小红书,而且推送系统不仅没识别出来,还帮着推流。
但据“AI新榜”求证,这条消息已经被小红书官方辟谣。网上还传出了一张疑似造谣当事人写的“保证书”。
与AI批量生产内容相关的事件,向来受到行业关注。借助AI运营大量矩阵号来获取流量收益的案例,此前也有不少。比如近期同样受到关注的《起底自媒体界的“江西帮”:批量起号,AI放量,甲方最爱》一文中提及,有机构被曝利用AI,每天生成4000-7000篇营销号文章,日赚过万。
这些再次引起了人们对AI技术滥用、内容真实性以及法律监管等问题的讨论。
8. ChatGPT高级语音模式逐步开放
9月25日,OpenAI宣布将在一周内向ChatGPT Plus和Team付费用户逐步推出“高级语音模式”(Advanced Voice Mode,简称AVM)。除了最初的功能之外,OpenAI还增加了“自定义指令”、记忆功能、五种新语音和改进的口音支持,以及50多种语言(支持中文模式)。
9. OpenAI首席技术官Mira Murati辞职
9月26日,OpenAI首席技术官Mira Murati在X发帖宣布辞职。她在辞职信中写到,她为在OpenAI团队工作六年半感到荣幸,离开OpenAI是因为希望腾出时间和空间做自己的研究。
与此同时,Sam Altman以公开信方式宣布另外两位OpenAI核心技术人员Bob、Barret也将离开公司。此前GPT-4o实时音频项目负责人Alexis Conneau已宣布离职创业。目前,OpenAI创始团队的11人中,只剩下两人还留在OpenAI。
10. “三只羊录音门”音频为AI伪造
9月26日,合肥警方就“三只羊集团创始人卢文庆录音事件”发布通报,称这条广为流传的音频为AI生成,犯罪嫌疑人已经被依法采取刑事强制措施。次日,一家AI公司“发布声明”称这条音频内容是嫌疑人通过自家研发的AI配音大模型制作的,引起热议,网友称之为“自杀式营销”。
新上线的10个AI工具/功能
1. 小红书群聊上线“AI声聊”功能
近期小红书上线了“AI声聊”功能,点击群聊底部输入框的+号,即可看到“AI声聊”入口,用户可以选择不同的AI音色变声,支持发送语音和唱歌,和群友一起玩角色扮演。
2. 阿里通义万相支持文生视频、图生视频
9月19日,通义万相Wanx视觉生成大模型全新升级,除了此前的文生图能力,通义万相现已支持文生视频、图生视频等,还有插画设计、涂鸦作画、局部重绘、短片创作、配乐生成等场景化能力。
体验地址:https://tongyi.aliyun.com/wanxiang/
3. 昆仑万维推出AI音乐创作平台“音疯”
昆仑万维近日推出AI音乐创作平台“音疯”,用户只需输入歌词,即可一键生成原创歌曲,或通过提供参考音乐来创作风格相似的作品。音疯支持多种音乐风格,提供创作灵感,并且支持创作者将作品上架销售,获得收益。目前注册用户每日可免费生成6首歌曲。
音疯官网:https://www.yinfeng.cn/create
4. 支付宝推出AI生活管家App“支小宝”
9月5日,支付宝发布AI生活管家App“支小宝”,目前在苹果及安卓应用商店均可下载。“支小宝”是服务型AI独立App,连接支付宝生态,可通过对话快速订票、点餐、打车、查询附近吃喝玩乐等;同时“支小宝”拥有场景感知系统,能根据用户的生活习惯和使用场景,智能推荐专属的服务。
支小宝下载:https://www.zhixiaobao.com/
5. Vidu发布“主体参照”视频生成新功能
9月11日,Vidu宣布推出“主体参照”视频生成新功能,用户上传单一主体图片,如真人、2D或3D角色,生成的视频可以保持这些主体角色的一致性,并支持对角色的面容、衣物特征进行控制。此外,Vidu API正式开放。
Vidu官网:https://www.vidu.studio/
6. 夸克发布全新智能对话助手CueMe
9月12日,夸克发布全新智能对话助手CueMe。据介绍,CueMe是基于夸克大模型自主研发的,AI写作能力突出,支持上千种不同体裁的写作需求,还支持文章风格定制,可生成最长2万字的内容。
CueMe官网:cueme.cn
7.谷歌AI笔记应用新增Audio Overview功能
9月12日,谷歌AI笔记应用NotebookLM宣布将上线“Audio Overview(音频概览)”功能,可以围绕用户上传的文档,如笔记、论文或研究报告等,生成音频概述,同时生成两位AI主播展开讨论,类似于迷你播客。目前音频对话仍处于测试阶段,对话中可能存在一些不准确之处。
NotebookLM官网:https://notebooklm.google.com/
8. Suno发布“Cover Song”功能
9月13日,AI音乐生成工具Suno AI发布“Cover Song”功能,允许用户用自己的声音创建AI音乐。用户只需录制一段自己的干音,并输入提示词,Suno会将相应的歌声变成完整的歌曲。
Suno官网:https://suno.com/
9. 可灵AI发布1.5模型,新增“运动笔刷”
9月19日,快手可灵AI面向全球发布可灵1.5模型,新增“运动笔刷”功能。“运动笔刷”功能可为图片中的元素(人或物体等)指定运动轨迹,还支持额外指定静止区域,提升画面可控性。
同时,可灵AI的视频画质有所提升,支持生成1080p视频,还有构图更美观、动作更合理、文本相关性提升。
可灵AI官网:https://klingai.kuaishou.com/
10. 豆包视频生成大模型开启内测申请
9月24日,豆包视频生成模型正式发布,包括PixelDance、Seaweed两款大模型,面向企业市场开启邀测,目前用户可在“即梦AI”申请内测体验。据介绍,豆包视频生成模型基于DiT架构,让视频在大动态与运镜中自由切换,拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力,能够实现自然连贯的多拍动作与多主体复杂交互。
豆包视频生成模型内测申请:https://bytedance.larkoffice.com/share/base/form/shrcnTPmPPxn9j6bw2AH3kdP6Fd
3个AIGC热门案例
1. AI聊天软件LoveyDovey成为追星梦女新宠
最近,一款打着“新的梦女福音”旗号的AI聊天软件“LoveyDovey”在小红书热度悄然升高,有网友评价其为“日韩角色模拟天花板”。
这款来自韩国的AI聊天应用中文名为“卿卿我我,情意绵绵”。你可以与别人捏的AI角色聊天,也可以自己捏OC(Original Character, 原创角色)。和角色聊天可以提升好感度,有三种聊天模式可选:短句模式、长句模式和R18模式,分别消耗不同数量的果酱。使用果酱,可以查看角色内心所想,不少用户分享自己的邀请码以获取果酱,App借此实现低成本纳新。
2. 在《我的世界》构建世界首个AI文明
9月初,AI创企Altera的创始人Robert Yang在X上发布了项目“Project Sid”的演示视频,号称是“世界上首个AI文明”,目前播放量超88万次。
视频显示,这个世界有着人类社会的结构体系:有政府、警察以及宗教机构,甚至还有对应的“宝石”来作为货币交易体系。有超过一千个不同身份的智能体“居住”在这个世界中,每个智能体都有自己的姓名、特长与爱好,它们能搭建自己的房屋、互相沟通交流,自给自足满足基本的生存,并齐心协力抵御怪物入侵。
此外,Altera推出了可以陪玩《我的世界》的AI智能体“Altera Bots”,目前已向公众开放,不仅支持用户自定义智能体,还允许用户使用其他玩家创建的智能体来陪自己玩游戏。
相关链接:https://playlabs.altera.al/discover
3. AI版推特引发热议
一款号称“和百万粉丝聊天”的AI社交应用Social AI近期在海外悄悄走红,上线苹果应用商店3天用户量激增。与X类似,它允许真人用户在平台上发布内容,但所有的评论、点赞以及互动都是由AI生成的虚拟回应。就连粉丝也是支持用户根据喜好自由定制的虚拟粉丝,如“支持者”“乐观者”“批评者”“怀疑论者”等多种人设。
X博主“GREG ISENBERG”分享了他使用这款AI社交应用的体验,他认为这款应用“很容易上瘾”,因为社交媒体的残酷真相是:大多数人的声音并未被听见,他们对着虚空尖叫但没有人在意。目前该条推文浏览量超85万。
SocialAI App下载:https://apps.apple.com/us/app/socialai-ai-social-network/id6670229993
AIGC有哪些新应用新玩法?| 9月复盘
「AI新榜交流群」进群方式:添加微信“banggebangmei”并备注姓名+职业/公司+进群,欢迎玩家们来群里交流,一起探索见证AI的进化。
欢迎分享、点赞、在看
一起研究AI
热门跟贴