根据 Information,Meta 正计划在下周推出其即将发布的 Llama 3 的两个小版本,这些模型将作为今年夏天预期推出的 Llama 3 最大版本的先行者,发布这两个小型模型很可能会激发人们对即将推出的 Llama 3 的兴趣,该模型将在去年 7 月推出的 Llama 2 之后约 1 年推出。
Meta 希望 Llama 3 能赶上 OpenAI 的 GPT-4,后者能够基于用户上传到聊天机器人的图片回答问题。最大版本将是多模态的,这意味着它将能够理解和生成文本和图像。
根据 Meta 员工透露,下周将发布的两个小型模型不会是多模态的,较小的模型通常比较大的模型更便宜、运行速度更快,鉴于运行大型模型的成本,这使得它们变得越来越有价值。小型模型对于希望在移动设备上构建人工智能软件的开发者也很有价值。
Meta 此前发布了三个版本的 Llama 2,其中最大的拥有 700 亿个参数,参数是在训练过程中编码模型学习内容的设置。其他两个分别拥有 130 亿个参数和 70 亿个参数,预计 Llama 3 的大版本可能拥有超过 140 亿个参数。
近几个月来,Meta 内部的生成式 AI 部门的员工一直在努力使 Llama 3 在回答有争议的问题上更开放,此前 Meta 的领导认为 Llama 2 在其回答中过于保守。
Reference:
https://www.theinformation.com/articles/meta-platforms-to-launch-small-versions-of-llama-3-next-week?rc=z9mejq
Newin 行业交流群
最新活动
1、AWS 亚马逊云科技将在 2024 年 4 月 17 日下午在杭州举办“大模型电商行业解决方案闭门路演”活动,特邀 AIGC 电商领域初创公司的小伙伴前来参与,招募对象不限融资背景和轮次,产品/服务正在或者有潜力面向电商行业均可报名。
例如,Akool 是一家 2022 年在硅谷成立电商领域 AIGC 初创公司,专门为广告、品牌和电商用户生成营销内容。2023年年中,Akool 与可口可乐公司达成合作,利用生成式 AI 技术为其用于新款饮品宣传的交互式广告提供了底层支持截止 。 2023 年底,Akool 已突破百万注册用户,服务多家世界 500 强企业。
在项目早期,Akool 通过参与 AWS 创业加速器得以用更低的前期成本更快地在云上创建、测试和部署生成式 AI 应用程序。在 AI 业务领域,Akool 利用 Amazon EC2 G5 实例来处理庞大的计算负荷,并采用 Amazon SageMaker 来构建 、训练、优化机器学习算法。基于 NVIDIA GPU 的 G5 实例非常适合于处理机器学习推理和图形密集型计算,加快了内容生成过程,同时最大限度地减少了运营支出,让 Akool 能够在不牺牲性能的情况下大幅提升效率,减少了20%用户排队情况,满足用户多样化的 AI 内容创作需求。
下方小程序扫码报名:
2、 报名方式请点击下方海报:
最新资讯
热门跟贴