9月19日,阿里云CTO周靖人在云栖大会上发布了新一代开源模型Qwen2.5,该模型包括多个尺寸的大语言模型、多模态模型、数学模型和代码模型。据报道,截至2024年9月,通义千问开源大模型在全球累计下载超过4000万次,成为仅次于Llama的开源大模型群。
针对这一事件,快递100作为大模型落地应用新范式的践行者,提出了三点观察:
第一点观察:大模型的开源和闭源并驾齐驱。自2023年8月以来,阿里千问大模型坚持走开源路线,成为目前中国开发者首选的开源模型,性能直逼Llama3。另一方面,像百度这样坚持闭源路线的公司,其百度文心大模型4.0已经在多个商业化场景中落地应用,例如快递100的AI寄快递功能就是调用了文心大模型4.0的能力。快递100认为,开源和闭源都是大模型值得探索的方向,就像iOS和安卓操作系统一样,大模型的未来走向还处于探索阶段,两种技术路线都值得探索。
第二点观察:AI仍在加速发展。上期百递观察提到,Open AI发布了o1,该模型通过优化算法引入强化学习,提升了慢思考的能力,尽管反应速度有所下降,但逻辑推理质量得到了极大提升。云栖大会上,阶跃星辰的创始人姜大昕特别提出o1的推理能力令人惊艳,月之暗面创始人杨植麟也指出o1提升了AI的上限。这些中国大模型六小虎的创业者对o1的一致肯定和认可表明,基础大模型无论在训练阶段还是在推理阶段,Scaling Law仍在发挥引领作用,大模型仍在加速发展。
第三点观察:基础大模型和大模型应用同等重要。一方面,基础大模型不断升级和提升能力,特别是o1的推出,为中国的基础大模型树立了新的标杆和能力基准,加速了国内基础大模型向o1靠拢的步伐,同时提升了基础大模型的通用能力。另一方面,行业共识认为,大模型如果不与应用结合就没有价值,因此大模型的通用能力必须与具体的商业化场景相结合,才能释放大模型的价值。从去年到今年,可以明显感受到变化,去年大家更多讨论的是大模型的基础能力,而今年则更多关注大模型的应用。随着o1的推出,基础模型能力又引发了新一波的讨论热潮。
快递100作为中国快递物流信息云服务的领导品牌,其优势在于将大模型的基础能力与快递物流信息的基础场景相结合,具体包括查快递、寄快递和管快递的场景,从而更好地赋能消费者,在真实的商业场景中体验到大模型带来的价值。
热门跟贴