微软连发3款Phi-3.5模型：128K上下文，首用MoE架构，部分性能超GPT-4o mini|gpt-4|mini|phi|上下文|微软|财务会计|财务报表

智东西8月21日消息，今天，微软一口气甩出3款超强轻量级模型！

微软本次发布的轻量级模型系列名为Phi-3.5，适合在内存和算力受限的环境中运行，均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务，Phi-3.5-MoE-instruct可胜任复杂推理任务，Phi-3.5-vision-instruct则兼具文本与视觉能力。

性能最强大的Phi-3.5-MoE-instruct模型有419亿个参数，在5个示例的MMLU测试中击败了GPT-4o mini。这是微软首次使用混合专家模型架构。

这一模型系列中最小的Phi-3.5-mini-instruct在长上下文代码理解任务以明显优势击败Llama-3.1-8B-instruct和Mistral-7B-instruct，而其参数规模还不到Llama-3.1-8B-instruct的一半。

微软本次发布的3款模型的名字中都带有“instruct”，这意味着模型专门针对遵循用户指令进行了优化，这对端侧模型来说是项极为重要的技能。

微软在开源模型库Hugging Face上详细公布了这3款模型的炼制过程，包括数据来源、数据规模、算力等等。3款模型均在MIT协议下开源，开发者可以自由使用、修改或出售软件副本。

项目地址：https://huggingface.co/microsoft/Phi-3.5-mini-instruct

一、连发三款轻量级模型，击败GPT-4o mini与Llama 3.1-8B

微软今天发布的3个Phi-3.5模型包括用于基础快速推理的Phi-3.5-mini-instruct（38.2亿个参数）、性能更为强大的Phi-3.5-MoE-instruct（419亿个参数）和视觉模型Phi-3.5-vision-instruct（41.5亿个参数）。

1、Phi-3.5-mini-instruct：A16芯片本地可跑

Phi-3.5-mini-instruct专为遵守指令而设计，此模型非常适合在内存或算力受限的环境中提供强大推理能力，能胜任代码生成、数学问题和基于逻辑的推理等任务。

尽管参数规模仅有38.2亿，但Phi-3.5-mini-instruct模型在多语言和多轮对话任务中表现出的性能不俗。它在许多基准测试中拥有较为先进的水平，并在长上下文代码理解任务中以明显优势超过了其它模型（Llama-3.1-8B-instruct和Mistral-7B-instruct）。

▲Phi-3.5-mini-instruct在长上下文代码理解任务中优势明显（图源：微软）

微软并未直接阐明Phi-3.5-mini-instruct能否在手机上运行，但与其参数规模的基本一致的Phi-3-mini在经过4位量化后，能在搭载A16仿生芯片的iPhone上流畅运行，生成速度超过每秒12个token。

2、Phi-3.5-MoE-instruct：微软首个专家混合模型

Phi-3.5-MoE-instruct是微软首个专家混合模型。这类模型将多种功能不同的模型组合起来，每种模型专注于特定的任务。

这款模型利用了具有419亿个激活参数的架构，但根据微软在Hugging Face上公布的文档，这一模型仅需66亿激活参数即可运行。

Phi-3.5-MoE-instruct在各种推理任务中表现出色，在代码、数学和多语言语言理解方面具有强大的性能，超过了参数规模更大的其它开源模型。