Meta发布Llama 4系列AI模型，引入混合专家架构

AI编辑部

· 2026-07-04 · AI快讯 · 来源：INFOQ 988 次阅读

Meta于4月5日发布Llama 4系列AI模型，包括Scout和Maverick两个版本，均采用混合专家（MoE）架构。Llama 4 Scout拥有1090亿参数，由16位专家组成，支持1000万token上下文窗口，可在单张H100 GPU上运行；Llama 4 Maverick同样为170亿激活参数，共17位专家，性能在多个基准测试中超越GPT-4o和Gemini 2.0 Flash。

Meta强调，Llama 4系列在文本、图像和视频理解方面表现卓越，并采用FP8量化技术提升效率。目前，模型已在LM Studio、Ollama等平台开放使用，开发者可通过Hugging Face获取。Meta计划未来推出更大参数的Llama 4 Behemoth，作为训练较小模型的教师模型。