Meta于4月5日发布Llama 4系列AI模型,包括Scout和Maverick两个版本,均采用混合专家(MoE)架构。Llama 4 Scout拥有1090亿参数,由16位专家组成,支持1000万token上下文窗口,可在单张H100 GPU上运行;Llama 4 Maverick同样为170亿激活参数,共17位专家,性能在多个基准测试中超越GPT-4o和Gemini 2.0 Flash。
Meta强调,Llama 4系列在文本、图像和视频理解方面表现卓越,并采用FP8量化技术提升效率。目前,模型已在LM Studio、Ollama等平台开放使用,开发者可通过Hugging Face获取。Meta计划未来推出更大参数的Llama 4 Behemoth,作为训练较小模型的教师模型。