首页 AI快讯 Hugging Face推出SmolVLM2:4B参数小模型

Hugging Face推出SmolVLM2:4B参数小模型性能媲美大型VLM

A
AI编辑部
· 2026-07-04 · AI快讯 · 来源:INFOQ 863 次阅读

Hugging Face近日发布了SmolVLM2系列视觉语言模型,以仅4B参数的规模实现了与大型模型相媲美的性能。该系列包括SmolVLM2-2.2B和SmolVLM2-4B两种版本,在DocVQA、InfoVQA等多项基准测试中表现优异,甚至超越了如Qwen2-VL-7B等更大参数量的模型。

SmolVLM2采用轻量化架构,设计用于高效处理文档、图表和科学图表等视觉任务。其训练数据经过精心筛选,包含5000亿token的文本和文档数据。模型支持多轮对话和多种图像输入,在视频任务上也展现出竞争力。Hugging Face强调,SmolVLM2旨在降低计算成本,使更多开发者和中小企业能够利用强大的视觉语言模型。

📖 阅读本文共 863 2026年07月04日 02:50
📱 长按识别 分享给好友~
💬 咨询客服 💬 客服