首页 AI快讯 中国信通院发布AI大模型基准测试,评估模型能力与安全

中国信通院发布AI大模型基准测试,评估模型能力与安全

A
AI编辑部
· 2026-07-04 · AI快讯 · 来源:INFOQ 1,059 次阅读

中国信通院近日发布了AI大模型基准测试(AIMB),旨在全面评估大模型的能力与安全性。该测试覆盖语言、视觉、多模态等维度,并引入对抗性测试以检验模型鲁棒性。首批测试涵盖GPT-4、文心一言等国内外主流模型,结果将于近期公布。

信通院表示,该基准测试将推动大模型标准化发展,为行业提供客观参考。测试框架基于实际应用场景设计,尤其关注模型在内容安全、偏见等方面的表现,助力AI治理。

📖 阅读本文共 1,059 2026年07月04日 02:50
📱 长按识别 分享给好友~
💬 咨询客服 💬 客服