大模型视觉测评榜单出炉：Gemini遥遥领先豆包冲进前三

2026-04-23 17:10:42分类：陇南阅读(69875)

快科��日消息，近日，SuperCLUE-VLM多模态视觉语言基准测�月总榜公布。

谷歌的Gemini-3-pro�.64分遥遥领先，字节跳动的豆包大模型�.15分跻身前三，展现出国内大模型的竞争力。

此次测评从基础认知、视觉推理、视觉应用三个维度对多模态大模型进行评估。

榜首Gemini-3-pro在三项细分指标中均表现突出，基础认知得�.01、视觉推�.82、视觉应�.09，全面领先其他模型。

国内阵营中，商汤科技SenseNova V6.5 Pro�.35分位居第二，字节跳动的豆包视觉版紧随其后，其基础认知得�.70，甚至超过部分国际竞品，仅在视觉推理环节稍显短板。

百度ERNIE-5.0-Preview、阿里巴巴Qwen3-vl等国内模型也进入前五，其中Qwen3-vl是榜单中首个开源且总分�的模型。

国际头部模型中，Anthropic的Claude-opus-4-5得�.44，OpenAI的GPT-5.2(high)仅�.16分，排名相对靠后。