
观点网讯:11月26日,空间推理基准测试SpatialBench更新了最新一期榜单炒股股票配资网站,千问的视觉理解模型Qwen3-VL、Qwen2.5-VL位列头两名,超越Gemini3、GPT-5.1、ClaudeSonnet4.5等国际顶尖模型。
h榜单显示,Qwen3-VL-235B和Qwen2.5-VL-72B分别斩获13.5和12.9分,领先于Gemini3.0ProPreview(9.6)、GPT-5.1(7.5)、ClaudeSonnet4.5等海外顶尖模型。据悉,Qwen2.5-VL于2024年开源,Qwen3-VL是阿里在2025年开源的新一代视觉理解模型。Qwen3-VL在视觉感知和多模态推理方面实现重大突破,在32项核心能力测评中超过Gemini2.5-Pro和GPT-5,不但可调用抠图、搜索等工具完成“带图推理”,也可以凭借一张设计草图或一段小游戏视频直接“视觉编程”。同时,Qwen3-VL专门增强了3D检测能力,可以更好地感知空间,基于Qwen3-VL,机器人更好地判断物体方位、视角变化和遮挡关系,实现远处的精准抓取。
免责声明:本文内容与数据由观点根据公开信息整理,不构成投资建议,使用前请核实。
恒运资本提示:文章来自网络,不代表本站观点。