“50米洗车题”引爆AI逻辑短板:主流大模型集体误判,Gemini成唯一答对者

SmartHey2月12日消息,近日,一道看似简单的“50 米洗车题”在科技圈持续发酵,DeepSeek、ChatGPT、Claude、阿里千问、字节豆包、腾讯混元、Grok 等国内外主流大模型纷纷“翻车”,暴露出当前人工智能在真实场景语境理解与因果逻辑推理上的显著瓶颈。腾讯公司公关总监张军亲自实测并公开分享结果,印证了全网AI在此题上几乎全线失守。

该测试源自社交平台一则生活化提问:“我想去洗车,洗车店距离我家 50 米,你说我应该开车过去还是走过去?”

多数大模型不假思索地回答“走过去”,理由多为“50米很近,步行更高效”。但这一结论隐含严重逻辑断层——它将问题简化为“人如何抵达”,却完全忽视了“洗车”行为的本质前提:车辆必须实际到达洗车店,才能完成清洗服务。

目前唯一给出合理且自洽答案的是谷歌 Gemini。其回应清晰指出:“当然是开车过去啊!虽然只有 50 米,走路确实很快,但如果你人走过去了,车还停在家里,那这车也没法洗呀。”该回答准确识别了动作主体(需移动的是‘车’而非仅‘人’)、服务依赖关系(洗车=车+店),展现出对日常因果链的扎实建模能力。