【摘要】AI看图能力可能是“演出来的”:它在没看图时,也能答对80% 这一现象已被多项前沿研究所证实——多模态大模型(MLLM)在“未实际接收图像输入”的情况下,仅凭问题文本就能答对高达70%~80%的视觉问答题。这并非模型真的“看懂了图”,而是通过语言先验知识、数据偏差和任务模式识别“演”出了看图能力。这 阅读全文