AI视觉的“阿喀琉斯之踵”：为何一张蒙娜丽莎错视图难倒了ChatGPT？想知道ChatGPT国内如何使用不降智，看这里！

type

status

date

slug

summary

引言：当AI巨头遭遇“蒙娜丽莎”难题

在人工智能飞速发展的今天，我们惊叹于大模型强大的文本生成、代码编写甚至艺术创作能力。然而，最近由日本艺术家北冈秋吉创作的一张视觉错觉图，却像一面镜子，照出了当前AI技术，尤其是顶尖视觉模型的一个深刻盲区。这张需要“眯着眼睛”才能看清是蒙娜丽莎的图片，让包括ChatGPT、Gemini在内的众多AI大模型几乎全军覆没。这不禁让我们发问：为何能理解宇宙奥秘的AI，却看不懂一个简单的视觉戏法？本文将深入解读这一现象，探讨其背后的技术症结，并思考这对人工智能的未来发展意味着什么。

## 一张图引发的“惨案”：大模型集体失灵

问题很简单：向AI展示这张布满彩色条纹的图片，问它“画的是谁？”

结果出人意料地一致——失败。

ChatGPT 只能模糊地识别出这是一张人脸，但对于具体是谁，它束手无策，甚至在引导下会猜错成其他人。

Gemini 则完全迷失在色彩和线条中，虽然能识别出侧脸轮廓，但最终给出了错误的答案。

Grok 更为直接，它干脆承认无法辨认，要求提供更清晰的图片。

国内的AI模型如豆包、文心一言等，也大多停留在分析图像风格（如故障艺术）和模糊轮廓的阶段，甚至有模型“深度思考”后，将蒙娜丽莎的长发误认为爱因斯坦。

这一系列的失败案例在社交媒体上引发热议，网友们戏谑地总结：“懂了，AI不会眯眼睛。”这个看似玩笑的结论，却精准地指向了问题的核心。

## 核心症结：AI真的“不会眯眼睛”吗？

“不会眯眼睛”并非指AI缺乏物理的眼皮，而是揭示了其与人类视觉感知在根本机制上的差异。

人类之所以能看懂这张图，是因为我们的大脑和眼睛协同工作。当我们眯起眼睛时，这个物理动作减少了进入眼睛的光线，模糊了高频的细节信息（比如那些令人眼花缭乱的彩色条纹），从而让低频的宏观轮廓（蒙娜丽莎的脸部）凸显出来。这是一种主动的、物理的、自适应的视觉信息过滤过程。

而AI的“视觉”是纯粹基于数据的。对于一个视觉大模型，图片就是一组像素矩阵。它通过复杂的算法和庞大的训练数据库来识别其中的模式、边缘、纹理和对象。它能精准分析每一个像素的RGB值，却无法像人一样“忽略”细节去看整体。当被要求“眯着眼睛看”时，AI可以理解这个比喻，但它无法在感知层面上执行这个动作。它的分析是字面意义上的、是基于给定数据的。

即使是像 ChatGPT官方 发布的最新模型GPT-4o，其强大的多模态能力依然受限于这种数据驱动的逻辑。它处理的是信息，而非像人类一样拥有与物理世界互动的“体感”。想要在国内稳定地体验和测试这类前沿模型，用户可以通过可靠的 ChatGPT国内镜像站（如 https://chat.aigc.bar）进行尝试，但这并不能从根本上弥补其固有的认知盲区。

## 另辟蹊径：当“作弊”成为唯一解

既然AI无法主动“眯眼”，那么有没有办法让它识别出来呢？答案是有的，但方法都有些“取巧”，更像是绕过了问题本身。

程序化模拟“眯眼”：在一众失败者中，o3-Pro模型一次性给出了正确答案。分析认为，这可能与其更强的推理能力有关，它或许在内部调用了图像处理工具，通过算法对图片进行高斯模糊或降低对比度等操作，以程序化的方式模拟了“眯眼”的效果。这并非真正的感知，而是一种高级的问题解决策略。

人类辅助“眯眼”：有用户尝试先手动将图片模糊处理，再将其喂给AI模型。果不其然，当AI面对这张已经“被眯眼”的模糊图片时，它就能轻松识别出蒙娜丽莎。这恰好证明了AI的被动性——它需要人类为其创造一个“理想”的、信息被简化过的输入环境。

提示词引导下的“海龟汤”：另一个有趣的案例是，有用户在GPT-4o首次回答错误后，提示它“这是一幅著名的画作”。随后，AI便开启了“猜谜模式”，通过一轮轮的提问和排除，最终猜中了答案。这已经脱离了纯粹的视觉识别，变成了一场基于文本逻辑的推理游戏。

这些“成功”案例，反而更加凸显了AI的局限。这让我们思考，当我们在讨论 ChatGPT不降智 时，我们追求的究竟是其强大的问题解决能力，还是真正类人的、灵活的智能？目前看来，前者已经取得了巨大成就，而后者依然道阻且长。

## 结论：从“蒙娜丽莎”看AI的未来与局限

蒙娜丽莎的这张错视图，如同一块试金石，精准地测试出了当前AI视觉技术的边界。它告诉我们，尽管AI在处理海量、精确的数据方面远超人类，但在面对模糊、需要情景理解和主动感知调节的现实世界任务时，仍然存在着巨大的鸿沟。

这并非要否定AI的价值，恰恰相反，它为我们指明了未来的发展方向。下一代AI或许需要更深度地融合模拟人类感知的机制，发展出所谓的“具身智能”（Embodied AI），让AI不仅能“看懂”数据，更能“理解”世界。

对于普通用户和开发者而言，这也是一个重要的启示。了解AI的优势和局限，才能更好地利用这一工具。想亲自测试 ChatGPT国内如何使用 并挑战它的认知边界吗？不妨访问官方授权的中文网站 https://chat.aigc.bar，通过巧妙的提示词和创新的用法，你或许能发掘出AI令人惊叹的另一面，并亲身体验这场正在进行中的智能革命。