Google AI 遇到百年难题:这张图到底是鸭还是兔?
Published by下面这张图,一直持续引发争议。有些人只能看到一只兔子,有些人只能看到一只鸭子,有些人两个都能看出来。
上周四,有位学者决定把这张图片给了谷歌 AI,结果 AI 认为 78% 的概率是一只鸟,68% 的概率是一只鸭子。
Google AI 也被难倒了?
若这张图竖起来给 AI 看,它认为是一只兔子,压根就没有鸭子的事儿。
为了搞清楚这件事,BuzzFeed 的数据科学家 Max Woolf 设计了一个更复杂的实验,他干脆让这张图旋转起来,倒是要看看,Google AI 会有何表现。瞬间成了推特上的热门。这个实验的结果。过程如下所示。红色代表兔子,蓝色代表鸭子。
图片顺时针旋转。 Google AI 最初认为是鸭子,鸭子嘴指向 9 点方向。随着鸭子嘴向上转到 10 点方向,很快 Google AI 就认为画里面是兔子了,直到鸭子嘴转到 2 点方向之后。此后一段时间,Google AI 认为既不是鸭子也不是兔子。一直到 7 点方向,Google AI 再次肯定是一只鸭子。
还有人给了更多类似的挑战图片,想考验一下 Google AI 的水平。比如这种:
以及这种:
大家如果有兴趣,可以自己去尝试。这里用到的 Google AI,实际上是 Google 的 Cloud Vision。这个服务提供了预训练的机器学习模型,可以用来理解图片内容。页面上提供了 Try the API,直接传图就行~
同一张图片,由于位置不同,AI 就产生了不同的判断。也有很多人想到了更多。
网友 sangnoir 认为,纠结图中到底是什么完全没有意义,图像本身中既包含了兔子又包含了鸭子,何必非得让 AI 去做「二选一」的定性呢?
下面这个数字大家都认识,但是旋转起来,到底是几呢? ,图片是「6」还是「9」?
谈到旋转,更进一步,之前有个「旋转舞者」 的问题更困难,下面这个小人到底是顺时针还是逆时针旋转?
实际上,当你视线以从左往右的 方向 扫过这张图时,你看到的是逆时针转圈,反之,当你先看到的是右边时,你眼中的她是顺时针的。在计算机视觉上,还有一个专门的名词解释这个现象,即多稳态/双稳态感知。
有网友表示,这件事恰恰反映了 AI 识别物体的能力已经高于人类了。他认为 Google Cloud Vision 会连续给出不同答案,是因为 AI 系统每隔一段时间就会基于旋转的图像重新判断并实时更新。也有人表示,这件事也启发了视觉从业者反思 AI 识别物体时的方向问题。
而人类的大脑往往就卡在第一印象了,所以才会咬定一个物种不放松。
但是,现在大多数视觉算法都想努力实现某种程度的旋转不变性,还提出了「尺度不变特征转化(SIFT)」等概念。 「不变性」可能也反映了人类的局限性,输入方向也是一个重要考虑因素。