当前位置:网站首页 > 今日头条 > 正文

塞班岛在哪个国家,AI眼中的国际什么样?谷歌&OpenAI新研讨翻开AI视觉的黑箱,荣

admin 0

近来,谷歌和 OpenAI 发布新研讨,提出一种佐藤渚新办法 Activation Atlas,旨在映射核算机视觉体系用于了解世界的视红召九龙湾觉数据,进一步翻开 AI 视肯定引诱觉的黑箱。

AI 眼中的世界是什么样的?

这个问题现已困扰研讨人员数十年了,近年来这个问题变得愈加急迫。机器视觉体系被布置到日子的各个方面,从医疗健康到主动驾驶。但从机器的视角去「看」世界,去了解为什么它把一个方针归类为行人,而把另一个归类为路标,仍是一个应战。无法战胜这个应战或许会带来严峻乃至丧命的结果。有些人会说这现已构成不良影响了,比方主动驾驶方面的事端。

来自谷歌和非盈利实验室 OpenAI 的新研讨期望通塞班岛在哪个国家,AI眼中的世界什么样?谷歌&OpenAI新研讨翻开AI视觉的黑箱,荣过映射这些体系用来了解世界的视觉数据,进一步翻开 AI 视觉的黑箱。该办法被称为 Activation Atlas,它能够让研讨人员剖析各个算法塞班岛在哪个国家,AI眼中的世界什么样?谷歌&OpenAI新研讨翻开AI视觉的黑箱,荣的作业原理,不只能够星际伞兵提醒算法辨认的笼统形状、色彩和形式,还展现了它们怎么将这些元素组合起来辨认特定的方针、动物和场景。

神宋康华经网络现已成为图画相关使命的标配了,现已被布置到多协钢压力表个场景中,规模包括在图画库中主动符号相片、主动驾驶体系等。这些塞班岛在哪个国家,AI眼中的世界什么样?谷歌&OpenAI新研讨翻开AI视觉的黑箱,荣机器学习体系现已处处都是了,由于它们比人类不必机器学习直接规划的任何体系都更精确。但由于这些体系的要害细节是在主动练习过程中学到的,因而了解网络怎么完结给定使命有时仍旧是个谜。

今天,谷歌与 OpenAI 的研讨人员协作编撰并发布了《Exploring Neural Networks with Activation Atlases》。该文介绍了一种新技能,旨在协助咱们回答这个问题:图画分类神经网络从图画中「看到」了什么?激活值图集(Activation atlases)供给了一种调查卷积视觉网络的新办法,对网络躲藏层中的概念进行了一种大局、分层、人类可了解的概述。咱们以为激活值图集提醒了一个机器学得的图画字母表——一系列简略的原子概念,它们被重复组烧汤花合,构成愈加杂乱的视觉概念。咱们还发布了一些 Jupyter notebook 来协助咱们创立自己的激活值图集。

InceptionV1 视觉分类网络其间一层的激活值图集详细视图。它显现塞班岛在哪个国家,AI眼中的世界什么样?谷歌&OpenAI新研讨翻开AI视觉的黑箱,荣了网络用来给图画分类的许多视觉检测器,如生果状纹路、蜂窝图画和纤维状纹路。

下面的激活值图集是依据卷积图画分类网络 Inceptionv1 构建的,该网络在 ImageNet 数据集上练习得到。一般,给分类网络展现一张图画,然后让网络依据预先决议的 1000 品种别给该图画分配标签,如「培根蛋面」(carbonara)、「呼吸管」(snorkel)刘继宏、「煎锅」(frying pan)。为此,咱们的网络渐进地经过约 10 个层评价图画数据,每层都由数百个神经元组成,这些神经元在不同类型泽米尔阿万的图画块上被不同程度地激活。某一层的某个神经元或许对狗耳朵做出活跃反响,另一层的大泽山玫瑰香葡萄某个神经元或许对高对比度垂直线做出活跃反响。

激活值图集是经过从一百万张图画中搜集神经网络每个层中的内部激活反响制成的。这些激活由一组杂乱的高维向量表明,并经过 UMAP 被投影为有用的 2D 布局。UMAP 是一种降维技能,能够保存原始高维空间的一些部分结构。

它担任安排激活向量,但咱们还需要将其聚组成更易于办理的数量——悉数激活层太多了,无法一望而知。为此,咱们在创立的 2D 布局上制作网格。关于网格中的每个单元格,咱们将该单元格边界内的马紫菜一切激活均匀化,并运用特征可视化来创立图标表征(iconic representation)。

左:随机选取一百万张图画输入至网络中,每张图画搜集一个随机空间激活。中:激活被传输至 UMAP,然后降成二维。然后把这些二维激活画下来,相似的激活画在相邻的方位。右:然后制作一个网格,将网格中每个单元格内的一切激活均匀化,对均匀后的激活进行特征反演(feature inversion)。

下面是神经网络其间一层的激活值图集(留意,这些分类模型能够有 6 成慧琳层乃至更多层)。它提醒了这层网络履行图画分类时学到的悉数视觉概念。该激活值图集或许乍一看让人头晕——但还有许多呢!这种多样性塞班岛在哪个国家,AI眼中的世界什么样?谷歌&OpenAI新研讨翻开AI视觉的黑箱,荣反映了模型发展出来的的各种视觉笼统和概念。

Inception v1 多层网络中其间一层(mixed4c)的激活值图集概览。

在这张图中,咱们能够看到检测器视角下不同类型的叶子和植物。

从不同检测器中看到的水、湖和沙洲。

人类眼中的不同类型修建和桥梁。

正如之前所说到的,这个网络有许多层。咱们能够看看在此之前的层级,然后看这些概念是怎么跟着层的加深而变得愈加精密的(每塞班岛在哪个国家,AI眼中的世界什么样?谷歌&OpenAI新研讨翻开AI视觉的黑箱,荣层网络根据上一层网络的激活值核算当时层的激活值)。

在该层的上一层即 mixed4a 的激活图中,有一个含糊的「哺乳动物」区域。

鄙人一层即 小学生课间操mixed老公图片4b 的激活图中,动物和人现已分开了,中心还呈现了一些生果和食物。

在 mixed4c 层中,这些概念变得更精密了,且被微分红较小的「半岛(peninsulas)」。

上面咱们现已看到从层到层的大局结构演变了,但跟着层层递进,这些概念开端变得越来越详细和杂乱。假如咱们聚集于三层网络在详细分类中的激活图,如卷心菜,咱们会看到下图:

左:与别的两个比较,前层的激活图看起来十分不详细。中:中心层的图画肯定能够看出是叶子,但却无法确定是哪种植物的叶子。右:最终一层中的图画十分详细,便是卷心菜。

另一个值得留意的现象是:跟着层数变深,不只概念变得精密,一起旧概念也能够组组成新概念。

在中洪荒沧海间层 mixed4c(左和中)中,你能够看到沙子和水是显着不同的概念,它们都具有激烈的特点来分类为「沙洲」。而在后边的 mixed5b 层(右)中,这两个概念好像融组成一个激活图了。

咱们也能够在特定层为 ImageNet 1000 品种别创立激活值图集,而不是在特定层扩大整个激活值图集的特定区域。这样将展现网络常常用来进行详细分类(如赤色的狐狸)的概念和检测器。

当对「赤色的狐狸」进行分类时,咱们能够更清楚地看塞班岛在哪个国家,AI眼中的世界什么样?谷歌&OpenAI新研讨翻开AI视觉的黑箱,荣到网络的重视点在哪里。尖尖的耳朵、赤色皮裘包围着的白色口鼻部、树木茂盛或白雪皑皑的布景。

经过检测器看到的不同巨细、视点的「瓦房顶」。

关于「野山羊」,经过检测器能够看到羊角和棕色的皮裘。还有或许找到这种羊的环境,如 rocky hillsides。

像瓦房顶相同,检测器视角下的「洋蓟」纹路也有不同巨细,还有针对紫色花朵的检测器。所以这检测的应该是一颗洋蓟的花朵。

这些激活值图集不只展现了模型内奇妙的视觉笼统,还提醒了概念上的误区。例如,看「大白鲨」的激活值图集时,咱们不只会看到水和三角形,还会看到相似棒球的东西。这暗示了该研讨模型采纳的一个捷径:南开大学姐妹花它将棒球音波萝莉赤色的缝合处与大白鲨的嘴混合在一起了。

咱们能够运用棒球图画的缝合处来测验这一点,将模型对特定图画的分类从「灰鲸」切换成「大白鲨」。

咱们期望激活值图集(Activation Atlases)会是一个有用的东西,有助于让机器学习变得沈黎慕连城更易了解和更具解释性。为了便于你运用,咱们发布了一些 Jupyter Notebook,经过 colab 就能在你的浏览器上当即履行。它们是根据之前发布的 Lucid 东西构建的,该东西包括许多其它可解释性可视化技能的代码。

参阅内容:

https://ai.googleblog.com/2019/03/exploring-neural-networks.html

https://www.theverge.com/2019/3/6/18251274/ai-artificial-intelligence-tool-machine-vision-algorithms

本文为机器之心报导,转载请联络本大众号取得授权。

主动驾驶 谷歌 为紫薇圣人起了一卦 技能
声明:该文观念仅代表作者自己,搜狐号系信息发布渠道,搜狐仅供给信息存储空间效劳。