Google的深度神经网络强在哪里？谷歌首席科学家说了这些奇妙的特性

发布时间：2016-03-29 06:21:51 所属栏目：业界来源：雷锋网

导读：谷歌首席科学家Jeff Dean：Google的深度神经网络强在哪里，以及，有什么奇妙的特性？

真正神经网络通过亿级的参数在亿级的维度做调整，去理解输出网络。Google目前有能力如何快速搭建和训练这些海量数据上的模型，去解决实际问题，在快速去不同广泛的平台去部署生产模型（手机，传感器，云端等）。

| 神经网络的奇妙特性

这就是说神经网络可以用在很多不同问题上。

文本：万亿级别的英文和其他语言资料。从一个语言翻译到另一个，从短语到整句。

虚拟化数据：十亿级别的图谱，视频。

语音：每天都产生万小时的资料。

用户行为： 很多应用产生数据。比如搜索引擎的查询，用户在email中标记垃圾。这些都可以学习并搭建智能系统。

知识图谱：十亿级别的标签化关系元组。

Google的深度神经网络强在哪里？谷歌首席科学家说了这些奇妙的特性

如果吸收更多数据，让模型变大，结果也更好。

如果你输入更多数据，但没有把模型变大，模型的能力就会受限在一些数据集中的明显特征。通过增加模型的规模，让它不仅记住明显的，还有一些也许出现很少的细微特征。

通过更大的模型，更多数据，计算需求也更大。Google很多精力花在如何提升计算量，训练更大的模型。

| 在Google深度学习有哪些强大应用？

1、语音识别

Google的深度神经网络强在哪里？谷歌首席科学家说了这些奇妙的特性

第一个部署深度神经网络的小组。

他们实现的新模型基于神经网络而不是隐马尔可夫模型。这个问题是把从150毫秒的语音去预测中间10毫秒吞掉的声音。比如到底是ba还是ka的声音。你得到一个预测的序列，再通过语言模型去理解用户所说。

一开始的版本就把识别错误率降低了30%，确实非常厉害。

后来就研究一些复杂模型去加强网络，进一步降低错误率。现在当你对着电话说话，语音识别比五年前强多了。

2、ImageNet挑战

Google的深度神经网络强在哪里？谷歌首席科学家说了这些奇妙的特性

ImageNet是6年前公布的。里面有100万张图片，算是计算机视觉领域最大的。图片中包含1000种不同分类，每一类有1000张图片。比如里面有上千张不同的豹子，摩托车等，一个麻烦的是不是所有的标签都是对的。

Google的深度神经网络强在哪里？谷歌首席科学家说了这些奇妙的特性

在神经网络使用之前，最好的错误记录是26%，2014年 Google错误率暴降到6.66%取得冠军，然后到了2015年错误率下降到3.46%。这是什么概念，大家注意到Andrej人类的错误率也有5.1%（他还是花了24小时训练后的结果）。

总之这是个又大又深的模型，每个盒子就像神经元的一层去进行卷积操作。

Google的深度神经网络强在哪里？谷歌首席科学家说了这些奇妙的特性

3、图片类别识别

Google的深度神经网络强在哪里？谷歌首席科学家说了这些奇妙的特性

计算机在花卉识别上很强大，这是非常好的模型，能够识别细微差别。

Google的深度神经网络强在哪里？谷歌首席科学家说了这些奇妙的特性

一般的效果，比如在菜品识别。

Google的深度神经网络强在哪里？谷歌首席科学家说了这些奇妙的特性

计算机也有犯错的时候，关于错误敏感性看一看上面的，比如左边鼻涕虫当成蛇，右边也不知道是什么鬼。

4、Google图片搜索

Google的深度神经网络强在哪里？谷歌首席科学家说了这些奇妙的特性

就是理解图片中像素的能力，Google图片团队开发了不用标签就可以搜索图片的功能。比如你可以去找雕像，素描，水，而不需提前标注。

5、街景图像

Google的深度神经网络强在哪里？谷歌首席科学家说了这些奇妙的特性

在街景中如何识别里面的文字。首先要找到文字部分，模型能够去有效预测像素中热点图，那些含有文字的像素点。训练的数据就是包含文字划分的多边形。

因为训练数据中包括不同的字符集，这样在多语言下也没问题。也要考虑大小字体，远近，不同颜色。训练的模型相对容易，就是卷积神经网络尝试去预测每个像素是否包括文字。

6、Google搜索排名中RankBrain

Google的深度神经网络强在哪里？谷歌首席科学家说了这些奇妙的特性

RankBrain 2015年启动，在搜索排名（前100位排第三），里面难点是搜索排序需要了解模型，要理解为什么要做某个决定。当系统发生错误为什么做那个。

调试工具准备好，需要足够的理解能力嵌入模型，去避免主观。总体上是不想手工调参数。你需要尝试理解模型中的预测，去理解训练数据是否相关，是否跟问题无关？你需要训练数据并应用到别的上面。通过搜索查询的分布你能得到每天的变化，事件发生后改变也随时发生。你要看分布是否稳定，比如语音识别，一般人不会改变音色。当查询和文档内容频繁变化，你要保证模型是新的。我们要搭建通用工具去理解神经网络里面发生了什么，解释什么导致这个预测。

序列模型

Google的深度神经网络强在哪里？谷歌首席科学家说了这些奇妙的特性

很多问题都可以映射到从一个序列到另一个序列的规律。比如语言翻译，从英语翻译到法语，就是把英语的序列单词转化到法语序列单词。

神经网络在学习复杂函数时特别有用，这个模型学习从英文到法文的句子。句子以单词为单位，以结束符作为信号。训练模型在遇到结束符时开始产生另一个语言的对应句子。而模型函数就是把语言中语句对作为训练数据。

每一步都在词典表中的单词产生概率分布。在推理时候通过一些搜索来实现，如果你最大化每个单词的概率，这样找的不是最可能的句子。直到找到最大可能的句子找到才结束搜索。

这个系统在公开翻译系统中表现出色。大多数其他翻译系统需要手工编码或机器学习的模型只是在一小部分使用，而不是像这种整体的端到端的学习系统。

Google的深度神经网络强在哪里？谷歌首席科学家说了这些奇妙的特性

这些领域都是可以归到序列类的方法。

7、智能回复

Google的深度神经网络强在哪里？谷歌首席科学家说了这些奇妙的特性

智能回复是另一个序列类的例子。在手机上你如何更快回复邮件，打字很累。

Gmail组开发了一个系统能够去预测邮件回复。第一步就是训练小量模型去预测如果消息是某一类的，如何做简短回复。如果是一个更大，计算能力更强的模型会把消息作为一个序列，尝试预测序列的反应词。比如对于感恩节邀请，最可能的三个答复是“算上我们”，“我们会去的”，“对不起，我们有事没发去”

8、看图说话

Google的深度神经网络强在哪里？谷歌首席科学家说了这些奇妙的特性

把之前开发的图片模型与序列类模型结合一起。图片模型作为输入。这里就不是阅读英文句子了，而是看图片的像素。

（编辑：PHP编程网 - 襄阳站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

2/3

首页

尾页

消息称微软 Xbox Seri	索尼 PS VR2 头显将采
乘胜追击！AITO问界M7	华硕玩家国度发布无线