深度揭秘:击败李世石后,AlphaGo 的下一步是什么?
|
Hassabis:当然【笑声】是的,在MMG(大型多人游戏)和类似游戏里这总是让我很受挫。我从来没有真的为这些游戏着迷,因为NPC都太蠢了。他们没有记忆,不会改变,不理解上下文。我觉得如果有了这种可以学习的AI,游戏就完全上升到另一个层次了。 | DeepMind 的下一步:医疗
The Verge:这周你带来的消息里,AI未来主要的用途是医疗、智能手机助手以及机器人。让我们来详细聊聊。医疗方面,举例来说,IBM的Watson在癌症诊断方面有所建树——DeepMind可以带来什么? Hassabis:好吧,现在还只是雏形。我们几周前宣布了一项与NHS(英国国家医疗服务体系)的合作,不过这只是刚开始着手建立一个利用机器学习力量的平台。我觉得Watson与我们做的事情非常不同,从我的理解而言——Watson更像是一个专家系统,所以它是另一种形式的AI。我觉得你能看到这类AI做的事情会是医疗图像的诊断,然后可能有对于自我量化(quantifiedself)或是重要迹象的长期追踪,帮助人们有更健康的生活状态。我觉得这很适合用强化学习。 The Verge:在与NHS的合作中,你们推出了一款看上去没有怎么用到AI或是机器学习的app。这背后你们是怎么想的?为什么NHS要用这个app,而不是其他厂商推出的软件? Hassabis:NHS的软件在我的理解中是相当糟糕的一个东西,所以我觉得第一步就是试着让它进入21世纪。它们并不是移动端的,完全不是我们作为今天的消费者理所当然认为能看到的那种样子。并且我觉得对于医生和护士来说它用起来让人觉得很挫败,降低了他们的效率。所以我觉得第一步是,帮助他们用上更有用的工具,比如可视化和基础统计信息。我们认为,我们会实现这样的功能,然后看清我们到底需要什么,随后再将更纯熟的机器学习技术运用其中。 The Verge:这一切有多简单?医疗资金在英国显然会是一个充满争议的话题。 Hassabis:当然,呃,好吧,我们正在免费做这件事【笑声】这让它变得很简单!这与大部分软件公司都有很大的不同。大部分时候是大型跨国公司制作这种软件,所以他们不会真正把注意力放到用户身上,而我们在设计它的时候更像是一种初创企业的方式,从用户那里倾听反馈、从某种程度上来说与他们一起设计一个软件。 | 未来的核心:智能手机助手The Verge:那么让我们谈谈智能手机助手。我看到你第一天的时候演讲PPT里有一张图来自电影《她(Her)》——这会是最终形态吗? Hassabis:不,我的意思是,关于智能手机助手是什么样,《她》只是一种盛行的主流观点。我只是觉得,我们会想要让这些智能手机助手之类的东西真正变得智能、理解上下文、对于你要做什么有更深的理解。现在,大部分这样的系统都极为脆弱——一旦你偏离了预先编程输入的模板,它们就完全变得毫无用处。所以这意味着让它们变得真正可以适应、变得灵活、也更稳健。 The Verge:为了改善这些,需要有什么突破? Hassabis:我们可以的,只不过我觉得你需要一个不同的方法。再说一次,这是预编程和学习的二分法。目前基本所有的智能手机助手都属于特殊案例和预编程的,这意味着它们很脆弱,因为只能做预编程写好的事。然而真实的世界非常混乱,用户们也会在你无法提前知晓的情况下,做着不可预知的事情。我们对 DeepMind 的信念是,这也是最根本的原则,通往人工智能的唯一道路,是从地基开始打起,而且变得通用。 The Verge:AlphaGo 从学习很多游戏模式过程中顺利起飞,这对于智能手机怎么使用呢?它的输入是如此的多变? Hassabis:是啊,所有得有上万吨的数据,而你可以从中学习到很多东西。事实上, AlphaGo 的算法,我们打算在未来几个月尝试的是,摆脱监督式学习的出发点,让它完全自我发挥,从一无所有的状态开始。它会需要更长的时间,因为当你采用随机方法的时候,其中的审查和错误会需要更多的时间训练,也许是几个月。但是,我们认为有这个可能性,让它从纯粹的学习中起步。 The Verge:是因为算法现在能达到的程度,所以你认为这是可能的么? Hassabis:不是的,我们本来可以这样做的。它不会使得程序更强大,它只是做着纯粹的学习。所以会有一些非监督的部分。我们认为这个算法能够在非监督的状态下工作。我们去年做了 Atari 游戏,在像素的层面玩游戏,而不会受人类知识的禁锢,它会在屏幕中做一些随机的动作,开始游戏。 The Verge:对于 Atari 游戏来说更加容易,是因为失败的状态更加明显么? Hassabis:的确更加容易,因为分数更有规律。在围棋中,不管最终赢得还是输掉比赛,你也仅仅得到一个分数。这就是所谓的信用分配问题(Credit Assignment Problem):这个问题是,你在围棋中走了几百步,但不知道具体哪一步会为最终的胜利或失败负责,其中的信号非常微弱。而在大多数的 Atari 游戏中,所做的大多数事情都会给予分数,所以就得到了更多的面包(奖励)去仿效。 The Verge:你可以给个是时间表么?当这些事情开始给手机市场带来显著性差异的时候。 Hassabis:我认为在未来的两到三年会开始看到它。我的意思是,它在开始的时候是非常微小的,只有很小的部分会工作的更好。也许在未来的 4 到 5 年,甚至 5 年更多,你可以看到在功能上大的变化。 | 为何 Google 的支持非常重要
The Verge:你确定了未来各种各样的可能性,而这件事是和 Google 联系在一起最明显的事情。 Hassabis:是的。 The Verge:你有没有得到任何指示,这些事情被期待如何纳入到 Google 的产品路线图或商业模式中? Hassabis:不,在如何最优化研究进展方面,我们有很强的主导权。这是我们的使命,也是为什么我们加入了 Google,这样我们可以给研究进行涡轮增压。这是发生在过去几年的事情。当然,我们实际上也致力于很多 Google 内部的产品,但是他们是非常早期的阶段,所以还没准备好公布。当然我认为智能手机助手是非常核心的,我认为 Sundar Pichai 已经对此谈了很多,这是 Google 未来的核心。 The Verge:Google 有另外的举措,例如 Google Brain,它推出了机器学习的特征,像 Google 图片搜索和其他面向用户的东西。 Hassabis:是的,几乎无所不在。 The Verge:你的公司和 Google Brain 有互动吗?你们有没有重叠的部分? Hassabis:当然,其实我们是非常互补的。我们每周都有交谈。Google Brain 主要致力于深度学习,他们也有非常卓越的工程师 Jeff Dean,所以他们已经铺开到公司的各个角落,这也是为什么我们发明出了令人惊喜的 Google 图片搜索。他们正在做着现象级的工作。另外,他们的团队在山景城,所以他们离产品团队更近,他们的研究周期也更像 12 到 18 个月。而我们有更多算法开发的工作,我们倾向于为需要两三年研究的事情做研究,而且不需要在开始的时候就有直接的产品焦点。 The Verge:Google 对 AlphaGo 的支持有多重要?如果没有他们,你们是否能做到? Hassabis:这是非常重要的。AlphaGo 在比赛中实际上并没有使用那么多硬件,但我们需要大量的硬件来训练它,做各种不同的版本,并让他们在云端互相比赛。这需要相当多的硬件才能高效完成,所以如果没有这些资源,在这段时间内根本无法完成。 | 不看机器人,关注科学的进展
The Verge:让我们来说说机器人。我平时在日本,并倾向于认为日本是机器人的精神家园。我现在在日本看到的机器人以两种方式使用。我们有像发那科这样的工业机器人,有一个确定的目的做着让人惊讶的事情,也有像软银 Pepper 那样的迎宾机器人,尽管使用有很大的限制,但他们在很多方面都是野心勃勃。对于这个领域现在的状态,你有什么想法? Hassabis:是的,我认为你说的发那科,他们有很漂亮、很能干的身体,但缺少了智慧。而迎宾机器人和智能手机助手更像,我见过的那些,反正都是预编程了很多针对模板的反应,但如果你做一些其他事情,例如去越野的地方滑雪,那他们会感到很困惑。 The Verge:所以我猜测,一个很明显的问题是,机器学习会如何强化机器人的能力。 Hassabis:是的,这是完全不同的方法。你可以从头开始建立学习新事物,并能应对突发事务的能力,我认为这就是当机器人或软件应用程序在真实世界中和用户交互时所需要的——他们需要拥有这种能力,并妥善使用。我认为学习曲线最终必须采用正确的做法。 The Verge:对于可学习的机器人来说,什么是你看到的最直接使用案例? Hassabis:其实,我们对此没有太多的想法。显然,自动驾驶汽车是一种机器人,但目前来说还是狭义的人工智能,虽然他们使用了计算机视觉里面一些可学习的人工智能——特斯拉采用了一种基于深度学习的标准、现场的计算机视觉方案。我相信日本在老年护理机器人、家庭清洁机器人上面有很多思考,我认为这对社会会非常有用。特别是在一个人口老龄化的社会里,我认为是一个非常紧迫的问题。 The Verge:为什么在这些类型的案例中,一个更基础的学习方法,能带来如此显著的提高呢? (编辑:PHP编程网 - 襄阳站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |




