深度学习的下一站在哪里

资讯 5年前

1.88K

作为人工智能的一种形式，目前深度学习如何突破瓶颈，迎接新一代人工智能的到来？让我们听听国内外专家如何说。

近日，人工智能领域传来好消息——美国计算机学会宣布将2018年图灵奖颁发给深度学习领域三位先驱——约书亚·本吉奥、杰弗里·辛顿和雅恩·勒昆，以褒奖他们推动深度神经网络成为计算机技术的重要组成部分。感谢他们拯救了AI、改变了世界。

之前，业内有人提出“深度学习已死”的基调，让深度学习的热度大大下降，而此消息一出，犹如按下重启键，人们再次将目光锁定深度学习。那么，作为人工智能的一种形式，目前深度学习如何突破瓶颈，迎接新一代人工智能的到来？让我们听听国内外专家如何说。

已然改变人们生活

事实上，用深度学习进行分析的目的在于识别真实数据中的真实模式。如果这种建设性能力可应用于总结经验、设计方案以及记录历史，甚至能够以惊人的逼真性反馈于人们的身体，那么现实与幻想之间的界线将变得非常模糊。

“深度学习虽然有种种局限，但在很多领域已然切切实实发挥作用，比如在语音识别、机器翻译等，这是一些可算作‘无限但可枚举’（Infinite but enumerable）的数据对象。在这些领域中，训练数据集及其变种可以包括大部分我们可能遇到的实际数据，深度学习可以解决。”新一代人工智能产业技术创新战略联盟联合秘书长、科大讯飞副总裁兼AI研究院联席院长李世鹏在接受科技日报记者采访时指出。

他说：“而另外一些领域则属于‘无限也不可枚举’的数据对象，比如说自动驾驶场景下的各种环境图像和视频，计算机视觉中通用识别问题的数据对象等。这些问题，深度学习可能会解决其中某些子问题，但整体来看，会出现不久前全球人工智能计算机视觉领域奠基人之一艾伦·尤尔教授所提及‘深度学习在计算机视觉领域已至瓶颈’的问题。”

“实际上，深度学习主要依赖于大量的数据和数据标注。在医疗领域，可对采集到上万个病例数据库的医学影像进行分析，供放射学和病理学方面训练，帮助医生做出更为精准高效的诊断，实现大规模应用。不过，对于应用本身其是受限的，因为很多领域并无那么多数据，也没太多真正意义上的训练。如在自动驾驶领域，正常驾驶很多的数据可以采集到，但有些非正常数据像事故方面却很难采集。” 远望智库人工智能事业部部长、图灵机器人首席战略官谭茗洲认为。

法国泰雷兹集团首席技术官马克·厄曼表示：“在众多的人工智能技术中，深度学习是为我们所熟知的一种。当你拥有大量的数据和少量知识的时候，它是一种非常强大的技术。例如，人脸识别，但是这需要采集大量的图像来训练。在许多情况下，用于学习的数据库极为庞大，有时候需要千万甚至几亿数据。学习方法也有快慢之别，但是本质上来说，它不及人类大脑聪明。”

可行方法扬长避短

“深度学习肯定不是解决通用人工智能问题的全部，但是人类探索机器智能的必经之路。我们应该意识到现在深度学习的一些限制，要做的是扬长避短——用可行的方法解决现在可以解决的问题。”李世鹏指出。

如何解决数据短缺问题？李世鹏说，目前很多科学家在对此研究。一类是从数据源方面解决，比如，借助更高效的数据标注工具帮助人快速获取更多标注数据、用对抗网络生成数据等；一类是从深度学习算法本身改进，比如迁移学习、少样本学习、无监督学习和弱监督学习等。

我们看到，AI在自动驾驶领域若达到99．9％的准确率，也意味着很多次驾驶活动中可能出现一次机器不能处理或者不能处理得很好的例子。这是否说明自动驾驶就不能做了？“当然不是。解决方法是通过人机耦合来实现稳定可靠的人工智能。”李世鹏答道。

李世鹏解释道，今天的人工智能即使在可以发挥得很好的领域，也不是百分之百可靠。在一些不是很关键的领域，某些AI技术也许是可用甚至好用，但在某些关键领域却远远不能符合要求。因此，不要把人工智能当作万全技术，在设计一个产品或者系统时，要充分考虑机器失败的时候，人类怎么能很好地接手。

具体而言涉及两个问题：一是系统如何识别什么情况下它处理不好，就是说在AI给出某种决定的同时，也给出做此决定的可信度。在可信度很低的情况下，是否可以唤醒人类接应？

另一个是人机如何和谐地在一起工作，这涉及到用户体验设计和AI的结合。至少AI在现阶段还只是作为提高人类效率的工具，所以在用户体验设计中应该做到不需要人时刻盯着，但在有状况时应及时提醒反馈给人类无缝接手。

探索未来突破之路

国内外专家表示，尽管人工智能的发展水平令人瞩目，但目前的人工智能系统有一定智商没情商、会计算不会“算计”、有专才无通才。就目前既有的解决方法，还不够具有革命性，要让未来的AI更“智慧”，需要加强对人类大脑等方面的研究，探索突破深度学习瓶颈之路。

“尤尔等指出的组合模型训练及用组合数据测试，实质上应该认为是个分解过程，但难点就在于分解。就像计算机视觉里最难的问题是图像或物体分割一样，这本身可能需要更多高层次上的语义理解。更具颠覆性的方法是赋予AI引擎一些推理功能，即使没有见过的数据，也能通过推理进行解决。”李世鹏指出。

李世鹏进一步说，脑科学和认知科学的发展给我们很多启示，MIT等一些大学院所的科学家正沿着这条路径探索。其实，上世纪90年代盛行的专家系统很多时候就是给机器一些规则（推理法制），让机器按规则去推理从而解决一些问题。但专家系统的问题是规则制定本身是件很麻烦的事，远不及今天数据标注来得简单。将来的思路可能是需要深度学习从大数据中归纳出一些可以解释的规则，然后，将它们应用到新的数据中去解决问题。知识图谱和深度学习的结合也许是这条路线的一个实用分支。

在某些方面，我们发现深度学习如同挖掘机一样，能够采集相当多的数据，然而，却不像小孩子那样，不需要千万次的学习即会认出自己的母亲。

厄曼说，这是因为实际上孩子认妈妈是将多种信息混合在一起判定，其中包括形象、气味、身体接触、出生记忆以及许多复杂因素。尽管深度学习是受到生物启发，基于我们所说的神经元，但是，当你与神经科学家交谈时，会觉得深度学习仅是一种对人脑的过于简单的再现，人脑可比这复杂得多。所以深度学习只是AI使用的众多技术中的一种，希望其他技术可以对其加以补充。

“正如现在的自动驾驶，只能说是试水阶段，其技术本身肯定不是主要依赖深度学习，而是多模态感知，运算也不是简单依赖于视觉，而是与人类认识这个世界一样，通过眼、耳、鼻、舌、身、意多个感知来综合认知，而人脑本身在大多数情况下不依赖于大量数据，而是借助‘触类旁通’等能力。因此，人脑科学、计算机科学、生理学和认知科学等跨界交融应用才是未来AI的发展方向。”谭茗洲指出。

他认为，深度学习是一个好的开始，但是不能解决一切问题，需要和更高维度的方式叠加。而跨学科的研究会在语义、知识图谱、机器记忆、想像、逻辑推理等类人脑的领域，弥补深度学习的一些短板。