深入了解AI如何识别图片

资讯 5年前

1.37K

几十年来，研究人员一直对此感到困惑，但近年来，这个问题变得愈加紧迫。机器视觉系统正被越来越多地应用于生活的各个领域，从医疗保健到自动驾驶。

人工智能的世界到底是什么样子的？

几十年来，研究人员一直对此感到困惑，但近年来，这个问题变得愈加紧迫。机器视觉系统正被越来越多地应用于生活的各个领域，从医疗保健到自动驾驶。

但通过机器的眼睛“看”世界，仍然是一个不小的挑战，比如我们该怎么理解为什么它把有些人归为行人，而把有些人归为路标。如果我们无法做到这一点，就有可能会造成严重的，甚至是致命的后果。比如前段时间已经发生的，自动驾驶汽车撞上行人致死的事件。

虽然，神经网络在识别图像中的物体等任务上取得了巨大的成功，但它们是如何做到的在很大程度上仍是一个谜。它们的内部工作方式被屏蔽，隐藏在层层计算中，不让人看到，使得人类很难诊断错误或偏差。

来自谷歌和非盈利实验室open Ai的新研究希望通过绘制系统来了解世界的视觉数据，进一步撬开人工智能视觉的黑匣子。

这种被称为“激活图集”的方法，可以让研究人员分析出各个算法的工作原理，不仅能揭示它们识别的抽象形状、颜色和模式，还揭示了它们如何结合这些元素来识别特定的对象、动物和场景。

这项工作的主要研究者，谷歌的Shan Carter说，如果以前的研究就像在算法的视觉字母表中显示单个字母，那么激活图集提供了一个更接近整个词典的东西，它显示出字母是如何组合成实际单词的。卡特说：“例如，在像‘鲨鱼’这样的图像中，会由很多激活码构成，比如‘牙齿’和‘水’。”

虽然这不一定是一个巨大的突破，但它是在被称为“功能可视化”的更广泛的研究领域向前迈出的一步。佐治亚理工大学的博士生Ramprasaath Selvaraju表示，这项研究“非常吸引人”，并结合了许多现有的想法，创造了一个新的极其有用的工具。

Selvaraju说，这样的工作将有很多用途，帮助我们建立更高效和先进的算法，并通过让研究人员深入研究来提高安全性和消除偏差。“由于神经网络固有的复杂性，它们有时缺乏可解释性，”但他说，在未来，当网络被广泛用于自动驾驶汽车和引导机器人时，这将是必不可少的一步。Open Ai的Chris Olah也参与了这个项目，他说：“这有点像制作显微镜。至少，这是我们所设想的。”

要了解激活图集和其他功能可视化工具的工作原理，首先需要了解一点人工智能系统如何识别对象。实现这一点的基本方法是使用神经网络：一种与人脑大致相似的计算结构（尽管它在复杂程度上落后了一个光年）。

每一个神经网络内部都是人工神经元层，它们像网一样连接在一起。就像你大脑中的细胞一样，这些细胞会响应刺激，这一过程称成为激活。重要的是，它们不仅可以启动或关闭，它们可以在一个频谱上注册，给每个激活一个特定的值或“权重”。

谷歌和OpenAI研发新工具，深入了解AI如何识别图片