Waymo在训练数据上处于明显劣势？

资讯 5年前

903

如果可以实现的话，自动驾驶将成为我们这个瑰丽的时代最大的商机之一。单在美国，所有汽车每年的驾驶里程就达到了3．22万亿英里。

模仿学习可能成为自动驾驶的关键；

大规模的训练数据是进行模仿学习的关键；

特斯拉拥有大量的训练数据；

Waymo没有多少训练数据。

如果可以实现的话，自动驾驶将成为我们这个瑰丽的时代最大的商机之一。单在美国，所有汽车每年的驾驶里程就达到了3．22万亿英里。如果这些里程都是通过自动驾驶驶跑出来，而且自动驾驶服务供应商每英里可以得到10美分的利润，那么，自动驾驶服务提供商每年在美国市场就能获得3220亿美元的利润。正是基于这种逻辑，谷歌旗下的自动驾驶公司Waymo的估值高达2500亿美金。

对于我来说，近期关于自动驾驶的一个最为吸引人的消息就是Waymo正在其自动驾驶中使用模仿学习技术。模仿学习是机器学习技术中的一种，它的神经网络观察人类所做的事情，学习在某些环境状态下执行的动作。通过训练人类行为，神经网络学习到“如果你遇到这种环境状态，就模仿人类那样去执行动作吧”。比如，“如果你看到前面有一个停车标志，请停下车。”或者，“如果你看到一辆停止状态的汽车挡了你的路，就这样慢慢绕开它。”

Waymo的研究团队负责人Drago Anguelov最近在麻省理工学院发表了一次演讲，深入探讨了这个话题。

Waymo在可以收集大量数据时使用模仿学习。但是对于Anguelov来说，Waymo的数据集中并没有足够的训练样例来进行模仿学习。在数据不足的情况下，它必须依赖手工编码算法，而无法使用机器学习来替代。

根据推断，Waymo应该已经自动驾驶跑了大约1500万英里。假设每3000万英里出现一次需要人类接管自动驾驶系统的情况，自动驾驶系统可以借此模仿的人类行为，那么，按照Waymo现在的行驶里程，它可能还没有遇到过模仿学习的样例。即便是每100万英里有一次人类接管行为可供模仿，它也不过只有15个样例。我不知道对模仿学习来说，多少个样例才能训练出判断为“真”，但是对于那些进行图像分类的神经网络来说，一般经验是需要至少一千个样例才能识别出来一种图像（比如大白鲨）。显然，Waymo不可能遭遇过这么多次可供模仿学习的样例。

虽然Anguelov很愿意在人类的驾驶行为中进行模仿学习，但是它并没有足够的数据样例。那么，谁有这些数据呢？

特斯拉有这些数据。据估计，搭载了特斯拉最新一代自动驾驶硬件的汽车数量已经超过了40万辆，所有这些车每天的行驶里程超过1300万英里。如果汽车数量增长到100多万辆时，每月的行驶里程将达到10亿英里。显然，车辆越多，里程数也越多，可供模仿学习的人类行为样例也就越多。

The Information的记者Amir Efrati写道，特斯拉正在利用这些里程中出现的人类行为进行模仿学习，他引用了至少一位在特斯拉自动驾驶部门工作的未具名消息人士的说法：

“知情人士表示，特斯拉的汽车手机了大量的摄像头数据和来自其它各类传感器的数据，当特斯拉车主开车时，即使他们没有启用车辆的自动驾驶系统，自动驾驶研究团队也可以检查人类在各种驾驶场景中的行为并模仿它。特斯拉的工程师认为，将足够多的人类驾驶行为数据输入到神经网络中，神经网络便可以学习如何在大多数情况下进行正确转向、加速或者制动。一位团队成员表示，特斯拉车主的日常驾驶会产生足够多的数据，“你不需要其它任何东西”来教系统如何自动驾驶。”

特斯拉官方还没有证实这种说法，但是其首席执行官埃隆马斯克最近在ARK Invest的一次采访中发表了一些评论，可能就是针对模仿学习的表态，在采访中有一句话值得注意：

“我认为我们特斯拉有一个别人很难超越的优势，那就是我们拥有大量的人工干预驾驶行为数据。可以这样认为，车主自己正在训练自动驾驶系统如何驾驶汽车。驾驶中有大量的模糊和奇怪的场景，你肯定都想不到......”