深度强化学习“落地”高空，全自动环境监测或成现实

资讯 3年前

877

在电影《飞屋环游记》中,男主人公用一大堆气球将自己的小木屋带上天空,并通过增减气球、手动施力来改变气球的飞行方向,去实现他未曾实现的梦想．．．．．．当然,电影世界具有一定的幻想色彩。但是,如今还真有这样一种巨型气球,它虽然不能带着小木屋飞上天空,却更加智能、用处更大——让全自动环境实时监测成为可能

在电影《飞屋环游记》中,男主人公用一大堆气球将自己的小木屋带上天空,并通过增减气球、手动施力来改变气球的飞行方向,去实现他未曾实现的梦想．．．．．．

当然,电影世界具有一定的幻想色彩。但是,如今还真有这样一种巨型气球,它虽然不能带着小木屋飞上天空,却更加智能、用处更大——让全自动环境实时监测成为可能。

平流层气球(stratospheric balloon),又称高空气球,可以在大气平流层中自主飞行数月,具有低成本、高效益的特点,这使其成为通信、地球观测、收集气象数据和许多其他应用的宠儿。但是,如何实现高空气球的自主导航,一直是科学研究的一个难题。

近日,来自谷歌研究院(Google Research )和 Alphabet 旗下公司 Loon 的研究人员组成的科研团队,成功开发出的一种基于深度强化学习的高性能人工智能控制器,能让高空气球一连数周待在原地,并根据环境因素进行实时决策并实现自主导航。这一研究结果提高了全自动环境监测成为现实的可能性,代表深度强化学习向现实世界应用迈进了非常重要的一步。

该研究成果以“Autonomous navigation of stratospheric balloons using reinforcement learning”为题,于 12 月 3 日在线发表在顶级期刊 Nature 上。

(来源:Nature)

续航瓶颈,无法满足需求

高空气球中应用最广泛的当属“超压”气球,气球内填充氦气,常被用来在高层大气开展实验。这些气球遇到气流风时,往往会偏离航道,之后便只能返回地面驻点。而此次研究所采用的深度强化学习方法,可以训练人工智能系统进行实时决策。对于超压气球来说,这些决策包括采取哪些行动来保持其在空中的位置不变。

Loon 超压气球是谷歌于 2013 年成立的高空气球项目的成果之一,旨在将其作为通信中继平台,为还未接入互联网的偏远地区提供一种相对廉价的通信服务。传统上,Loon 的上下垂直飞行通过泵出固定体积的气囊来实现,而左右水平运动则由气球所处位置的风向所决定。因此,为了实现导航目的,飞行控制器必须通过上升和下降的方式,以找到并跟随对其有利的气流。

然而,这种简单的导航方式无法满足气球长时间(有时长达几个月)控制的目标。例如,传统“控位法”(Station-keeping)需要将气球固定在某个地面位置的正上方。为了完成这一任务,气球就必须不断地通过风场变化采取间接飞行路径,以保证位置不变。