企业正试图用算法听懂你
声音很难被伪造,它不仅具有很多个人特征,还蕴含了心理健康与行为等方面的惊人信息。
声音很难被伪造,它不仅具有很多个人特征,还蕴含了心理健康与行为等方面的惊人信息。
Voicesense公司向其客户做出了一个有趣的承诺:提供给该公司某个人的声音,该公司就能告诉我们这个人将会做什么。该以色列公司可在通话中使用实时语音分析来评估某人是否有可能拖欠银行贷款、是否会购买更昂贵的产品或是否能成为工作的最佳竞选者。
这是众多试图挖掘声音中的私人信息的公司之一。近些年来,尤其随着家庭助手广受消费者欢迎,如亚马逊Alexa,研究者和初创企业都注意到了声音中蕴含着丰富的信息。据商业分析公司IdTechEx的一份报告,语音技术市场正在不断增长,预计到2019年市值将达到155亿美元。麻省理工学院麦戈文大脑研究中心一位对心理健康研究声音颇有兴趣的科学家Satrajit Ghosh表示:声音在生活中无处不在,几乎每个人都会说话,而很多设备如手机,Alexa和谷歌家庭等设备都可捕捉声音。
声音不仅无处不在,而且很个人化,也很难被伪造。在家中人们会使用Alexa,在医院里语音助手的使用也越来越普及。现在很多人都知道Twitter和Instagram上的帖子将会被监控,但很少有人认为声音是另一种形式的数据,它可告知我们关于我们自己的信息,也可把我们的信息泄露给他人。这些都引发了一系列令人兴奋的研究,这些研究主要聚焦于声音信息如何丰富生活,从声音中获取的信息是否准确,又将如何使用这些信息等隐私方面的问题。
语音分析的关键不在于人们说了什么,而在于人们是怎么说的,如语调、语速、重音以及停顿。语音分析的诀窍是机器学习。通过机器将俩组被标记的样本信息,如有焦虑症和无焦虑症输入到同一个算法之中,然后该算法学习捕捉到可表明某人是属于A组或B组的细微语音信息,之后在新的样本上可采用同样的方法来进行辨识。
卡内基梅隆大学的一位计算机科学家Louis-Philippe Morency表示结果有时候会与直觉相悖。Morency创建了一项名为SimSensei的项目,该项目可通过语音来探测抑郁症。Morency团队表示,在将声音特征与试图再次自杀的可能性相关联的早期研究中,他们发现相比发出紧张或愤怒的声音的人,发出轻柔呼吸声的人更有可能试图再次自杀。不过,该项研究仍处于初步阶段,而且关联性通常也不那么简单。通常来说只有算法能识别出来声音信息所包含的复杂特征及模式。
Voicesense公司可提供关于健康行为、工作行为、及娱乐等方面的预测。
尽管研究还处于初步阶段,研究人员已构建了可利用语音来帮助识别帕金森症和创伤后应激障碍等疾病的算法。对很多人来说,这项技术的最大前景在于将语音分析和心理健康相结合,从而创建出简单的方式来监控疾病并且帮助那些有复发风险的人。
布里格姆妇女医院数字行为健康项目的负责人David Ahern表示,精神患者在住院时会受到密切的监控,但很多精神状况的变化都发生在日常生活中,而日常生活会慢慢地让人疲劳。在这种情况下,曾被诊为抑郁症的人可能都不会意识到自己变得再次抑郁了。当人们不处于任何健康系统监控下,这种情况就会发生。如果病情恶化到要去急诊室的地步,就可能无法挽回了。从理念方面来说,创造出可监测健康行为的口袋传感器很可能就是一个早期预警系统,作用将十分强大。
Ahern还是去年12月推出的心理健康监控系统CompanionMx临床试验的首席研究员。该系统目前仅对医生和患者开放,其他初创企业如Sonde Health和Ellipsis Health,也有着创建类似心理健康监控系统的目标。患者可使用App录下音频日记,然后程序可分析这些日记以及通话记录和位置等元数据,从而确定患者在抑郁情绪、兴趣减退、回避和疲劳等四因素上的得分以及追踪随时间变化而变化的数据。这些信息受联邦隐私法HIPAA保护,但会告知患者并在面板上呈现给密切关注患者病情的医生。
据CompanionMx首席执行官Sub Datta称,该公司已对产品进行了长达七年的试验,试验患者超过1500名。该产品由另外一家语音分析公司Cogito研发,已获得DARPA(美国国防高级研究计划局)及国家心理健康研究院的资金支持。发表于《医学互联网研究杂志》上的研究结果表明,该项技术可预测抑郁症和PTSD(创伤后压力心理障碍症)的症状,不过还需要进一步的验证。
Datta还说到,在前期试验中,95%的患者每周至少会留下一次音频日记,医生每天至少会查看面板一次。尽管Ahern指出哪一部分最有用(是App本身吗?是反馈吗?是面板?还是它们的组合?)上仍有很多问题,但这些数据都代表着希望。研究还在继续中,其他结果还尚未公布。CompanionMx还计划与卫生保健组织合作,并在退役军人事务部中寻求机遇。