Maker玩声控,正是时候!
声控当红,Maker该如何玩出自己的声控应用呢?本文以Amazon Echo、Google Home、Google纸箱版Voice Kit和华硕 Zenbo 机器人为例介绍声控在这三种品牌上的表现,以及Maker该如何入门这个最自然的人机界面领域。
声控当红,Maker该如何玩出自己的声控应用呢?本文以Amazon Echo、Google Home、Google纸箱版Voice Kit和华硕 Zenbo 机器人为例介绍声控在这三种品牌上的表现,以及Maker该如何入门这个最自然的人机界面领域。
语音助理系统运作的综观架构
1.智慧居家好伙伴– ASUS Zenbo
跟 Zenbo 互动,以声控的形式打开了警报
Zenbo 不只可以跟人对话、互动,还自己跳舞,真的相当可爱!更有「鹦鹉讲话、猜猜我几岁、和朋友说话、开启与关闭警报」等有趣的语音功能。
这一个刚夺下德国红点产品设计大奖的 Zenbo,既能自己移动又具有屏幕接口的产品,主打亲子幼教,搭配可定向麦克风。
值得一提的是,虽然其 3D 相机成本就高达上万块,但事实证明 3D 相机读取景深的功能,在做影像追踪的时候相当有帮助;另外, Zenbo 使用的是 Andorid 系统,在操作上更贴近我们常用的智能型手机,有原生 SDK 、故事编辑器、图形化编辑器、对话编辑器,再加上语音对话与控制的服务,也开放API给开发者,Maker想玩出创意其实不难-只要跨越价格门坎!
2.蓄势待发的 Google Home
Google Home 可以透过? Google Assistant SDK ,连接 RaspberryPi 3 和 USB 麦克风使用
Google Home 于2016年所推出,内建智能家庭系统Google Assistant ,除了具备翻译、导航、送简讯、播放音乐功能,也能听候主人差遣,控制智能家庭硬件,播放与修改行事历,未来更预计增加报时、报天气、打电话、为行事历加上排程的功能,还有令人期待的「支持并可辨认多使用者」,这将大幅提升智能家庭的可能性,针对家庭中不同的成员发展更具个人化的服务,未来结合 Google 多元的应用,将让使用者达到便利生活新境界。
目前 Google Home 在体验上已具备许多优点,像是可透过 Google Action 增加功能、透过 Google Assistant Kit 渗透至其他装置,让 Google Home 在 DIY 及扩充这一方面有较大的空间,只要符合「要求-响应」模式的功能和任务,用说的就会通,加上 Google Home 本身就是可与 Chomecast 联机显示的智能 WiFi 音箱,只要出一张嘴,就能解决居家问题与提供休闲娱乐。虽相对Echo是后进者,但因Google应用已深入生活,后势不容小觑。
特别有趣的是,Google针对Maker推出纸箱版的Google Home,造成不小的关注,是Maker熟悉语音接口开发的入门好物,又可享受动手做的乐趣。
Google用Raspberry Pi为开发板推出了GoogleHome纸箱版的Voice Kit
3.包罗万象的Amazon Echo家族
Echo 系列从2014年 Amazon 推出至今已经出了三代的产品:Echo、Tap、Echo Dot,除外型、价格不同外,功能也有差异
相较前两者,更早出手的 Amazon Echo 已将声控应用的触角伸往生活各个层面。Echo 系列从2014年 Amazon 推出至今已经出了三代的产品:Echo、Tap、Echo Dot,除外型、价格不同外,功能也有差异。最近推出的新版Amazon Dash Wand也支持Alexa语音服务,相信会有愈来愈多支持外围出现。
除了自家产品,许多大厂都推出了整合Alexa服务的语音概念产品,像是 GE 智能台灯、 Samsung 吸尘器、 LG 冰箱,甚至是 Ford 车款等等,即便 Alexa Skill 目前不允许外部通知驱动是一大限制,但 5/16宣布将实验「 Skill 选用启动通知」,待实验完成会发布 SDK ,将成为该产品的另一契机。
Echo 在硬件方面有七个矩阵麦克风,本身可当蓝芽喇叭,软件技术则是自家训练模型的 Speech to text (STT)及语音音质温暖的 Text to speech (TTS),可完成的语音任务已包罗万向,例如:互动语音游戏、音乐与音效、有声书、在线电台、预订(订票、订餐、叫车)、智能家庭硬件控制,除此之外, Echo 在第三方的多样合作下,硬件厂商可以更自由发挥,是 Echo 一大优势!
总结
随着硬件及软件的进步,人们对于语音控制的创意和想象也大大地扩展,或许有一天世上不再需要按钮,只要一声令下,各式各样的任务都能轻易完成。
虽然至今声控应用尚未全面进入大家的生活中,但是语音助理所搭配的云端语意辨识能力已是一年比一年精准,支持的语言也增加不少,至此,对于开发者的考验将不只是技术本身了,而是针对人的需求提出合宜的解决方案。
究竟要将声控用在何种情境,就有赖各方好手发挥了!
作者:小波