虚拟偶像造梦六十年:爆于AI驱动,困于真人内“芯”
采写/何惜金对二次元不甚了解的中年少女王明月,没想到有一天自己会对ACE虚拟歌姬感兴趣。“我以前只听说过洛天依,还是在十年前,印象里只有刺耳的电子音
采写/何惜金
对二次元不甚了解的中年少女王明月,没想到有一天自己会对ACE虚拟歌姬感兴趣。
“我以前只听说过洛天依,还是在十年前,印象里只有刺耳的电子音。”
然而今年,一首《梦华录》的二创歌曲帮她打开了新世界的大门。
“一开始我还以为是UP主自己唱的,没想到竟然是AI合成的歌声,那一瞬间太震撼了,感觉自己被时代抛在了后面。”
有这样感受的并不只有王明月。
在B站洛天依演唱的《贝加尔湖畔》视频评论区,一位叫“明道大叔913”的网友起初也误以为这是真人演唱,盛赞洛天依“在未完全转化为成年声音的少年大童当中,这个高音MI可以不掺假声,直接真声上的,非常少,一千万人中也未必有一个,超欣赏,这个声音肯定被上帝吻过。”
在被粉丝提醒后,他才知道这是AI合成的声音,忍不住感叹自己“涨了姿势”。
洛天依诞生的这十年,正是数字技术高速发展时期。
语音合成引擎百花齐放,最初的开拓者——VOCALOID受限于技术因素,渐成时代的眼泪,2022年5月5日,洛天依官方“Vsinger”发布通告,放弃VOCALOID引擎,改使用由时域科技研发的ACE引擎。
相对于自由度较高的VOCALOID引擎,操作简单易入门的ACE虚拟歌姬,由于高度贴合人声,听觉体验极好,被圈内人戏称为“V8双涡轮增压自行车”。
除此之外,3D建模、合成显示技术、感知识别技术、分析决策技术的进步,也为虚拟偶像打破次元壁,从二次元走向三次元奠定了坚实的技术基础。
iiMedia Research(艾媒咨询)的数据显示,2020年中国虚拟偶像核心市场规模为34.6亿元,预计2022年将达到120.8亿元;2020年虚拟偶像带动周边市场规模为645.6亿元,预计2022年为1866.1亿元,破圈效应渐显。
当青年亚文化进入大众视野,不可避免会让从未接触过这些的人感到困惑,发出类似“到底是多空虚才会将情感寄托在虚拟的东西上”的质疑,或是“这和动画有什么区别”之类的不解。
要回答清楚这些问题,还需要我们回顾虚拟偶像的发展史,读懂它的前世今生。
1958-1999:虚拟偶像初萌芽
恢弘的商业史诗,早在1958年便已开始谱写。
美国音乐制作人罗斯·巴格达萨里安就利用动画和调音技术,创造出了虚拟乐队:艾尔文与花栗鼠,由三只声音尖尖的拟人化小鼠组成,出道便惊艳美国,首张专辑七周内销量突破450万张,创下了历史纪录。
1961年,贝尔实验室的三位工程师放飞想象力,他们让第二代晶体管计算机——IBM7094模拟人声,开口演唱了“Daisy Bell”,为后来日本YAMAHA打造VOCALOID引擎开启了技术先河。
欧美国家积极打造虚拟乐队,但虚拟偶像的概念却是由日本在1990年正式提出。
1982年,日本动画《超时空要塞》爆火,女主角林明美以一曲《可曾记得爱》唤醒了杰特拉帝人的人性,使得大量敌军在战场叛变,人类最终获得胜利。凭借着在动画片中积累的超高人气,制作公司顺势以她的名义推出专辑,成功登上音乐排行榜Oricon,林明美成为了第一位虚拟偶像。
游戏产业的发展也为虚拟偶像添了一把火。1994年5月,日本科乐美公司发售《心跳回忆》,这是世界上第一款面向全年龄的恋爱养成游戏,玩家可以在游戏中学习、参加社团、恋爱、约会,真实体验三年的高中生活。可攻略的女性角色有十三位之多,场景丰富,剧情支线共有一千多种,可玩性极高,成为了游戏史上的里程碑作品。
游戏的互动性和成长性也让玩家对游戏中的虚拟角色产生了真切的感情,科乐美公司顺势将头号女主角藤崎诗织打造成为偶像,为她设立官方后援会,发行多张专辑,圈粉无数。
随着科技发展,1996年,艺人经纪公司Horipro为了纪念公司创立35周年,联合株式会社Visual Science研究所,斥资数十万美元,由50名研究人员共同参与,利用CG技术开发虚拟偶像伊达杏子,成为如今的超写实虚拟人的鼻祖,但因技术和IP热度,伊达杏子未能大获成功。
这一时期的虚拟偶像其实和配音动画并无太大区别,制作依赖手绘,声源依赖声优,粉丝只能购买虚拟人物的专辑和周边表达对他们的支持和喜爱,无法和他们互动,但这一大胆尝试具有历史意义。
2000-2016 初音未来开启虚拟偶像之门
时间来到2000年,日本公司YAMAHA着手开发电子歌声合成软件VOLCALOID(圈内俗称V家),并在2003年3月5日在德国法兰克福乐器展上公开,创作者可以通过输入原创的词曲,由VOCALOID直接演唱出来,通俗来说,VOCALOID更像是一把电子乐器。
2007年,Crypton Future Media以VOCALOID2引擎为基础,采用了声优藤田咲的音源数据资料,开发音源库,并为它设计了一个可爱的双马尾少女形象,命名为初音未来,作为虚拟偶像正式推向市场!
而她一出道就风靡全球,成为第一个用全息投影技术举办演唱会的虚拟偶像,俘获6亿粉丝,代言过上百家品牌,甚至还拥有了全球粉丝节“初音日”(3月9日)。
据日本经济新闻报道,初音未来在2007-2012年,带动了超过100亿日元(约合人民币6.32亿元)的消费市场,到2017年,仅仅一年就创造了100 亿日元的市场,展现出巨大的商业价值,是当之无愧的国际巨星。
五年后,上海禾念信息科技有限公司基于VOCALOID3引擎,开发出第一位中文虚拟偶像洛天依,并成功复制了初音未来的运营模式,帮助洛天依积累大量粉丝,仅新浪官方微博账号就有532.1万人关注。洛天依先后与郎朗、李宇春、薛之谦同台演出,并在2021年正式登上春晚舞台。
今年5月1日,这位虚拟偶像首次跨界直播带货,淘宝直播间在线观看人数一度高达270万之多,近200万用户打赏互动。有资料显示,洛天依直播带货坑位费高达90万元,甚至超过头部主播李佳琦,商业价值不输真人偶像。
除洛天依之外,国内运营商还推出过第一个男性虚拟偶像荷兹、基于动画IP《秦时明月》的高月公主和基于网文IP《全职高手》的叶修,虚拟偶像赛道,新秀不断,但是无人能够超过洛天依。
洛天依的超高人气自然让不少圈外人感到困惑,不理解为何会有人将情感寄托于虚拟形象上。
传统的真人偶像,人设和制作由经纪公司包装决定,推向市场,粉丝在其中只扮演了两种角色:一是消费者,为偶像打投,购买唱片,做数据冲榜,提升偶像商业价值,二是传播者,剪辑、创作和传播偶像的影视作品,他们无法去定义和创造偶像。
而和真人偶像不同,虚拟偶像“洛天依”们的成功之处在于独特的交互性和成长性。虚拟偶像的粉丝不仅是消费者、传播者,同时还是内容的创作者。
基于VOCALOID引擎的虚拟偶像本身并无交互能力,VOCALOID将采集到的语言分解为音素,而用户根据检索的音素,按照节奏、旋律重新排列,创作新的乐曲。
当自称“锦衣卫”的粉丝们,化身P主(使用歌姬调校乐曲的人),利用VOCALOID和MMD技术为洛天依创作歌曲时,既表达了自己对洛天依的喜爱,也在重新丰富洛天依这个IP,创造出符合自己欲望的梦幻偶像。
在B站,关于洛天依的原创和翻唱作品数以万计,而让洛天依火出圈的歌曲《普通Disco》、《达拉崩吧》、《勾指起誓》均为一位叫ilem的P主原创,每首单曲都达到千万播放量,成为了传说级作品,ilem也被锦衣卫们尊称为“教主”。因偶像聚集在一起的粉丝获得了在群体中的归属感和认同感,同时也获得了陪伴偶像一路成长的成就感。
一部洛天依成长史,也是背后无数粉丝共同书写的创作史。
可以看出,虚拟偶像的生态和传统真人偶像生态截然不同,这是一个由代表虚拟偶像的运营商、P主和粉丝三方共创的内容生态,只要粉丝们热情尚存,和官方共建优质内容,以二次传播扩大声量,那么虚拟偶像的IP价值将会不断提升,版权开发和应用场景也会得到持续拓展。
2016年至今:虚拟主播兴起,打破次元壁
从技术层面上来看,像洛天依这样的虚拟偶像属于AI驱动型数字人,完全依托数字技术,通过深度学习,拥有真实人类的动作、表情、语言,与人类进行互动,类似于没有物理外壳的机器人。
2022年7月12日,洛天依出道十周年纪念活动上,首次通过AI发声,开口说出:“唱出你心中的歌,我是虚拟歌手洛天依。”
对于虚拟偶像来说,这是技术革命的历史性一刻,标志着AI驱动的虚拟偶像在交互性能上又往前迈进了一步。
但不得不承认,由AI驱动的虚拟偶像目前在真实性和互动性上依然受限,AI驱动的虚拟偶像无法拥有人类的灵魂。
2016年12月1日,世界上首个虚拟主播——绊爱横空出世,她在Youtuber开设了自己的频道“A.I.Channel”,并提出了虚拟主播(Vtuber)的概念。
在技术层面上,她属于真人驱动型虚拟数字人,采用的是“CG建模+真人动作捕捉”技术,由此也延伸出了“中之人”的概念,即穿戴着动作捕捉设备的幕后演员。
元气可爱的虚拟形象、治愈的内容、互动感极强的沉浸体验,让绊爱出道大获成功,人气一路攀升,仅4个月便收获超40万关注,并于2018年2月23日达成频道100万订阅,成为了Youtube平台最早突破百万订阅的虚拟主播!
2022年2月26日,这位初代虚拟主播举行线上演唱会“Hello World 2022”,获得了36.26万元营收以及B站高达1065万的人气值。
绊爱的吸金能力让后来者看到了机会:一方面由于动捕、实时渲染相关设备价格降低,打造Vtuber的成本也随之下降;另一方面,和需要持续深耕的虚拟偶像IP不同,虚拟主播互动性强,生产周期短、用户粘性高,更容易变现。
2018年10月30日,B站宣布与GREE公司共同成立新公司,主营游戏研发发行和Vtuber业务。
据了解,在B站成为一个虚拟主播(VUP),需要准备好皮套,即形象立绘和Live2D模型,立绘价格在500元-1000元不等,建模价格在800元-3000元左右,再加上UI设计和直播设备,成本可以控制在两万元以内,即便是一个不懂绘画的二次元爱好者也同样可以借助现有技术成为一个虚拟主播。
网络直播模糊了虚拟偶像和虚拟主播之间的界限,而直播的商业前景与关联元宇宙的技术也吸引着大厂纷纷入局,不遗余力造星。
乐华娱乐和字节跳动于2020年11月23日推出了A-SOUL虚拟偶像女团,不到一年时间内就收获了上百万粉丝。2021年贝拉生日会直播,总弹幕量接近22万,观看人数超过5万,礼物收入总计超过174万,刷新B站直播多项数据,成为了B站有史以来第二位突破万舰的UP主。
与此同时,各大制作公司也将目光投向短视频平台,开始制造虚拟网红。
2020年5月,由魔珐科技和次世文化共同打造的超写实虚拟人翎-Ling出道,成为中国首位虚拟博主。
2021年10月31日,虚拟美妆博主柳夜熙凭借万圣节捉鬼视频在抖音爆红,获赞量达到了360万,涨粉量上百万。超写实风格,堪比影视特效的技术,充满故事感的氛围,打破了次元壁,让观众有一种被拉入科幻世界的沉浸感。
和受众局限于二次元领域的虚拟偶像不同,柳夜熙这样的虚拟博主依托CGI技术,拥有超写实面容,出道即破圈,让虚拟人走入了大众视野。
至此,虚拟偶像的概念已不仅仅局限于虚拟歌姬,而是泛指从事文娱工作的演艺型虚拟数字人,包括了以唱跳为主业的虚拟偶像、以陪伴为主业的虚拟主播、以短视频为主要活跃平台的虚拟网红。
虚拟偶像困境:AI向左,“中之人”向右
目前,虚拟偶像市场依旧是一片蓝海,商业潜力巨大,但也充满挑战。
从技术层面看,以数字技术驱动的虚拟偶像,技术门槛高,需要攻克语音合成、感知识别、分析决策的技术难点,通过深度学习模仿人类,和人类自然交互,依赖持续大量的资金研发投入。
而以真人驱动的虚拟偶像,同样造价不菲。
有接近A-SOUL项目的投资人曾透露,A-SOUL的日常直播是用电影《阿凡达》同类型光学动捕棚来做的,一个摄像头价格数十万,一个棚根据精度需求可能有数十个这样的摄像头。这与一般主播日常直播的成本可能差了不止一个0。
瑞银报告也指出,高级虚拟人物的先期投入成本平均为3000万元。A-SOUL的单曲制作成本约200万元,一场线下演唱会成本约2000万元。
除此之外,真人驱动的虚拟偶像也并非如宣传所说的“没有塌房危险”。
文娱产业,人是最大的不确定性因素。为虚拟偶像打造人设的运营团队、与虚拟偶像深度绑定的“中之人”同样可能让纸片人翻车。
就以初代虚拟主播绊爱为例,她大获成功后,因缺乏内容创新能力,人气下滑。企划运营公司Active8没有意识到中之人是虚拟偶像的灵魂,为了提升效率,又在原有的“中之人”基础上,为绊爱增加了三位“中之人”,由四位幕后演员共同塑造绊爱这一人设,导致粉丝不满,大规模取关,最终绊爱只能选择无限期休眠。
五月份A-SOUL虚拟偶像曝出团队“中之人”工资待遇低、工作强度高问题,引起粉丝不满,并迅速发酵成愤怒情绪。为“中之人”抱不平的粉丝们质问乐华娱乐,并给字节跳动的APP刷低分以示抗议,“塌房”来得猝不及防。
像柳夜熙、翎-Ling这样的虚拟网红,试图以种草、带货、代言品牌变现,但是当虚拟人说出“口红滋润不拔干”时,测评体验的真实性却又无法让用户信服。
大厂打造的超写实虚拟偶像,在一段时间内满足了大众猎奇心理,吸睛无数,收获巨大流量。但随着时间推移,大众对虚拟人概念习以为常后,如何不断制造钩子,留住用户,让他们对不吝巨资打造的虚拟偶像依旧满怀热情呢?这考验虚拟偶像运营商们的内容创作能力。
如此多问题悬而未决,或许也正说明了虚拟偶像的未来依然充满想象。
毕竟,回首十年前,当洛天依被推上历史的舞台,那时的人们又怎会想到,在2022年的今天,她已拥有了被上帝吻过的声音。(王明月为化名。)
原文标题 : 虚拟偶像造梦六十年:爆于AI驱动,困于真人内“芯”