上不如老,下不如小,现在还不如AI?

资讯 1年前
679
上不如老,下不如小,现在还不如AI? 上不如老,下不如小,现在还不如AI? 上不如老,下不如小,现在还不如AI?
人工智能”,背后是算法模型的几次大幅迭代。

从最早基于手写规则的简单学习,到神经网络的诞生,AI开始像人脑一样学习,开始尝试大量数据。

上不如老,下不如小,现在还不如AI?

图片来自真格基金分享

直到2017年,谷歌首次提出了Transform模型,取代了此前的CNN和RNN两种神经网络学习方式,这一模型的核心在于注意力机制,让AI在学习的过程中关注重点而非全部,大大降低了模型训练所需的时间。Transform模型问世以后,很长一段时间里都是机器翻译领域的主流模型。

而将Transform模型拆开来看,可以分成编码器和解码器两个部分,编码器负责把自然语言序列转化成数学表达,而解码器则是负责把数学表达再转化为自然语言序列,即我们日常能够看得懂的语言。

OpenAI的自然语言模型GPT就是属于后者。

上不如老,下不如小,现在还不如AI?

图片来自真格基金分享

从2018年推出了GPT-1之后,该自然语言模型系列一共经历了3次迭代。相较于GPT-1,GPT-2并没有太多结构上创新,只是数据更多了,参数从原来1.17亿增加到了15亿。而在GPT-3上,OpenAI再一次加大了对于数据量的投入,训练参数直接达到了1750亿个,上千亿的参数和更类人的智能也让其成为了自然语言模型里程碑式的产物。

到了今天的主角ChatGPT,再一次颠覆了“AI究竟能够多像人类”的认知。

上文提到,ChatGPT现在更能理解人类的指令和意图,根本原因在于ChatGPT和InstructGPT都加入了“从人类反馈中强化学习”的训练方式。

相比于原来训练标注师单纯输入固定的结果模版,这种训练方式加入了人类有可能对于结果的反馈,并将不同的结果进行排序,通过奖励模型让AI不断地在人类的反馈中迭代、调整,这样一来,提前让ChatGPT与有可能的反馈产生交互,使得最后生成更符合人类指令或者意图的答案。

上不如老,下不如小,现在还不如AI?

值得一提的是,虽然是兄弟模型,但InstructGPT无法判断人类下达的指令是否是不正当的,仍然存在一些“毒性”,而优化过后的ChatGPT则能够意识到这一点,敢于质疑不正确的前提。

在算法模型的不断迭代下,加上数据量不断提升,“AI越来越聪明,也越来越努力。”

同样,AI绘画能够在今年爆火,也是因为底层技术实现了重大突破。

从识别用户输入的文字语义,再到生成一幅AI绘画作品,这其中的难点之一在于AI需要实现从文字到图像的跨模态生成。

让我们先把时间拨回2014年。彼时,GAN对抗生成网络的提出标志着AI图像生成迈出了关键一步,但遗憾的是,GAN生成的结果可控性差、图像分辨率较低、不能实现文字和图像之间的跨模态生成。

因此,CLIP模型出现了。2021年,OpenAI提出了基于NLP(自然语言理解)和CV(计算机视觉)的多模态预训练算法CLIP,可以将CLIP模型简单地理解为不同模态之间架起的一座桥梁。

不过,真正引爆AI绘画的,还是Diffusion扩散模型的应用。

扩散模型就是一种生成图像的方法,在正扩散过程中,给图像添加噪声,让图像变成了一堆随机的噪声,然后通过逆扩散给图像去噪,学习图像是如何生成的,相当于让AI换了一种学习画画的方式。

伴随着今年Stability AI对扩散模型的改进之后,模型的计算降低了对算力的要求和对内存的消耗,从前动辄半天、一天的生成速度已经快进到秒级别,这也是为什么在Stable Diffusion开源以后,AI绘画能够迅速在C端走红的原因。

目前的AIGC已经能够实现文字、图像、音频以及视频等多领域、跨模态的内容生成。

招商证券认为,得益于深度学习模型的不断完善、开源模式的推动以及数字内容供给需求的不断增长,AIGC将会呈现指数级的发展增速。在技术加持下,一场AIGC的变革正在酝酿。

03 寻找技术和商业化的交点

生成式AI的进步不断地给人以惊喜,在应用层,应该如何寻找技术和商业化的交点?

近日,ChatGPT的火爆之余,马斯克在推特上也对ChatGPT提出了关键性的问题:每次对话的平均费用是多少?

而OpenAI首席执行官Sam Altman给出的回复是“每次对话的平均费用可能只有几美分”,正试图找出更精确的测量方法并压缩费用。

上不如老,下不如小,现在还不如AI?

类似于ChatGPT这样的对话式AI产品,最早出现在2016年。随着技术的发展,近些年来也被广泛运用在AI客服、虚拟数字人和电话营销等领域。不过,从效果上看,这些产品仍然不够智能,此前中国联通的AI客服冒充人工,还被用户识破发到网上调侃了一番。

此次ChatGPT的出现,不仅仅带来了技术的关键性变革,也让对话式AI产品的商业化前景变得更加清晰。

而相较于ChatGPT,AI绘画的商业化则走在更前面。

量子位智库发布的报告认为,多模态能力的提升将成为AI真正实现认知智能和决策智能的关键转折点,在未来1-2年,“文字-图像”的生成将快速落地。

从海外市场的情况来看,不仅有谷歌、Meta、微软等科技巨头跑步入场,随着Stable Diffusion的开源,一大批初创企业也如雨后春笋般涌现。

再看国内的情况,百度较早地嗅到了AI绘画的机会,在今年8月就发布了基于其飞桨、文心大模型的AI绘画软件文心一格,而初创企业里,也有盗梦师、TIAMAT、达利AI、6pen等公司开始冒尖。

现阶段AI绘画仍然处于大量投入的早期阶段,商业模式仍然在探索中。

就拿这次在C端爆火的众多AI绘画软件来看,光锥智能了解到,意间AI绘画是积分制,初始积分是20,当积分消耗完毕后可以通过观看广告视频来继续获取积分;盗梦师、6pen以及百度的文心一格都是免费生成一定数量的作品之后,按量进行收费。

总的来看,目前国内的AI绘画软件变现模式单一,且C端的用户大多数只是出于好奇心的尝试,愿意付费的仍是少数。根据6pen的调研,60%的用户从未在AI绘画产品上有过付费行为,剩下40%的用户中,付费超过100元占比仅10%。

上不如老,下不如小,现在还不如AI?

C端的付费意愿并不高,因此,诸如工业设计、游戏制作等B端场景或许会成为AI绘画未来的一个重要落地方向。

值得注意的是,AI绘画如果真的在不久的将来实现大规模商业化落地,那么内容生产方式的变革也会进一步加速。

光锥智能向盗梦师的To B产品负责人李庆功了解到,过去专业设计师大多使用的都是PS这类的工具,但目前盗梦师已经在尝试研发面向专业生产场景的AI生成工具,这种全新的创作交互方式不仅能够让AI来执行设计流程,甚至于连设计师的灵感都可以由AI来提供。

这就意味着,跟原先被AI替代的单一、重复工种一样,AI绘画的出现也会替代掉一部分的工作。谁会成为下一个被替代的?

04 结语

当我们在谈论AI时,我们究竟是在谈论什么?

从AI诞生之日起,它的任务就是要进一步解放生产力。顺着AI发展的脉络来看,通过不断模拟人脑的思考过程,AI逐渐具有了对数据和语言的理解、推理、解释、归纳、演绎的能力,越来越像一个人类。

当然,目前的AI对于人脑的探索远远未触及核心情感层,但我们不得不承认,AI正在酝酿着一场生产力的变革,而这必然会引起新一轮人类价值的转移。

回顾人类历史,每一次生产力变革的背后,技术都在不断地将人类从单一、繁重、重复的劳动中解放出来。从体力劳动开始,到脑力劳动,在这一过程当中,人类的劳动形式逐渐发生改变,并依次叠加。而伴随着AI往更高阶的智能进发的同时,另外一种劳动形式也顺势出现。

借用知乎上一位答主的话,那就是想象力劳动。

区别于脑力劳动,想象力劳动的核心在于灵感和创意的提供。

上文提到,ChatGPT能够根据人类简短的指令生成代码、编写故事,AI绘画也能够识别关键词的语义进行创作,本质上AI正在承担并且有能力承担一部分的人类劳动。因此,人类已经无需去思考其中的过程,只需要给AI提出问题、把自己的灵感告诉AI即可。

也正因为AI天然具有根据指令执行的机械思维,所以AI无法真正理解人的情感和多样性,即使AI可以替代程序员写代码、替代作家写故事,但是它所有的灵感来源依旧要从人类那里获得。

根据传播学者梅尼赛的研究,技术进步之后,引发社会变革的途径之一就是创造新机会和产生新问题,前者引发产业结构和社会结构的变化,而后者推动新制度的转型。

AI作为新一代科技革命技术,它的进步也在不断反推人类去思考,我们的新问题、新机会在哪儿。

       原文标题 : 上不如老,下不如小,现在还不如AI?

© 版权声明

相关文章