文心一言,开幕?
ChatGPT API上线, 文心一言希望满满。 文|王凡 & 秦怡 编辑 | 小白 出品|极新 01 大模型带来的商业机会天花板在哪里 就像李彦宏在大屏上展示的内容里,大模型带来的商业机会天花板吸引了诸多目光
ChatGPT API上线,
文心一言希望满满。
文|王凡 & 秦怡
编辑 | 小白
出品|极新
01
大模型带来的商业机会天花板在哪里
就像李彦宏在大屏上展示的内容里,大模型带来的商业机会天花板吸引了诸多目光。在文心一言的带动下,“三把尖刀”的发展值得期待。首先是新型云计算公司的未来将不会遥远。文心一言将根本性地改变云计算行业的游戏规则,MaaS(Model as a service模型即服务)可以称得上是为专用模型给垂直客户提供服务的新窗口。如果把云计算公司视为一辆汽车,那么Maas的发展可以被视为其核心动力,客户也将会注重这辆汽车的实践表现。在未来文心一言企图通过百度智能云构建企业模型,对外提供服务,让AI与云计算的模式助力多元行业迭代升级,突出对于产业空间的可操作性。
其余两把尖刀就是行业模型精调的公司以及基于大模型底座进行应用开发的公司。前者处于模型层与应用层的中间位置,其行业服务能力影响着客户的实际需求能否真正得到满足,后者主要是针对在AIGC背景下应运而生的“破壳企业”提供应用服务,其发展能力自然不必多言。
02
真刀实枪,还是空穴来风
目前,AIGC 产业生态体系雏形初现,基础层、中间层、应用层三层架构层层相扣。以高门槛的预训练模型为基础搭建的 AIGC,技术基础层正是核心所在。在基础层足够坚实之后,大模型的垂直场景化模型开发将更加顺畅,ChatGPT-4展现出来的超然能力让它在大模型发展方面傲视群雄,尤其是在编程方面的“独家窍门”更是创造了新燃点。
对比ChatGPT-4,李彦宏在文心一言的“编程方面”似乎显得不那么自信,这一点并没有在现场展示,这似乎也意味着文心一言的能力局限。在中文世界里,大量强大的互联网公司并没有滋生出Github这种高质量的全门类代码仓库,这也成了百度的痛点。与前辈们相比,文心一言的创作能力、RLHF训练的强度、RL模型选择、多模态的工程细节方面还需要打磨。参数和数据训练的频次是否到位,基于人类反馈的强化学习算法是否能够精准,将 NLP 技术和机器学习结合的能力是否足够科学化,大语言模型商业化对于C端是否足够友好,这都是李彦宏需要考虑的问题。
OpenAI发展多年,ChatGPT-4发布的迅速和准备的成熟度证实了其很显然不是工程缝合的产物,对比之下,百度的仓促有些令人感慨。
03
文心一言,是横空出世还是酝酿已久
虽然如同李彦宏描述的那样,文心一言要走的路还很长。但是我们不能否认百度在模型训练方面得天独厚的优势。作为百度基于其文心大模型技术推出的大语言模型,文心一言可谓是在关爱下长成的“温室花朵”——如百度知道、百度文库、百度知识图谱、百度搜索等百度旗下多款应用均能有效支撑大模型的训练与迭代,为助力文心大模型快速成长为全球领先的大模型提供着充足的养料。
百度打出的这一枪,说突然也突然, 现场采用录制而非直接尝试,甚至有小道消息“用人工推进人工智能,在文心一言运行出错的时候员工要顶住”,引起一片哗然;但是,说正常也正常,一方面是因为十年磨一剑,霜刃未曾试,百度已经在这里倾注了大量的心血;另一方面是虎视眈眈的竞争对手:微软已经宣布在 Bing 搜索、Azure 云服务、Teams 等产品中加入 ChatGPT 技术,并期待在 Office 套件中也集成 ChatGPT;谷歌基于 LaMDA 模型推出 ChatGPT 的竞品Bard,Meta官宣将开源新的范围从 70 亿到 650 亿参数的大预言模型 LLaMA……面对重重压力,百度希望“横空出世”也情有可原。
04
文心一言还有多少时间?
百度的发布会观众买账程度并不高,议论纷纷,这与文心一言所处的环境有关,目前中文 NLP 数据集稀缺、质量参差不齐,中文互联网的发展并不等价于高质量的语言积累,在展示上也显示出中文大语言模型发展缓慢的缺陷,这正是百度的本质缺陷。
但是,这样的环境也给了文心一言新的发展空间,在发布会上对于古诗创造的能力,各类评测上对于中文语言的理解都不逊色于ChatGPT-4。当然,文心一言的发布会上,最动人心弦的一幕应该是视频的生成,尽管时间很短,也不会直接向用户开放,但是也跨出了新的一步——未来的大模型的输入输出将是多元多样的,文字对话,图像、音频、视频等多种形式或许都会成为可能。相较于DALL-E 2 从文字生成图片,以及Make-A-Video 从文字生成视频,文心一言似乎迈出了更远的一小步,这也意味着用户的期待,就是潜力的所在。
“文心一言”目前包含以下五类落地场景:文学创作、商业文案创作、数理逻辑推送、中文理解、多模态生成。对于百度而言,技术从未止步,2010年百度CTO王海峰成立自然语言处理部,2019年就推出了文心大语言模型,2012年百度的飞桨深度学习平台研发了4D混合并行技术,2022 年百度核心研发费用超200 亿元,百度在爬虫技术、搜索技术以及占有搜索数据量上面的优势依然为其争取了喘息时间,在高时效性高准确性的团队运营理念下,深耕AI领域多年的百度应该不会造出一款“胡编乱造”的新产品,李彦宏其实从未放松对于超大规模模型的训练处理的追逐。
05
C端唱衰,但是B端还有余地
表现平平的发布会甚至影响了百度股价;但是B端热情不减,企业对调用文心一言接口抱有期待,认为其还是大有可为。目前,医疗、教育、互联网、银行等各领域为文心一言的投资已经成为现实,例如邮储银行通过“邮储大脑”接入并应用“文心一言”的能力,吉利汽车应用在其银河的全新智能座舱系统的人工智能交流对话领域;能链智电将智能对话接入能源供应链、资产管理、零售等场景。办公软件、OA、ERP 等企业日常管理经营必备系统也同样期待着文心一言的发展带给他们新的红利。
对待文心一言的发展,有几个问题至关重要,也是B端投资者极为关注的问题:首先,对于信息特别是数据自身的关联,其能否建立背后的逻辑;其次,文心一言能不能在可预见的未来提供独特的洞见,而不仅仅只是一个更高级的传声筒;最后,更低门槛,面向场景研发更好的 AI 模型会不会生长成为一个普惠性的工具而不是象牙塔里的宝物。
唱红或者是唱衰,百度和文心一言一直在路上,多年的积累与沉淀给了百度底气,ChatGPT-4的发展也帮助文心一言做对照。让我们一起拭目以待。
头图来源:unsplash
本文原创:极新(jixintech)
原文标题 : 文心一言,开幕?