百度文心一言叫板ChatGPT,中国商业暗战已打响
相比于在消费端的热闹,企业级市场的商战已经打响。国内各行业都动起来了,很可能趟出一条大模型toB路线。文|游勇 石兆编|赵艳秋《狂飙》里的高启强说,风浪越大,鱼越贵。现在,这正在类ChatGPT大模型市场发生
另一位资深人士说,金融业有大量数据分析工作,大模型如果可以按照数据分析师的思路和方式,实现大部分数据分析和处理的工作,将会提高业务的效率。“当然,这要看未来人工智能是否能成长出一种能力,能识别金融数据和渠道信息的真实性。”一位曾在国有银行从事大数据业务的资深人士告诉数智前线。
在生物科技领域,天壤此前将人工智能模型用于蛋白质的研究,比如大分子药、酶的改造。以前的通用做法是,拿一个长度一两百的天然蛋白质,对某些地方进行局部改造,变成一个新的蛋白质,不仅耗时耗力,且未必成功。因为有非常多的可能,它需要人工不停地去试,花大量时间去验证。现在在大模型的帮助下,能够非常快速、准确地认识一个蛋白质,需要哪一块核心结构就保留下来,然后通过生成式大模型生成一个新的蛋白质。
不仅如此,通过生成式AI技术,甚至可以生成自然界中不存在的蛋白质。据估计,人类目前已知的天然蛋白质数量为10^15,而未知空间中还有很多可能解决医疗健康、能源环保等挑战的功能蛋白质没有被触及。这些工作都需要更大的模型、更多的算力和海量数据支持才能得以实现。
在教育领域,一位从业者告诉数智前线,他们在畅想包括真正的人机对话语言学习;给定关键词,让AI写故事和画绘本;出考题试卷等应用场景。虽然人机对话之前就运用多年,包括智能音箱和各类语音助手,但普遍表现得不太智能。如果能用大模型优化体验,能带来很大的想象空间。
02
“等待国内大模型”
尽管OpenAI的ChatGPT在消费端得到了热情追捧,但在国内的行业商业落地上表现得不尽如人意。
一家企业称,上周微软的人到他们公司推广OpenAI的服务,是toB类的。但这项服务存在一些比较突出的问题:一是不允许私有化部署,只能使用微软提供的API接口。中美在应用部署上的习惯不尽相同,比如美国的很多客户,包括政府机构都习惯使用公有云,但中国很多大中客户出于安全等考虑,会要求私有化部署。
二是成本较高,不算运行训练成本,相关服务的平均价格大约为每次调用2美分。智能客服企业云蝠智能创始人魏佳星也告诉数智前线,上个月他们试运行了ChatGPT,感觉“一般场景很难负担得起”。他分析说,智能客服业务,每一通电话对客户的收费才0.12元,利润在2分钱左右,当这项产品的调用成本降到1分钱人民币时,行业里才可能会像用水用电一样使用起来。
上述家装平台负责人也表达了类似的看法,“ChatGPT用在家装设计环节,节省设计师两三天时间,花这个钱还是很合算。但如果是客服就不太划算,调用成本太高。”
三是OpenAI提供的API接口目前还比较单一,只能提供几个功能,更无法与企业业务流深度绑定,更像一个大外挂。
鉴于上述原因,多家行业企业人士告诉数智前线,“真正应用需要等国内的大模型起来了”。毕竟大多数公司都不会自己做训练大模型这样的烧钱规划,只有等待国内类似ChatGPT的大模型出来后,看推广深度,有没有私有化部署和改造的机会。
无论是从商业模式还是成本上,行业企业都希望国内能出现比较能打的类GPT大模型。期望他们提供更切合中国企业习惯的服务,也能够在价格上更符合国情。
“再过一年,大模型的成本肯定会降下来,GPU的算力在往上涨,推理的速度会更快。而且模型本身还有很多地方可以优化,工程上做得也更加紧缩。”国内做通用人工智能的创业公司天壤创始人薛贵荣告诉数智前线。
除了上述之外,市场调研公司IDC高级分析师卢言霞对数智前线分析,大语言模型的商业化落地还面临两方面的挑战:安全和技术。安全方面在于ChatGPT生成的内容产生的版权问题,内容造成的虚假宣传问题如何管控,以及伦理问题。目前有些厂商在发力数字水印,向数据多媒体添加数字信息来达到文件的版权保护,人机内容生成的辨别等。
在技术方面,主要是目前问题回答的准确度仍然不够,模型数据无法实时更新,造成的答案内容不及时,中文语料库不足,导致ChatGPT在回答中”水土不服”等技术问题。不过,随着预训练大模型的广泛应用和升级,准确度和效率会有所改善。
而一家制造型企业的数字化资深人士告诉数智前线,实体企业最关心的还是业务层面的问题,包括供应链、产能、良率、交付时间,“新技术如果能在这些要素上取得收益才会去考虑,否则都是炒作概念,无法落地。”
让AI大模型跑出来,需要与真实场景方方面面匹配,让客户可以更低门槛、更有效率、更低成本地应用AI大模型,如何让AI大模型从巨头的参数游戏,成为产业的普惠技术,也是巨头必须要做的事情。
03
中国企业路在何方
ChatGPT走红之后,国内大企业的热情彻底被点燃,百度、阿里、腾讯、字节、华为、快手、小米等纷纷表态,自家有类ChatGPT的技术或即将推出相关产品。
由于中文比英文难理解太多,这涉及技术、汉字信息熵比英文字母高很多、互联网中文信息质量等问题,初心资本李可佳对数智前线说,国内第一版出来后,遭遇的挑战会更多,但好处是知道这里面的差距在哪里,再慢慢地跟上。“而每一次价值链的重构,都是一次巨大的商业机会。”
不过,一些人士认为,中外企业在大模型上的差距正在拉大,对中国企业能不能在技术商业上迎头赶上,有一定疑虑。但以目前聚焦最多、外界给予压力最大的百度来分析,客观来讲,中国企业已具备必要条件。
ChatGPT给用户带来惊艳的背后是大语言模型的功劳,而训练大模型主要是三大要素——算法、数据和算力。百度、阿里、华为、浪潮都有超大模型的训练和实战经验。比如,2021年底,百度已发布文心ERNIE,参数规模为2600亿,与海外大模型处于同等数量级上。它还可实现文字生图,具备了多模态的技能。这也是人们猜测OpenAI随时可能发布的GPT-4,极有可能做的一件事。
不过,百度技术委员会主席吴华此前表示,虽然在百度文心大模型中,涉及各种理解和生成的能力都有,但ChatGPT是在展现方式上使用户能更加容易、以自然语言的方式去实现交互,是一个革新性的认识,对自己有很大启发。而根据用户反馈,也会快速优化大模型。
高质量的数据投喂是训练大模型的另一个关键要素。虽然ChatGPT未公布训练数据集,但根据GPT-3的描述,大约有31亿个网页内容、书籍、维基百科,之后还添加了代码托管平台Github的各种代码。此外,英语约占46%, 德、日、中文等则各占大概5%,总体为3000亿单词的语料。
业界人士告诉数智前线,中文的处理方式不能照搬。国内企业在中文数据处理上有更多经验,在中文语料上更丰富,也可借助英文语料进行优化补充。而关键的是,融入对中国文化理解的本土化AI模型,对市场和用户是最好的。国研新经济研究院创始院长朱克力告诉数智前线:据他了解,百度“文心一言”GPT模型目前在版本更新上已有较大进步,针对中文语料上做了大量调整,在快速迭代和语义准确方面能够发挥得更优。
除了上述行业因素,百度已形成了全栈布局,从底层的人工智能通用芯片昆仑芯,到人工智能框架飞桨,到大模型文心,最后是上层应用如搜索、小度、Apollo智舱系列产品等,都在“文心一言”生态圈,这四层能实现端到端优化,形成更高效的大模型 。而大模型训练有非常高的成本,全栈能力也意味着,任何一层的改进,都可能会优化和降低成本。
而大模型的发展,也会反过来推动企业的业务晋级。比如,OpenAI在GPT模型上导入了至少1万个英伟达GPU,大模型应用意味着需要更多的算力。百度自研的通用人工智能芯片昆仑芯已更新了两代产品。昆仑芯科技告诉数智前线,大模型对计算的要求主要体现在算力、互联和成本三方面,而算力的核心就是人工智能芯片。就大模型而言,他们已做了布局优化,也有切实落地,在研的下一代产品会有进一步提升。
云业务也是这个逻辑。OpenAI的ChatGPT是通过微软云对外提供服务,“文心一言”则将通过百度智能云对外提供服务,行业可以通过API和基础设施,搭建AI模型和应用。
随着企业进入深度用云阶段,智能服务已成为行业的必选项。百度集团执行副总裁、百度智能云事业群总裁沈抖曾介绍,之前企业选择云厂商更多是看算力、存储等基础云服务,以后企业对云的需求会更加聚焦智能服务,会更多看框架好不好、模型好不好,以及芯片-框架-模型-应用这四层架构之间的协同是否高效。
某种程度上,大模型等AI产品将改变云行业的格局。这一趋势已在美国云厂商中显现。2022年,美国云厂商实现高增长,以微软Azure云分析,自动驾驶、医疗制药、智能制造等需求增长,使其AI算力营收增速超过100%。AI计算正成为美国云厂商的竞争焦点。在国内,各家云厂商去年投入汽车云,也是看重自动驾驶等AI计算带来的高增长。随着AI计算、AI算法和软件、AI大模型等爆发式增长,云服务将从数字时代跃迁到智能时代,这将为云打开发展空间。这对百度智能云是有利的。此前,它已连续四年稳居AI云服务市场第一,让制造、交通、能源等传统行业受益。根据财报,2022年,百度智能云全年总营收177亿,同比增长23%。
而未来比拼的关键是,谁能降低大模型的应用门槛,谁能以更低成本提供AI产品,将大模型进行行业普惠。百度此前在文心大模型推出时,针对开发者发布了一系列开发套件、API和开发平台,同时为增加人们对大模型的认知,也实践建立文心·旸谷社区。而百度智能云也在推进AI基础设施和大量通用AI产品。这些实践对接下来文心一言的行业普惠都很关键。
这些天,一些中国创业团队也宣布将加入通用大模型的竞争中来,这为市场带来更多活力。但大模型动辄千万美金起步的基础设施建设投入和海量的训练数据需求,注定了它极高的研发门槛。有业内人士称,未来3年是巨头之间的竞争。
除了具有先发优势的百度,中国具有大模型能力的大企业随后也将有可能官宣进入该市场,而人工智能和大模型在行业市场上的开发、落地和普惠,将会是科技界下一个阶段的竞争焦点。
原文标题 : 百度文心一言叫板ChatGPT,中国商业暗战已打响