大模型们别挤了,没啥机会了
文|郑亦久 上半年还没过去,第一个被大公司收购的国内AI大模型创业公司就出现了——光年之外。 创始人王慧文因为生病住院而无法继续带领创业公司继续向前,无疑是一场不幸的意外
文|郑亦久
上半年还没过去,第一个被大公司收购的国内AI大模型创业公司就出现了——光年之外。
创始人王慧文因为生病住院而无法继续带领创业公司继续向前,无疑是一场不幸的意外。最终由早期投资人王兴和美团全权接管这家原本的明星AI大模型创业公司,似乎又在意料之中。
美团官方给出的说法也非常直接:“收购有助于加强美团在AI行业的竞争力”。
不知道美团的本地生活业务有多少需要依靠尚未落地的AI大模型来提高效率,但对于互联网巨头而言,AI大模型业务在目前始终都是证明自己依然保持着科技敏感度与先进性的重要一环,有好过无。
图源:网络
事实上,在光年之外启动之后,国内的AI大模型创业也一度成为了红海。
除了巨头扎堆入场之外,王小川、李开复、闫俊杰等知名企业家也都加入了这场竞赛,根据腾讯科技的统计,超过十家AI大模型创业公司都已经入场,既要争夺人才,又要抢融资渠道,当然还要持续考虑算力的问题。
以上这些都还只是有着各种光环加持的明星创业公司,根据另一份统计,今年以来国内官宣做大模型的公司数量已达到了70多家,其中不乏对标OpenAI的初创者和巨头公司。
这种极致内卷的环境显然已经许久未见。
01想好靠山了吗?
不过一个很吊诡的事实是,光年之外作为这一波大模型浪潮融资金额最多、估值最高的公司之一,从2月高调宣布入局到现在,始终处在媒体关注的前沿,但直到目前也没有官宣任何大模型或者应用产品,外界更多的关注依然还在组局人王慧文身上。
反倒是四月才正式官宣起步的百川智能,在6月15日发布了首个70亿参数量的中英文预训练大模型——baichuan-7B。
4月下旬,出门问问宣布推出AI大模型“序列猴子”后,紧接着就向港交所申请了上市,即便其大模型在招股书中并没有任何商业化进展。纵观上半年的国内大模型赛道,一个非常典型的现象便是大公司依然具有相当巨大的身位优势。
不论是百度还是阿里,都在很快的时间里既拿出了训练参数不低的大模型,也在第一时间做出了面向消费市场的文心一言、通义千问等通用类产品。光是这一点其实就不难看出,在这个赛道上,从零开始的创业公司与手握大把资源巨头们的差距。
OpenAI那个小而美团队的成功,让人看到了一种可能。但硬币的另一面是,OpenAI背后其实有着微软全方位的支持和协作,不论是数据、算力、云服务,全世界都很难再找到比微软实力更雄厚的提供方,更不用说动辄百亿美元的资金支持。
因此,OpenAI绝非典型意义上的创业公司,更像是早早就被巨头看中的技术孵化器。
当国内的大模型创业公司表示自己要对标OpenAI时,它们是否确定自己已经找到了一个能够为其解决大量资源问题的靠山?
02无法实现算力竞争,那谈什么?
除了人才和资金之外,一个更现实的问题则是训练算力,这几乎直接决定了AI大模型的效果。
算力二字对应到现实中等同于拥有的英伟达商用数据中心GPU的数量,在AI大模型的训练与参数调教上,现在英伟达旗下A100、H100及其中国定制减配版A800、H800几乎没有现成的替代品,不仅仅是国产替代没有,即便是AMD、英特尔也拿不出同等档次的硬件。
更不用说,还有英伟达在CUDA软件生态上长期以来建立的护城河,都使得真正想要在短时间内实现大模型训练的创业公司,无法选择其他产品。这也是英伟达过去一个月里股价狂飙的原因,别无分店的“卖铲子”实在太挣钱了。
问题在于,不论是A100、H100还是A800、H800,并不是有钱就能买到,在这波大模型浪潮开启之后,GPU的争夺早就白热化。
根据《晚点 LatePost》之前的报道,今年春节后,拥有云计算业务的中国各互联网大公司都向英伟达下了大单。
字节今年向英伟达订购了超过10亿美元的GPU。而一个真正能够面向消费市场的AI大模型以及应用,需要多少算力支持呢?
技术咨询机构 TrendForce在6月发布报告称,OpenAI需要约3万块A100来持续优化和商业化ChatGPT,算力不够也成为GPT-4迟迟无法大规模开放使用的瓶颈。
做一个简单的计算不难看出,国内大模型创业公司在第一轮融到的钱,甚至很难获得太多算力层面的竞争力。
同时,最近的一则消息则让情况雪上加霜,根据《华尔街日报》的消息,美国商务部正考虑的新限制将禁止在没有许可证的情况下销售A800芯片,相关规定可能在下个月出台。
这意味着即便是性能阉割的A800、H800,以后可能也是有价无市。
向中国出售的A100(“阉割版”A800)与A800对比甚至包括直接向中国AI公司出租云服务进行大模型训练的规避方式也被纳入了限制的范围,这一局面只会让国内的AI大模型创业在本就收益不明的情况,额外增加大量成本。
不论是通过租用国内现有算力维持,还是寻找更低效的国产替代,都将会直接影响大模型训练和通用产品进度,在几乎以天进化的AI创业赛道里,时间不等人。
从这个角度来看,光年之外率先被美团收购或许不是什么坏事,毕竟国内的互联网巨头就这么几个,接下来等着被收购的AI大模型创业公司却可能遍地都是,这条赛道留给小玩家的机会几乎聊胜于无。
原文标题 : 大模型们别挤了,没啥机会了