中国AI今天的问题，是大模型又多又乱

资讯 1年前

1.43K

OpenAI的开发者日活动后，GPTs模式引发了新一轮的AI热潮，开发者调用过分火爆，甚至导致OpenAI服务器一度宕机。随后，花式把玩GPTs的经验，以及围绕这种新形态的巨大争议开始涌现。中国的IT从业者、软件开发者与AI工程师也积极参与讨论，迎来了一场新的AI狂欢

OpenAI的开发者日活动后，GPTs模式引发了新一轮的AI热潮，开发者调用过分火爆，甚至导致OpenAI服务器一度宕机。随后，花式把玩GPTs的经验，以及围绕这种新形态的巨大争议开始涌现。中国的IT从业者、软件开发者与AI工程师也积极参与讨论，迎来了一场新的AI狂欢。

但在这种氛围下，却有一种沉默显得像个显眼包。那就是绝大多数大模型公司，似乎都沉默了。为了模仿类GPT的大模型，中国AI圈用了一年时间，雨后春笋般打造了上百个大模型。但其中能够诞生明星应用，能够推动产品创新，甚至能够拥有规模化用户的似乎都寥寥无几。当OpenAI的飞轮效应显现，这些大模型公司就有种越是模仿差距越大的感觉。于是干脆不去追新的热点，埋头把眼前能做的先做完。

记得今年年初的时候，社交网络和媒体都在讨论中国能否有大模型？

当时我们说过，这其实是个伪命题，因为中国早就有大模型。而在ChatGPT爆火之后，中国AI遇到的问题一定不是大模型太少，而是大模型过剩。

今天，这种问题开始浮现了出来。此刻中国AI行业最大的问题，就是大模型太多，而且还挺乱。

摩肩接踵的大模型

中国到底有多少AI大模型？经过一年的井喷式发展，这已经变成了一笔糊涂账。上半年的时候，答案大概是几十个。时间来到11月，有人说是一百多个，有人说是二百多个。总之，中国此刻必然是全世界拥有大模型最多的国家，远远超过美国。

但是，这一百多个大模型有人用过吗？有人对比、评测过吗？恐怕没有。因为除了几个头部大模型形成了用户规模外，其中大部分存在于开源社区，还有一部分只存在通稿里。

这就像什么呢？其实很多人不知道，根据相关数据，中国有2600万足球人口，同样居世界第一。我们无从考证数据从何而来，反正周围踢足球的人看着是不多，而国足的成绩有目共睹。

为什么会出现这么多大模型呢？

首先是今年大模型赛道好，机会难得。虽然科技板块的VC市场非常低迷，但在其他互联网创投项目普遍失效，虚拟货币被严格限制的情况下，AI大模型成为今年近乎唯一的故事。因此即便热钱不多，但还是集中涌向了大模型创业。

其次，与很多人设想的不同，大模型创业并没有真正意义上的高门槛。一旦以股权、期权等方式吸引到了合适的人才，大模型创业公司过多的费用支出。相比于其他科技领域有产品研发、用户推广、硬件化等烧钱选项，在拥有大量开放数据集、免费工具的情况下，仅仅是训练大模型并没有过高的成本门槛，并且所谓大模型项目，往往一个科研团队就可以支撑，不需要像互联网创业公司搭建较为复杂的业务体系。

此外，还有一种“刷业绩”式的大模型，极大程度增加了大模型数量。这种一般是高校、科研机构相关团队，选报大模型方面课题更容易获得立项。其结项结果发布后，大模型数量就又增加了一个。或者是大型企业上级要求做大模型，于是IT部门会根据开源的模型框架搭建一个出来，即使效果不佳，落地困难，也要进行对内对外宣传。

赛道好、成本低、需要完成任务，这几种动力，导致中国大模型越来越多，且产生效率越来越快。

但问题在于，足球人口规模可能确实很重要，但更重要的是有一支能踢进世界杯的球队。

没有希望的窄赛道

那么有人或许要问了。大模型数量说难道不能成为优势吗？我们靠数量出奇迹，说不定数量一多就能选出拔尖的来？

这恐怕并不现实。因为从种种理由来看，今天庞大的大模型规模，都是不可能持续存在。通稿打造类GPT模型而挤入下一个科技时代的美好想法，已经将AI大模型变成了一条没有希望的窄赛道。

我们可以来正视这样几个问题：

1.大模型的数量多，其实和大模型本质背道而驰。

提起大模型，我们会说它的优点是模型的泛化性、高鲁棒性，继而带来了“智能涌现”效果。我们总是惊叹OpenAI的成绩，就是因为GPT系列始终在深度挖掘模型的泛化性。也就是说，大模型的优势就是一个顶一群，用一个模型代替一堆模型，结果反而出现了数量过剩的大模型，这与大模型初衷南辕北辙，并且浪费了海量的社会资源。

2.大模型是底层技术，底层技术的玩家不可能很多。

仅仅以AI开发为例，模型之上还有AI芯片、AI框架。在过去几年，这些领域也有很多厂商布局，但最后大多不了了之。AI芯片无法出货，AI框架无人问津，能够剩下的只有头部一两家而已。大模型也是同样的道理，这是一个注定洗牌到存量很少的赛道。

大模型，距离开发者很远。

绝大多数初创大模型，都会选择开源吸引开发者的模式。但现实情况是，这些模型无论是与国外开源大模型，还是国内头部大模型相比，都没有实际竞争力，无法形成规模化的开发者聚合效应。这些大模型普遍是开源时大力宣传一波吸引关注，但开发者实际体验后马上遇冷。

4.大模型，距离用户很远。

在可见的场景中，绝大多数大模型都缺乏商业化支撑，是这个赛道最大的问题。对应大模型创业型企业来说，一开局就是最艰难的局面。后来广受诟病的机器视觉公司，在开局阶段还有智能安防市场作为支撑。但大模型公司拥有的只是算法，甚至连一条可行的商业化通道都找不到。

这些问题，导致堆积了巨大数量的大模型赛道开始变得并不美好。它今天的情况是，说算法，各个创新；说参数，各个庞大；说调用，根本没人用；说商业，根本没去想。

模型一多，乱象也多

大模型一多，产业赛道开始热络起来，也必不可免出现一些问题。这就是我们说的，大模型不仅有点多，还有点乱。

由于目前阶段，有一股“大模型用不用不重要，先要拥有大模型”的思潮。因此就开始有各种方式降低大模型的开发成本，通过话术夸大价值，甚至硬蹭大模型热度，把不是大模型技术的项目包装成大模型，进而导致大模型圈子里，开始出现良莠不齐、鱼龙混杂的态势，我们可以列举其中的几种：

1.打榜刷分型大模型。由于大模型数量庞大，且实现思路基本一致，这就导致不同公司之间的差异化微乎其微。而为了凸显自己的差异化与领先性，目前通用方式是硬造一个技术术语，然后宣传通过这项技术自身项目刷新了某榜单纪录，在某测试中跑出了多少分。

事实上，大部分榜单都只测试模型的某个维度，可以进行针对性调参。打榜刷分并不难，且有比较大的操作空间。类似的，社区开发者打多少颗星，发了多少篇顶会，也都是惯用的包装方案。

2.结项为主型大模型。有很多用作课题结项，或者企业数字化成果结项的大模型。评审结束，结项成功，开源开放，这三条做到就是它们的生命终点。这类大模型不考虑应用场景与后续更新，有某种朝生夕死的精神特质。

3.动辄开源型大模型。软件开源当然是大势所趋，但随着这几年中国开源事业的兴旺发展，AI模型开源似乎变成了某种“时尚”。加上一些企业更愿意将大模型的开源与免费作为流量聚拢工具。开源，逐渐成为了低质量、低维护大模型的遮羞布。

4.冒名顶替型大模型。大模型火了之后，开始有公司打起了蹭热点的主意。于是，用并非标准预训练大模型技术冒充大模型，甚至干脆把古早的对话机器人、应用软件包装成大模型的案例屡见不鲜。用大模型的瓶子，装其他老酒，也成为了一门生意。

5.套壳变身型大模型。最近，一些创业公司套壳国外开源模型的事件引起争议。其实业界类似手法并不少见，将开源大模型进行改写和包装，摇身一变，成为自研大模型的例子非常多。

这些大模型队伍里的妖魔鬼怪，也纷纷可以通过发明术语、加强定语的方式，来宣传自己的创新能力和差异化。最终导致把真正的技术创新，淹没在了一系列的“伪装创新”当中。

中国AI之春，在去掉90%的大模型之后

如果我们看美国的大模型产业结构，会发现它处在一个每层数量差异不大的金字塔结构里。即OpenAI一家独大，谷歌、微软、Meta、X保持持续竞争力，此外还有20几个较为常用，开发者群落比较活跃的大模型。

当然咱们不是说一定要照搬美国，但从中大概可以看见一个科技大国，在目前情况下大模型产业体量是什么。

中国大模型，已经在短时间内发展出了远远超过本身应有存量的大模型。数量过于庞大的大模型，一方面浪费了极大的研发、算力，以及数据资源；另一方面也蕴藏了一场并不会太久的“危机”。

在资本泡沫相对冷却之后，我们很容易看到这样的情况：忽然之间，众多大模型开始停止更新，紧接着大模型领域的公司大量倒闭。伴随着资本退场，员工待遇下降等问题开始发生，于是媒体开始唱衰大模型寒冬，社交媒体上开始冷嘲热讽AI这门技术。

这种行业猛然转冷，大概率会给真正具有竞争力、创新能力的中国AI企业带来巨大的麻烦。

但是请记住，这并不是AI不行了，而是这些AI公司和大模型项目本来就不行。

这不是AI寒冬，而是中国AI的春天刚刚要真正开始。产业优化重组后的大模型产业形态，才是真正能发挥出中国在应用创新、产品打磨、产业智能化落地等领域的优势。

在中国，相对良性的大模型产业形态，应该是有5家左右可以互相竞争的主流大模型，1到2个能够进行底层技术创新，保持全球竞争力的大模型体系，同时有一系列开源大模型作为补充，以及一些学术领域的大模型作为AI for sience的支撑。此外，还要具备较为完善的大模型配套设施，包括AI芯片、AI计算、深度学习开发框架、AI开发工具，并且这些领域都有较高的自主化程度。换言之，必须要淘汰今天超过90%的大模型。