大模型创业走向B端

资讯 1年前

1.76K

Chaos新观察 No.18 是时候冷静下来，重新思考大模型的价值了。文 | 梧桐报

Chaos新观察 No.18

是时候冷静下来，重新思考大模型的价值了。

文 | 梧桐

报道 | Chaos新观察

ID | GoChaos

封面来源 | Unsplash

短短一个月，隔壁看大模型的记者已经跑了不下5场发布会。

8月31日，国内AI视频技术头部公司百家云召开战略发布会，推出全新大模型产品「百问大模型」。就在两个月前，百家云刚刚发布面向企业市场营销需求的「市场易」GPT大模型。

同样是在8月，百川智能发布公司旗下第三款大模型产品Baichuan-53B。这家创业不到半年的公司，在过去三个月里，连续发布了三个大模型。

......

密集的产品发布，只是今年大模型创业潮的冰山一角。从年初到现在，短短九月间，AIGC创业者数量一路狂飙，“百模大战”带来的硝烟弥漫开来。

有业内人士向Chaos新观察表示，中国目前已发布的大模型早已接近 200个。有通用大模型、垂直行业大模型；有已经落地的、即将落地的，甚至还有一些根本没有考虑落地的。上半年，无论行业、什么领域，似乎都能与大模型来个“沾亲带故”。

有人在狂热中野蛮生长，有人在狂热中黯然离场。大模型创业这场热潮似乎还没有消退，就已经有玩家倒下，成为了第一批炮灰。

行业真的需要这么多大模型吗？大模型创业是否会带来泡沫？哪些大模型真正有价值，哪些只是“套壳产品”？国内外大模型较为成熟的落地应用，有哪些经验可以借鉴......

是时候冷静下来，重新思考大模型的价值了。

大模型狂飙，百模大战开启

2022 年底，OpenAI 正式发布 ChatGPT，迅速破圈，短短 2 个月便用户过亿，引发了全球科技爱好者的狂欢。随着 AIGC、大模型概念井喷，大批创业者涌入，大模型数量呈现爆发式增长。

与此同时，在二级市场，国内A股多家企业接连发布定增预案，拟定增募集资金用于训练大模型，募资金额常常动辄数亿、数十亿。

据科技部5月份发布的《中国人工智能大模型地图研究报告》，中国已发布79个10亿参数规模以上的大模型。其中，自然语言处理仍是最为活跃的重点领域，其次是多模态领域，在计算机视觉和智能语音等领域的大模型还较少。有业内人士估算，目前，国内大模型数量早已逼近200个，甚至有券商报告称，行业正在步入“万模大战”的时代。

在同一时期，硅谷也爆发了一波AIGC创企投融资与收并购的高潮。除了最受关注的OpenAI外，欧美许多行业巨头通过收并购AIGC创企，抢滩打造细分领域的护城河。

其中，最受关注的包括AI初创公司Anthropic获得4.5亿美元C轮融资，其大模型产品Claude被视为OpenAI GPT-4的主要竞争对手；估值超过550亿美元的云计算巨头Snowflake收购Neeva，后者是一家由两位前Google员工创立的生成式AI搜索公司；估值380亿的大数据巨头Databricks斥资13亿美元，收购生成式AI公司MosaicML，帮助企业进行大模型训练。

全球的目光再次聚焦到硅谷。可以看到，人工智能已经成为今年科技领域当之无愧的主战场。然而，频发的大额融资与收并购，也意味着许多初创公司面临着资金枯竭的局面，开始寻求抱紧巨头大腿。

有人开始倒下

AIGC绕不开商业化大考

在千行百业之间的大模型之战一触即发之际，已经有创业者开始倒下。

今年7月，来自美国的AI聊天机器人明星创业企业Jasper宣布裁员，给大模型的创业热泼了一盆凉水。Jasper靠OpenAI的GPT-3发家，而当更强的GPT-3.5/4发布，Jasper就瞬间丧失了产品竞争力，颇有点“长江后浪推前浪，前浪死在沙滩上”的意味。

同样是在 7 月，国内一款名为“妙鸭相机”的 C 端应用上线，爆火出圈。“只需 9.9 元，上传照片就能获取 AI 写真集”、“让海马体们失业”......不过很快，妙鸭相机就受到了用户数据隐私与安全的质疑，其产品价值也被认为“天花板太低”，同质化产品迅速涌现。

热潮之下，创业者们需要更多的冷思考。大模型在今年成为了风口，但它并非是新概念，以百度、腾讯、阿里、华为为代表的国内互联网大厂及科技巨头，均已布局多年。百度在今年 3 月推出文心一言，其前身可追溯到 2019 年的预训练模型 ERNIE 1.0；华为在 2021 年 4 月就发布了盘古大模型；2022 年，腾讯混元大模型问世，阿里则在同年发布通义大模型。

要想打造一个技术成熟的大模型，算法、数据、算力缺一不可，这无不需要庞大的人才与资金投入。国盛证券曾估算，GPT-3 训练一次的成本约为 140 万美元，对于更大的大型语言模型，训练成本甚至在 200 万美元至 1200 万美元之间。

不是所有入局者都能玩得起、玩得转大模型。

在国内，一级市场大额融资越来越难，是国内许多AIGC创业企业面临的尴尬处境。有业内人士评价，目前国内许多AICG创业主要围绕小参数大模型，并且喜欢在各类参数评测上进行比拼，缺乏核心竞争力。

而在二级市场，许多A股上市公司借机炒作概念，也让投资人对于AI项目的出手慎之又慎。

随着竞争提速，国内外的大模型更加需要重点思考如何商业化落地，如何开始通过自身业务造血。

国内的互联网和科技巨头倾向于结合大模型的力量，进一步发布自身所长。百度聚焦搜索、小度智能音箱等场景；腾讯则仰仗微信、QQ 等社交领域的优势；阿里发挥办公、电商等应用所长，华为则拥有 5G、通信等产业基座实力。

新入局的企业，需要避开正面交锋，找出差异化发展之道。

百川智能创始人、CEO 王小川与曾在与极客公园的对话中表示，一家公司不可能把所有赛道都做完。”百川智能在B端选择做开源模型，赋能行业企业，同时内部部署了C端的超级应用。“我们在思考如何追上 GPT-4，思考大模型到底能给 C 端带来哪些应用。”

走向B端，能否成为制胜法宝？

在一场商业化浪潮之中，只有极少数人才能站上浪潮之巅，笑到最后。

“百模大战”并非只有大厂能赢，提升自身技术实力、抓住产业应用场景才是硬道理。

随着时间的推移，公众对于许多AIGC领域C端应用已经开始“去魅”。即使是“老大哥”ChatGPT，也变得不再如原先那般吸引人。分析公司Similarweb数据显示，在今年6月份，ChatGPT网站的阅读流量与访问者数据首次出现了下降。

目前，无论是通过GPT生成文本，还是通过Stable Diffusion生成图像，亦或者通过Llama模型进行多模态任务应用，都还没达到促进产业变革的节点。

这就是AIGC实力的天花板吗？显然不是。

许多企业开始避开C端应用的聚光灯，探索让大模型走进B端，深度赋能产业。

今年6月，腾讯才姗姗来迟般首次正式公布行业大模型研发进展，并发布面向B端客户的腾讯云 MaaS（Model-as-a-service，模型即服务）服务解决方案。不同于百度、阿里等聚焦的通用大模型，腾讯云MaaS的技术底座则是一系列的行业大模型，包括金融、政府、文旅、传媒、教育等，与产业结合，致力于让大模型可以长期可持续发展。

百家云发布的百问大模型也是一个典型的案例。作为一个AIGC场景化平台，百问主打的就是帮助企业私有化部署GPT大模型。

目前来看，大模型要想变成生产力工具，就必须进入应用场景，而百问确实做到了“让新技术更接地气”：一方面百问具备将现有的软件Copilot化，给传统的软件增加更加智能的能力，如在业务系统、办公软件、搜索引擎中加入智能问答，以及帮助企业低成本接入数字人互动直播、智能客服、自动写作等各类AIGC服务等；而另一方面，则是百问可以帮助企业基于AIGC开发全新应用，更好地解决客户问题。

可以明显看到，一些企业在布局AIGC赛道时，选择避开聊天机器人、AI制图等C端爆款应用，转而聚焦相对“无聊”的to B产业端口。

这种打法，也是国外一些AIGC创企的选择。一个有意思的案例是Databricks与MosaicML之间的联姻。

今年6月27日，大数据巨头Databricks斥资13亿美元，收购生成式AI公司MosaicML，成为年度AIGC收购热点。让人出乎意料的是，这场收购竟来源于一场“巧合”。在今年3月份之前，Databricks没想买，而MosaicML也没想卖，双方CEO甚至素未谋面。