国产大模型诸神之战

资讯 1年前
1.11K
国产大模型诸神之战

王慧文有资本,王小川有经验,闫俊杰有技术。

“面向AI时代,所有产品都值得用大模型重新升级。”

4月11日上午,阿里云峰会·北京如约而至。在会上,阿里董事会主席兼CEO、阿里云智能集团CEO张勇作出这番判断,并宣布阿里旗下所有产品都将接入“通义千问”大模型,进行全面升级、改造。

继百度、360、商汤科技等科技巨头之后,阿里终于拿出了自己的大模型产品。在阿里强势入局后,国产大模型的“诸神之战”来到高潮。虽然这些产品距离openAI的ChatGPT仍有差距,还是能让投资者、用户产生无限遐想。

这还远不是国产大模型的最终格局。狂热的市场氛围和蠢蠢欲动的资本裹挟下,还有更多科技大佬加入再创业天团,纷纷拿出自己的新项目:美团联合创始人王慧文的“光年之外”A轮融资后估值达到10亿美元,前商汤科技副总裁闫俊杰新公司MiniMax的首款大模型产品Glow累计用户已突破百万,前搜狗创始人王小川也在昨日宣布入局……

在移动互联大潮褪去,激荡三十年成为历史,年轻人创业项目多数沦为炮灰的时候,AI风口给这些科技圈中年大佬带来新的刺激。王慧文、王小川、闫俊杰们,能借此机会再造下一个美团、搜狗、商汤吗?MiniMax、光年之外,谁又能成为中国版openAI?

       阿里逍遥子亲自出招,国产大模型“诸神之战”开启

4月11日这场发布会,对阿里,对张勇本人来说都可谓意义深远。这既是张勇亲自挂帅阿里云之后首次公开活动,也是阿里大模型产品“通义千问”正式亮相的日子。

“通义千问”的最大卖点,并非对标ChatGPT或者百度“文心一言”的生成式AI文本对谈,而是打造一个完整的大模型技术底座,并接入阿里系所有产品。

张勇在会上透露,钉钉、天猫精灵等产品在接入“通义千问”进行测试后都变得“更聪明了”,也更具人性。淘宝、天猫、优酷、盒马、高德地图、钉钉等阿里系产品分别覆盖零售消费、流媒体、地图导航、本地生活和在线办公等场景,这些赛道和AI大模型原本的交集并不多,未来还有很大想象空间。

 用张勇的话来说,这是一种全新的业务形态:模型即服务MaaS。在未来,MaaS将和原有的PaaS、IaaS架构形成合力,重构阿里云的商业版图。

此外,在打通阿里生态的基础上,“通义千问”还将延续阿里云的开源传统,向外部开发者开放API接口。

事实上,早在去年9月推出“通义”大模型AI技术底座时,阿里达摩院就宣布向全球开发者开源、开放。张勇则表示,“通义千问”的上线及开源只是第一步,阿里云未来十年将持续普及AI算力,并释放更多技术红利,降低价格。

从市场反应来看,“通义千问”的预期效果至少不逊于百度“文心一言”,张勇的阿里云首秀也交出一张合格的答卷。行情显示,截止发稿时阿里巴巴港股股价微涨1.33%,盘末虽有所回落,但延续了过去几个交易日的良好走势。 

(图片来自富途牛牛) 

然而,阿里也只是开了个好头,未来的路不一定好走。

从百度抢发“文心一言”到360上线“360智脑”,再到昆仑万维、商汤科技纷纷跟进,国内叫得上号的科技巨头均已加入大模型赛道。这一场期待已久的诸神之战才刚刚拉开帷幕,所有人都拿出了自己的看家本领,谁都不敢说自己有绝对胜算。

3月底,360举办了“2023数字安全与发展高峰论坛”,周鸿祎亲自登场介绍尚未改名的AI搜索引擎,并进行了现场演示;赶在阿里云北京峰会前一天,“360智脑”系列大模型产品官宣落地搜索场景,并向企业用户开放测试。

用周鸿祎的话来说,“360智脑”系列最大的优势是应用场景。预计可以为中小企业的数据获取和处理、人工知识训练等环节提供帮助。在进一步融入360 B端数字安全系统之后,则将推出企业私有化AI服务。

和360一样,百度也占据场景优势。搜索是生成式AI和大模型落地的第一站,百度、360则是国内搜索市场资深玩家,能第一时间抢占用户心智。

没有场景优势的昆仑万维、商汤科技们,也在寻找自己的特点。昆仑万维在4月10日宣布“天工3.5”大模型将于4月17日开启内测,其最大卖点是技术接近ChatGPT3.5大模型的水平。商汤科技的“商量SenseChat”则有多轮对话、超长文本理解能力等特点,并开发了编程、健康咨询等新功能。

不过资本对这些新项目也不是照单全收。昆仑万维的“天工3.5”由于是和奇点智源联合研发,基于阿里大模型预训练,含金量大打折扣。在产品发布后,市场也不为所动,4月10日股价甚至直线走低。

当然别忘了,还有许多低调却无法忽视的大厂尚未出招——比如腾讯、京东和字节跳动。甚至在这些巨头之外,还有不少初创团队也对大模型风口虎视眈眈。

在研发出ChatGPT之前,openAI的名字并未为人所熟知。但正式这个规模并不算大的科技新贵,超越了谷歌、微软,率先搅动大模型一池春水。

成为下一个openAI,则成为无数中国科技创业者的目标。

“中年大叔”创业者成团:王慧文、王小川、闫俊杰“三英”战巨头

过去几个月,大模型创业大军也不断扩充。

就在阿里“通义千问”发布前一天,搜狗创始人王小川也正式宣布加入大模型创业梯队,拉上老搭档、前搜狗COO茹立云,组建约50人的初创团队。而在王小川之前,最受关注的大模型创业项目是美团联合创始人王慧文旗下的“光年之外”。另一个低调的创业团队,实力同样不可小觑——前商汤科技副总裁、通用智能技术负责人闫俊杰创办的Minimax。

综合分析这三位大佬的项目发展状况、未来规划和团队组成,价值研究所(ID:jiazhiyanjiusuo)其特点、优势相当明确:王小川有经验有人脉,对AI技术了解很深;闫俊杰不仅自己拥有博士学位,团队骨干来自全球顶尖学府;王慧文虽然不懂AI,但架不住其背后有强大的资本助力。

王小川的王牌:经验和产品思维

首先看王小川的“百川智能”。根据每经网的报道,该项目目前已收获5000万美元启动资金,计划年内发布“国内最好的大模型和颠覆性产品”。虽然搜狗已成过去式,但王小川在搜狗身上积累的不少成功经验,仍能复制到“百川智能”身上。

在技术上,王小川的前瞻性有口皆碑,搜狗过往的多款产品都带有AI色彩。早在2011年,王小川就在内部探索AI技术,发力语音输入、跨语言信息处理等项目。2017年,搜狗翻译通过综合运用算法大数据和深度学习等技术,将翻译错误率降低10%-20%,错误率足以比肩谷歌同年发布的Transformer架构。

又比如运营上,王小川的产品思维同样令人印象深刻。通过搜狗输入法为浏览器导流,打通浏览器、搜索和输入法流量内循环通道,这一做法甚至被周鸿祎学去,成为360发动“3Q”大战痛击腾讯的王牌。

不过王小川也有自己的问题:不擅长长期规划,制定战略时略显悠游寡断,对团队管理也没有那么得心应手。在“百川智能”创业发布会上,王小川也承认自己更像一个职业经理人。

在创业阶段,王小川还不用太担心管理、长期战略等问题。但随着时间推移、团队规模扩大,他始终要正视自己的不足,并努力改掉这些缺点。

王慧文的“钞能力”:豪华VC天团撑腰

接着了解王慧文的“光年之外”。

没有产品不要紧,一级市场已给这位大佬送上第一份厚礼——10亿美元估值。支撑资本估值逻辑的,是王慧文幕后强大的朋友圈:老搭档王兴出钱出力,初创团队里还有北京智源人工智能研究院副院长刘江、一流科技创始人兼CEO袁进辉,以及王小川的老熟人、“搜狗输入法之父”马占凯。

有趣的是,“光年之外”的办公地点,也选择了王小川熟悉的地方——北京搜狐网络大厦。在开业首日,顺为资本、真格基金、腾讯云纷纷送上祝贺花篮,王慧文背后的资本版图也逐渐明晰。

据报道,在“光年之外”的启动资金中,除了王慧文自己投入的2500万美元和王兴以个人名义投入的1500万美元,真格基金投资额也达到1000万美元。此外,坊间广泛流传腾讯云会成为A轮融资的金主,而拉腾讯云入局的,是另一个资本大鳄红杉中国。

openAI的高管曾多次表示,大模型非常烧钱。有钱就有底气,王慧文的“钞能力”就是最好的护身符。不过王慧文的命门也很明显:没有技术背景,对AI的认识肯定没有王小川、闫俊杰那么深。有鉴于此,王慧文需要加大招募力度,不断充实技术团队。

闫俊杰的护身符:硬核科研团队保驾护航

最后看闫俊杰的Minimax。和前面两个大热项目相比,Minimax胜在起步时间早、规划清晰,实绩也最能打。

在今年2月召开的小型媒体沟通会上,Minimax表示已初步搭建文本到语音、文本到文本、文本到视觉三大模态的基础架构,也是国内第一家拥有这三种模态的大模型初创企业。此外,其面向C端的AI聊天社交软件Glow推出4个月用户量突破百万。

有意思的是,王慧文的优势、不足刚好和闫俊杰相反。论人脉、论经验,闫俊杰和前面两位大佬不在一个级别。成立前期保持低调,也和资本的克制状态,缺乏炒作意愿有一定关系。唯有低调干实事、拿出实绩。而幕后一支强大的研发团队,则是Minimax和闫俊杰致胜的法宝。

闫俊杰本人就是十足的科技大咖。光是在深度学习和计算机视觉领域,其发表的顶级期刊论文就超过100篇,被Google Scholar应用超过一万次。MiniMax的技术合伙人杨斌是闫俊杰的中科院校友,技术团队中三分之一成员拥有博士学位和世界顶尖实验室的工作经历。

事实也证明,做出成绩后资本自然会亲自投诚。

根据资深互联网观察家、天极网创办人林军的爆料,Minimax是国内第一家估值达到10亿美元、迈过独角兽门槛的大模型创业公司,红杉中国、米哈游都是其老股东。此外,林军还透露Minimax新一轮融资信息,除了老股东外,IDG资本跟投4000万美元,腾讯等大鳄也蠢蠢欲动。

有钱、有经验、有技术,在日渐壮大的大模型创业大军中,王慧文、王小川和闫俊杰组成的“三巨头”无疑已领先其他竞争对手一个身位。在AI风口的催化下,王小川们也有望带动中国科技圈新一轮创业热潮。

不过和上一个十年不同,这一批创业大军,越来越老了。

大模型创业者年龄不小,为何“老伙计”比年轻人更吃香?

在上一个互联网创业黄金年代,年轻就是本钱。

马云在1995年首次创业时刚过而立之年,35岁便带领日后成为一代传奇的“十八罗汉”成立阿里巴巴,同年收获了高盛领投的500万美元首轮融资。在阿里成立的前一年,27岁的马化腾和同学张志东在深圳成立腾讯计算机系统有限公司,随后以20%的股权向IDG资本和香港盈科数码换来了220万美元初期融资。

这两位后来一手塑造中国互联网黄金十年、影响无数创业者乃至整个行业发展命脉的大佬,都在自己的青壮年时期迈出创业的关键一步。紧随“二马”的步伐,进入千禧年后,更多怀揣“改变世界”梦想的年轻互联网人踏入了创业大潮。

一手改写中国电商格局的拼多多在2105年成立时,创始人黄铮年仅35岁;2009年,31岁的陈睿创立B站,次年同样31岁的王兴成立美团,并第一时间拿到红杉中国的1200万美元融资;2012年字节跳动成立时,张一鸣才29岁……

在价值研究所(ID:jiazhiyanjiusuo)看来,移动互联时代的创始人们集体年轻化,和行业特性息息相关:时至今日,年轻人仍是移动互联网的主力用户,读懂年轻人的需求,则是创业成功的第一秘诀。

黄铮在回顾创业经历时说过,受家庭环境影响,他从小就十分关注身边同龄人的消费习惯。父母的节约习惯,至今仍影响其商业思维。拼多多成立之初,对准的正是五环外那一批下沉市场用户。

张一鸣则在进入微软工作后意识到,当时的科技企业都在做一些“离基础用户很远”的项目,没法普惠所有人。他为字节跳动第一个爆款产品今日头条起的slogan是“你关注的才是头条”,让创作、阅读融入每一个普通人的日常。

这群互联网新贵和起步于上世纪的马云、马化腾一样极具洞察力和前瞻视野,熟练掌握年轻用户心智,带火了团购、外卖、社交电商、短视频等一个又一个风口。投资机构则为这些年轻的创始人们源源不断地输送弹药,滋养了一个又一个互联网巨头。

但进入AI时代后,情况又不一样了。

大模型有很高的技术门槛和资金门槛,面向的也不仅是C端用户。要做好大模型项目,技术、资本缺一不可。而且随着时间推移,技术不断进步,这些门槛只会越来越高。有人脉、有经验的中年再创业天团,才是最符合资本要求、最具冠军相的那一批玩家。

面对这种情况,可能有人会说创业难度加大了,普通人的上升通道再次收窄。但在价值研究所(ID:jiazhiyanjiusuo)看来,这不过是最简单的优胜劣汰,也是技术风口更迭下的必然。

正如林军所说,AI创业的门槛是越来越高,创业者的年龄也越来越大,但这群中年创业者的激情并不输年轻一代。在本已实现财务自由、可以尽情享受人生的时候重出江湖二次创业,吸引他们的既是AI产业的光明未来和无限想象空间,也是再次改变世界的抱负。

AI、大模型的大门并未向任何人关闭,只不过敲门砖比之前更具含金量了。劣币驱逐良币的情况将不复存在,这一场关系资本和技术的马拉松竞赛,只有综合实力最强的团队才能走到最后。

写在最后

4月11日下午,国家网信办发布了《生成式人工智能服务管理办法(征求意见稿)》(简称《意见稿》),意见反馈截止时间为今年5月10日。在《意见稿》中,网信办提到国家支持人工智能算法、框架等基础技术的创新和推广,但要求相关企业、用户遵守法律法规和社会公德。

在此之前,马斯克等科技大佬曾呼吁抵制ChatGPT,意大利等国政府也出台了相关禁令。在资本狂欢、创业者和巨头陷入混战之时,生成式AI、大模型的未来也充满不确定性。面对科技伦理、应用边界等一系列争议,监管部门的角色不可或缺。

说到底,任何一项技术从萌芽到成熟,再到向全行业、全社会普及,总会走一些弯路,经历一些阵痛。可以肯定的是,政策十分支持大模型、生成式AI的发展,规范监管制度也是为了保证科技向善,发挥相关技术的真正作用。

和移动互联网时代诞生的电商、移动支付等新物种一样,生成式AI和大模型也让部分用户望而生畏,又无可奈何。但现在,有多少人能离开移动支付和电商?

价值研究所(ID:jiazhiyanjiusuo)认为,AI是一个不可逆的科技发展趋势,预期恐惧技术、抵制技术,不如主动拥抱技术,善用技术。

    来源:雷科技

           原文标题 : 国产大模型诸神之战:王慧文、王小川、闫俊杰“三英”战巨头

    © 版权声明

    相关文章