谷歌内部文件泄露，开源社区威胁大

资讯 1年前

1.09K

“谷歌不会是AI竞争中的赢家，OpenAI也不是！”当地时间周四，一份披露了这样信息的谷歌内部文件在全网疯传，引起热烈的讨论。俗话说，福无双至，祸不单行。要问硅谷巨头们这段时间谁最头疼，那绝对非谷歌莫属

“谷歌不会是AI竞争中的赢家，OpenAI也不是！”

当地时间周四，一份披露了这样信息的谷歌内部文件在全网疯传，引起热烈的讨论。

俗话说，福无双至，祸不单行。要问硅谷巨头们这段时间谁最头疼，那绝对非谷歌莫属。

先不说自家的AI大模型巴德（Bard）姗姗来迟，差点没赶上这波AI大潮。近日，“AI教父”杰弗里·辛顿（Geoffrey Hinton）宣布自己从谷歌离职，他对自己所从事的事业感到“深深地后悔”。并四处奔走相告“AI太可怕！人工智能很有可能演变成一场灾难”。这让谷歌一边失去了“图灵奖”大佬的技术和名望支撑，另一边又陷入“AI威胁论”中不能自拔。

就在这份文件曝出的当天，谷歌、微软、OpenAI和Anthropic的CEO与美国副总统卡玛拉·哈里斯（Kamala Harris）和高级政府官员会面，讨论关键的AI问题。也就是说这边正开着会，谷歌那边的内部文件就遭到了泄露，这怎么能不让谷歌一个头两个大。

据悉，这份文件来自于谷歌的一名工程师。他在文件中直言不讳地说，“我们没有护城河，OpenAI 也没有”。他认为在这场空前激烈的AI竞争中，谷歌正在失去先前作为AI领军人物的地位。但这并不意味着“风头正劲”的OpenAI会是最后赢家，因为他们都还没意识到一股强大的第三方力量正在崛起——AI开源社区。

根本没有所谓的“护城河”

谷歌发愁不难理解。一个是愁这样的言论会不会影响公司形象，影响股价；另外一个是意识到此言非虚。AI开源社区比他们预想的发展速度要快很多。

自诞生之日开始，OpenAI就宣布GPT不会开源，你如果想用上这项技术，就来跟我合作。可谁也没想到，“二五仔”Meta狠狠的助攻了一把。

Meta开发的LLaMA（大羊驼）大模型，还没捂热乎就因为泄露而走上了开源的道路。这下可不要紧，直接引爆了开源社区，让那些被高昂训练成本筑成的“护城河”拒之门外的各路开发者，纷纷大展拳脚。Meta真不愧是AI界的神兽……

其中斯坦福最先发布了一个由LLaMA 7B微调的模型Alpaca，训练3小时，性能就比肩GPT－3．5。之后经过指令跟随微调的开源大语言模型如雨后春笋一般大量涌现，如在树莓派 4B 上运行 LLaMA 模型、在笔记本上对 LLaMA 指令微调、在 MacBook 上跑 LLaMA 等。大模型的开发门槛已经从一个主要研究机构下降到一个人、一个晚上和一台强大的笔记本电脑。

虽然LLaMA本身存在一定缺陷，但是开源之后快速的迭代速度能逐渐补完模型。

最近，由UC伯克利主导的LMSYS Org发布了大语言模型排行榜，来比较热门的大语言模型实力究竟如何。

其中UC伯克利自己推出的Vicuna－13B拥有130 亿参数，以 1169 分稳居第一。同样 130 亿参数，与Vicuna师出同门的Koala（考拉）位列第二，LAION 的 Open Assistant 排在第三。清华推出的 ChatGLM只有60 亿参数，但依然冲进了前五，只比 130 亿参数的 Alpaca 落后了 23 分。而Meta 原版的 LLaMa 只排到了第八（倒数第二）。