开源大模型到了集中爆发时刻。
ChatGPT 诞生以来,社交巨头Meta就成了开源「急先锋」,3月发布的Llama和7月公布的Llama2都是开源大模型,并以最低的成本追赶ChatGPT-4,令谷歌和OpenAI坐立不安。
8月,阿里云则是国内首家开源的科技大厂,其通义千问系列大模型均开源允许免费商用,被看作将国内「百模大战」带入全新阶段。
开源大模型来势汹汹,也没有完全与闭源大模型打起来。归根到底,商业化是否成功,才是检验大模型的最重要标准。开源是比较理想的低成本试错方式,闭源相对更有质量保障。
科技巨头向开源大模型进击,是行业一次巨大的技术分野。
1 破局
国内的大模型竞争格局正在被重塑。
8月31日,百度宣布大模型应用文心一言对社会全面开放,用户可以在App Store和安卓应用商店下载「文心一言APP」或通过文心一言官网直接体验。紧接着,科大讯飞、智谱清言、百川智能、商汤商量SenseChat等大模型研发公司也宣布开放服务。
这是国内大模型发展史又一个值得记录的重要节点,意味着将真正意义上开启大模型的商业化。
而为了实现弯道超车,阿里云率先成为国内第一个开源大模型的科技大厂,将开源之争推向一个小高潮。继通义千问-7B开源后,阿里云推出的大规模视觉语言模型Qwen-VL一上线就直接开源。
当前,国内开源大模型发展得如火如荼,比如王小川百川智能的baichuan-7B中英文大模型、智源的悟道3.0大模型系列以及面壁智能的CPM-Bee 10B中文基座大模型等都选择了开源模式。
Meta引领的开源大模型风潮吹到国内,且终于形成了「燎原之火」。
7月19日,社交巨头Meta正式发布首个开源商用大模型Llama2,引发科技圈不小的震动。值得注意的是,原本和OpenAI拥有长期、深入合作的微软成了Llama 2的「首选合作伙伴」,该大模型将通过微软云Azure分发。
据介绍,Llama 2 相较于上一代其训练数据提升了40%,包含了70亿、130亿和700亿参数 3个版本。Llama 2 预训练模型接受了 2 万亿个 tokens 的训练,上下文长度翻倍,其微调模型已接受超过 100 万个人类注释的训练,据说性能比肩GPT-3.5,被称为开源最优的大模型。
得益于开源特性,经过训练微调推理,LLama2的700亿参数版本在在9月初实现了加速195%,还能基于云平台实现无代码训练个性私有化模型,并一键部署。
随后,越来越多的开发者加入Meta以及各种开源模型的阵营,并促进了Alpaca、Vicuna、Koala 等多个大模型诞生。它们以远低于 ChatGPT的规模和成本,达到了「四两拨千金」的效果,其性能令人瞩目。
Meta的开源做法,被视为向OpenAI的GPT-4和谷歌的PaLM这两个闭源大模型顶级玩家下「战书」。
Meta在官网表示,「我们相信,开源的方法是当今大模型发展的正确途径,尤其是在技术进步日新月异的人工智能生成式领域。」
回顾大模型的格局变化,主流趋势其实在开源与闭源之间反复切换。
OpenAI进场时,开源是主流。OpenAI的GPT-1、GPT-2都是开源的,GPT-3开源后又闭源。
2022年开始,OpenAI掌握算法加上背靠微软的算力和数据,专心闭源打造产品。这时期,闭源成为主流。
毫无疑问,此次Meta掀起的开源潮流成功地再次搅动了大模型行业已有的竞争格局。
未来,大模型生态开源与闭源并存,已是行业共识。如同移动互联网时代以苹果iOS为代表的封闭模式,和以谷歌安卓为代表的开放模式。
2 奇袭
「我们没有护城河,OpenAI也没有。」
今年5月,谷歌内部一份泄露的文件就预测了开源系统将蚕食闭源系统的可能性。内容中还提到,比起开源社区需要谷歌,谷歌更需要开源社区;开源社区正在赢得竞赛;除非谷歌和 OpenAI 选择和开源社区合作,否则将被后者替代等等。
这些论调引起了科技界的广泛关注,也让公众越来越好奇:开源逆袭的历史,是否会再次上演?
毕竟上一个开源逆袭的传奇故事——安卓系统的发家史,距离现在并不遥远。
2007年1月9日,第一代苹果手机横空出世,科技史从此被改变,也引起了谷歌的恐慌。彼时,微软在电脑端一家独大,凭借Windows操作系统自带的IE浏览器占据绝对优势,而苹果的崛起势必会帮助iOS系统在移动搜索端抢占更大的市场。
为了对抗苹果在移动搜索端的垄断趋势,避免自已的搜索业务受制于其他巨头,谷歌决意押注安卓系统,并免费开源操作系统,便于生产商快速推出搭载安卓的智能手机。
结果大家都知道了,谷歌凭借安卓开源拉拢了众多APP优秀开发者,与芯片制造商及手机厂商合作,创造了一个由设备制造商和移动运营商组成的庞大生态系统,几乎垄断除iOS以外的全部市场。
珠玉在前,安卓的成功给开源留下无限的想象空间。然而,大模型之「大」,注定这只是一场少数处在技术金字塔尖的团队才有资格入局的游戏。
大模型开发是一项涉及底层算力、网络、存储、大数据、AI 框架、AI 模型等复杂技术的系统性工程。为了降低AI应用门槛,首先要构建开源社区,让开发者可以自由探索大模型商业化道路的最优解。
在阿里云搭建的「魔搭」(ModelScope)开源社区,聚集超 160 万的开发者,模型下载量超 2500 万,累计开源开放了 900 多个优质 AI 模型。
另数据显示,截至2022年11月,百度的产业级开源深度学习平台「飞桨」已凝聚535万开发者,服务20万企事业单位,基于飞桨创建了67万个模型。
如果把开源社区比作一棵大树,借由外部力量开枝散叶。那么,云系统便是必不可少的基础设施。
争夺开源开发者,百度「飞桨」无疑给了阿里云压力。
云计算服务需要围绕 AI 模型的训练、推理、部署、精调、测评、产品化落地等各环节展开,要有强大的算力储备支持庞大的GPU 规模,承载更多的亿级参数大模型同时在线训练,提供高性能的存储等等。
无论开源抑或闭源,都只是大厂的不同玩法,远远称不上决一胜负。
从算力视角来看,开源主要是节省企业预训练阶段的算力,由于不同垂类的训练场景更加丰富,训练的算力需求整体会增长。
而OpenAI和谷歌坚持闭源,固有其道理。
大模型的训练成本极高,OpenAI和谷歌「烧」了大量资金,才训练出自己的大参数模型,赢得傲视群雄的江湖地位。一旦开源,意味着其技术秘密将被公众所知,很难维持自家大模型的优势地位。
3 博弈
开源大模型免费的背后,也脱离不了高昂的资金投入。
一家大模型企业开源免费了,其他大模型产品想要收费会很难,各家都在想办法尽快实现商业化。
新的技术趋势给了创新者弯道超车的机会,大厂纷纷将目光瞄准云领域,开源可以帮助它们更快地完成这一目标。
在模型、算力、数据三大关键要素中,国盛证券认为,算力服务是开源大模型浪潮中受益确定性较强的方向,超大模型规模、数据集和日活持续扩大,所需算力将持续增多,对算力的需求将保持高增长。
由于大模型得部署在云上,按照数据运行付费,越多的用户使用模型和资源,对云算力的需求量就越大,云厂家的收入也就随之增加。为此,巨头云在抢夺外部开源大模型上厮杀正酣。
如今,百度智能云推出企业级一站式大模型平台——「千帆大模型平台」,8月升级后全面接入Llama 2 全系列、ChatGLM2-6B等33个大模型,并上线国内103个预置Prompt模板。
腾讯云TI平台已经全面接入Llama 2、Falcon、Dolly、Vicuna、Bloom、Alpaca等20多个主流模型,且支持系列模型的直接部署调用,成为国内第一批上架和支持开源模型的大模型厂商。
阿里云的魔搭社区则有Llama2模型、通义千问系列、澜舟科技的孟子模型、智谱 AI 、百川智能等大模型,支持开发者直接调用阿里云的算力和一站式的AI大模型训练及推理平台。
国内云企业大模型卷了半年,确实卷出了名堂,营收即是重要的体现。
根据百度第二季度财报,百度核心在线广告收入196亿元,同比增长15%;非广告收入68亿元,同比增长11%。在以大模型为代表的AI技术重构之下,百度的传统强项和AI驱动的创新业务都显现强劲增势。
从阿里巴巴截至2023年6月30日止的季度财报来看,阿里云告别上一季度收入下滑的颓势,收入增长4%至251.23亿元。
三大运营商的云业务表现更为亮眼。2023年上半年,天翼云收入459亿元,同比提升63.4%;联通云收入255亿元,同比提升36%。移动云收入达422亿元,同比增长80.5%。
对于有大模型自研能力的科技巨头来说,商业变现是迫在眉睫,建立「护城河」同样不容耽搁。
大模型催生了各种AIGC应用,比起开发C端应用,B端可能是一条更稳妥地竖起壁垒的赛道。何况,大模型向C端收费尚不成熟。
据业内人士总结,企业应用大模型的方式主要三种,构建基础大模型、建立行业大模型、在基础大模型和行业大模型之上开发AI应用。受制于较高的训练成本和技术壁垒,选择或者能够自建大模型的企业寥寥无几,特别是远非中小企业所能承受的。后两条应用路径,是大模型供应商的机会所在。
OpenAI与微软的「婚姻」出现裂缝,实际就投射了微软在云市场的考虑。微软向OpenAI追加100亿美元投资。而转眼,它就拥抱Meta旗下的Llama 2开源大模型。
OpenAI的所有技术还在微软的Azure云基础设施上免费运行,Llama 2需要向其付费,微软云寻求新的增长曲线也不足为怪。
阿里云IPO在即,通过大模型开源收费也确实是一举两得,能能否实现奇袭?多家大模型C端应用已经落地开放,留给阿里云的时间很宝贵。