神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。
编者按:生成式人工智能正在科技领域掀起一股浪潮。那么,哪些公司将会从中受益,生成式人工智能将在哪些领域体现出最高的价值呢?本文来自编译,希望对您有所启发。
当下,我们开始看到生成人工智能技术堆栈出现的早期阶段。数以百计的新创业公司正在涌入市场,开发基础模型,构建人工智能原生应用程序,并建立基础设施/工具。
对于许多热门技术趋势来说,在市场跟上其脚步之前,就已经被过度炒作了。但伴随生成式人工智能热潮的,是真实市场的真实收益,以及真实公司的真实投入。Stable Diffusion 和 ChatGPT 等模型正在创造用户增长的历史记录,一些应用程序在发布不到一年的时间里,就达到了1亿美元的年营收。并排比较显示,人工智能模型在某些任务上的表现,比人类好几个数量级。
因此,有足够的早期数据表明,大规模的转变正在发生。我们不知道的关键问题是:在这个市场中,价值将在哪里产生?
在过去的一年里,我们会见了几十位直接处理生成式人工智能的初创公司创始人,和大公司的经营者。我们观察到,到目前为止,基础设施供应商可能是这个市场上最大的赢家,他们获得了流经堆栈的大部分资金。应用程序公司的营收增长非常快,但在留存率、产品差异化和毛利率方面却经常遇到困难。而大多数模型提供商,虽然对这个市场的存在负有责任,但还没有达到大规模的商业规模。
换句话说,创造最大价值的公司(即训练生成式人工智能模型,并将其应用于新应用程序的公司),并没有获得大部分价值。预测接下来会发生什么要难得多。但我们认为,关键是要理解堆栈的哪些部分是真正的差异化和可防御的。这将对市场结构和长期价值的驱动因素(如利润率和留存率)产生重大影响。到目前为止,除了传统的护城河之外,我们很难在堆栈的其他地方,找到结构性的防御能力。
我们非常看好生成式人工智能,并相信它将对软件行业及其他行业产生巨大影响。这篇文章的目标是描绘出市场的动态,并开始回答关于生成式人工智能商业模式的更广泛问题。
1. 高级技术堆栈:基础设施、模型和应用程序
为了理解生成式人工智能市场是如何形成的,我们首先需要定义当前的堆栈是如何形成的。以下是我们的初步观点。
堆栈可以分为三层:
-
Applications 层:将生成式 AI 模型集成到“面向用户的产品”中的应用程序,要么运行自己的模型管道(“端到端应用程序”),要么依赖于第三方 API。
-
Models层:驱动 AI 产品的模型,以专有 API 或开源检查点的形式提供(这又需要一个托管解决方案)。
-
Infrastructure 层:为生成式人工智能模型运行训练和提供推理工作负载的基础设施供应商(即云平台和硬件制造商)。
需要注意的是:这不是一个市场地图,而是一个分析市场的框架。在每个类别中,我们都列出了一些知名供应商。我们没有试图做到全面,或列出所有已经发布的生成式 AI 应用程序。我们在这里也不会深入讨论 MLops 或 LLMops 工具,这一点将在未来的文章中讨论。
2. 第一波生成式 AI 应用已经开始达到规模,但在留存率和差异化方面却存在困难
在之前的技术周期中,传统的观点是,要建立一个独立的大型公司,你必须拥有终端客户,无论这意味着个人消费者还是 B2B 买家。人们很容易相信,生成式人工智能领域最大的公司也将是终端用户应用程序。到目前为止,情况还不清楚。
可以肯定的是,生成式 AI 应用程序的增长是惊人的,这是由纯粹的新颖性和大量的用例推动的。事实上,我们知道至少有三个产品类别的年化收入已经超过了 1 亿美元:图像生成、文案写作和代码编写。
然而,仅靠增长还不足以建立持久的软件公司。至关重要的是,增长必须是有利可图的,从这个意义上说,用户和客户一旦注册,就应该会产生利润(高毛利率),并长期留在这里(高留存率)。在缺乏强大的技术差异化的情况下,B2B 和 B2C 应用程序通过网络效应、保存数据或构建日益复杂的工作流,来推动长期客户价值。
在生成式 AI 中,这些假设并不一定成立。在与我们交谈过的应用公司中,毛利率的范围很广,虽然在少数情况下高达 90%,但更多情况下是低至 50%-60%,这主要是由模型训练的成本驱动的。漏斗顶部的增长非常惊人,但目前还不清楚客户获取策略是否具有可扩展性,而且我们已经看到付费获取效率和留存率开始下降了。许多应用程序也相对无差别,因为它们依赖于相似的底层人工智能模型,没有创造出竞争对手难以复制的明显网络效应或数据/工作流。
因此,目前还不清楚销售终端用户应用程序是否是构建可持续生成式人工智能业务的唯一途径,或者是最佳途径。随着语言模型的竞争和效率的提高,利润率应该会提高(下文将详细介绍)。随着人工智能游客离开市场,留存率应该会增加。有一个强有力的论点是,垂直整合的应用程序在推动差异化方面具有优势。但还是有很多东西需要证明。
展望未来,生成式 AI 应用公司面临的一些重大问题包括:
-
垂直整合(“模型+App”)。将 AI 模型作为一种服务消费,允许应用程序开发人员在小团队中快速迭代,并随着技术的进步交换模型提供商。另一方面,一些开发者认为产品就是模型,从头开始的训练是建立防御能力的唯一方法,即不断地对专有产品数据进行再训练。但这是以更高的资本要求和更不灵活的产品团队为代价的。
-
构建功能 vs.应用程序。生成式人工智能产品有许多不同的形式:桌面应用程序、移动应用程序、Figma/Photoshop 插件、Chrome 扩展,甚至是 Discord 机器人。在用户已经使用的东西上集成 AI 产品很容易,因为 UI 通常只是一个文本框。这些生成式 AI 公司中哪些将成为独立的公司,哪些将被微软或谷歌等已经将人工智能纳入其产品线的现有公司所吸收?
-
穿越炒作周期。目前还不清楚当前这批生成式人工智能产品的流失是固有的,还是早期市场的人为产物。或者,对生成式人工智能的兴趣是否会随着炒作的消退而下降。这些问题对应用程序公司具有重要意义,包括何时加速融资;如何积极投资获取客户;优先考虑哪些用户群体;以及何时宣布产品与市场的契合。
3. 模型提供商发明了生成式人工智能,但还没有达到很大的商业规模
如果没有谷歌、OpenAI 和 Stability 等公司出色的研究和工程工作,我们现在所说的生成式人工智能就不会存在。然而,与使用量和热度相比,与这些公司相关的收入仍然相对较小。在图像生成方面,Stable Diffusion 公司已经看到了社区的爆炸性增长。但作为他们业务的核心原则,Stable Diffusion 公司免费提供主要检查点。在自然语言模型中,OpenAI 以 GPT-3/3.5 和 ChatGPT 占主导地位。但到目前为止,基于 OpenAI 构建的杀手级应用相对较少,而且价格已经下降过一次了。
这可能只是一个暂时的现象。Stability 是一家尚未专注于盈利的新公司。OpenAI 有潜力成为一项巨大的业务,随着更多杀手级应用程序的建立,尤其是如果能顺利整合到微软的产品组合中,它将在所有 NLP 类别的收入中获得很大一部分。鉴于这些模型的巨大使用量,大规模的收入可能也不远了。
但也有与之抗衡的力量。作为开源发布的模型可以由任何人托管,包括不承担与大规模模型训练相关的成本(高达数千万或数亿美元)的外部公司。目前还不清楚是否有任何闭源模型可以无限期地保持其优势。例如,我们开始看到 Anthropic、Coherence 和 Character.ai 等公司,在类似的数据集和类似的模型架构上训练出来的大型语言模型,性能更接近 OpenAI 的水平了。Stable Diffusion 的例子表明,如果开源模型达到了足够的性能水平和社区支持,那么专有的替代方案可能会很难与之竞争。
到目前为止,对模型提供商来说,最明显的结论可能是商业化可能与托管绑定在一起。对专有 API(如 OpenAI)的需求正在迅速增长。开源模型的托管服务(如 Hugging Face 和 Replicate)正在成为方便共享和集成模型的有用枢纽,甚至在模型生产者和消费者之间产生了一些间接的网络效应。还有一个强有力的假设是,可以通过微调和与企业客户达成托管协议来盈利。
不过,除此之外,模型提供商还面临着许多重大问题:
-
商品化。人们普遍认为,随着时间的推移,人工智能模型的性能将趋于一致。通过与应用开发者的交谈,我们可以清楚地看到,这种情况还没有发生,在文本和图像模型中都有强大的领导者。它们的优势不是基于独特的模型架构,而是基于高资本要求、专有产品交互数据和稀缺的人工智能人才。这将成为一个持久的优势吗?
-
弃用的风险。依靠模型提供商是应用程序公司起步的好方法,甚至是发展业务的好方法。但一旦达到足够大的规模,他们就有动力建立和/或托管自己的模型了。许多模型提供商的客户分布高度倾斜,少数应用程序代表了大部分收入。当这些客户转向内部 AI 开发时会发生什么?
-
钱重要吗?生成式人工智能的前景是如此之大(也可能是有害的),以至于许多模型提供商已经组织为公益公司(B corps),发行有上限利润的股份,或以其他方式明确地将公共利益纳入其使命。这丝毫没有妨碍他们的筹款工作。但是,关于大多数模型提供者是否真的想要获取价值,以及他们是否应该这样做,还有待讨论。
4. 基础设施供应商触及一切,并能从中获得回报
几乎所有的生成式人工智能都要经过云托管的 GPU(或 TPU)。无论是对于运行训练工作的模型提供商/研究实验室,运行推理/微调工作的托管公司,还是进行两者结合的应用程序公司,FLOPS 都是生成式人工智能的命脉。很长一段时间以来,最具有颠覆性的计算技术的进展第一次大规模地受到计算的约束。
因此,生成式人工智能市场的大量资金最终都流向了基础设施公司。我们估计,平均而言,应用程序公司在推理和微调上会大约花费收入的 20-40%。这通常是直接支付给云计算实例提供商或第三方模型提供商的,反过来,他们又将大约一半的收入用于云基础设施。因此,我们有理由猜测,如今生成式人工智能总营收的 10-20% 将流向云提供商。
除此之外,训练自己模型的初创公司已经筹集了数十亿美元的风险资本,其中大部分(在早期高达 80-90%)通常也花在了云提供商身上。许多上市科技公司每年在模型训练上花费数亿美元,要么与外部云提供商合作,要么直接与硬件制造商合作。
用专业术语来说,这就是我们所说的“a lot of money”(一大笔钱),尤其是对于一个新兴市场而言。大部分钱都花在了三大云服务上:亚马逊网络服务(AWS)、谷歌云平台(GCP)和微软 Azure。这些云提供商每年总共花费超过 1000 亿美元的资本支出,以确保他们拥有最全面、最可靠、最具成本竞争力的平台。特别是在生成式 AI 领域,它们还受益于供应限制,因为它们可以优先获得稀缺的硬件(例如 Nvidia A100 和 H100 gpu)。
但有趣的是,我们看到竞争开始出现了。甲骨文(Oracle)等挑战者已经通过巨额资本支出和销售激励措施进入市场。一些创业公司,如 Coreweave 和 Lambda Labs 也发展迅速,提供了专门针对大型模型的解决方案。这些公司在成本、可用性和个性化支持方面展开竞争。
在幕后,运行绝大多数人工智能工作负载的,可能是迄今为止生成式人工智能领域最大的赢家:英伟达(Nvidia)。该公司报告称,在其 2023 财年第三季度,数据中心 GPU 收入为 38 亿美元,其中相当一部分用于生成式人工智能用例。通过数十年对 GPU 架构的投资、强大的软件生态系统以及学术界的深入使用,他们已经围绕这一业务建立了坚固的护城河。最近的一项分析发现,研究论文中引用英伟达 GPU 的次数是顶级 AI 芯片初创公司总和的 90 倍。
其他硬件选项确实存在,包括谷歌张量处理单元(TPU);AMD Instinct GPU;AWS Inferentia 和 Traini um芯片;以及来自 Cerebras、Sambanova 和 Graphcore 等初创公司的人工智能加速器。后来者英特尔(Intel)也带着高端的 Hhavana 芯片和 Ponte Vecchio GPU 进入了这个市场。但到目前为止,这些新芯片很少能占据可观的市场份额。不过,有两个例外值得关注,一个是谷歌,它的 TPU 已经在 Stable Diffusion 社区和一些大型 GCP 交易中获得了吸引力,另一个是台积电,据信它生产了这里列出的所有芯片,包括 Nvidia 的 GPU(英特尔让自己的晶圆厂和台积电混合制造其芯片)。
换句话说,基础设施是一种有利可图的、持久的、具有防御性的堆栈层。基础设施公司需要回答的大问题包括:
-
保持无状态负载。无论你在哪里租用 Nvidia 的 GPU 都是一样的。大多数 AI 工作负载是无状态的,从某种意义上说,模型推理不需要附加数据库或存储(除了模型权重本身)。这意味着 AI 工作负载可能比传统应用程序工作负载更易于跨云移植。在这种情况下,云供应商该如何创造粘性,防止客户转向最便宜的选择?
-
幸免于芯片短缺的终结。云供应商和 Nvidia 本身的定价,一直是由最理想的 GPU 供应稀缺所支撑的。一家供应商告诉我们,A100 的标价自推出以来实际上有所上涨,这对计算硬件来说是极不寻常的。当这种供应限制最终通过增加生产和/或采用新的硬件平台而消除时,这将对云提供商产生什么影响?
-
挑战者的云技术能实现突破吗?我们坚信,垂直云将通过提供更专业的服务,从三巨头手中夺取市场份额。到目前为止,在人工智能领域,挑战者通过适度的技术差异化和 Nvidia 的支持,已经获得了一定的吸引力。对 Nvidia 来说,现有的云提供商既是最大的客户,也是新兴的竞争对手。长期的问题是,这是否足以克服三巨头的规模优势?
5. 那么……价值将在哪里产生?
当然,我们还不知道。但根据我们对生成式 AI 早期数据的理解,结合我们与早期 AI/ML 公司接触的经验,我们的直觉如下。
如今,生成式人工智能领域似乎不存在任何系统性的护城河。应用程序由于使用相似的模型,缺乏强大的产品差异化。由于模型是在具有相似架构的相似数据集上训练的,因此面临不明确的长期差异化;云供应商缺乏深度的技术差异,因为它们运行相同的 GPU;甚至硬件公司也在同一家晶圆厂生产芯片。
当然,也有标准的护城河:规模护城河(“我已经或能够筹集到比你更多的资金!”)、供应链护城河(“我有 GPU,你没有!”)、生态系统护城河(“大家都已经在使用我的软件了!”)、算法护城河(“我们比你更聪明!”)、分销护城河(“我已经有一个销售团队了,而且比你有更多的客户!”)和数据管道护城河(“我‘爬’过的互联网比你多!”)。但这些护城河都不可能长期持久。现在判断强大、直接的网络效应是否会在堆栈的哪层占据上风还为时过早。
根据现有的数据,目前还不清楚生成式人工智能是否会长期出现“赢家通吃”的动态。
这很奇怪。但对我们来说,这是个好消息。这个市场的潜在规模很难把握,所以我们预计会有很多很多的参与者,在各个层上都有健康的竞争。我们也希望横向和纵向公司都能取得成功,因为最终市场和最终用户决定了最佳的方法。例如,如果最终产品的主要区别是人工智能本身,那么垂直化可能会胜出。然而,如果人工智能是一个更大的长尾功能集的一部分,那么就更有可能发生横向化。当然,随着时间的推移,我们也应该看到更多传统护城河的建立,甚至可能会看到新型护城河占据上风。
无论如何,我们可以肯定的是,生成式 AI 改变了游戏规则。我们都在实时学习这些游戏规则,有大量的价值将被释放,科技领域将因此变得非常非常不同。而我们正为此而努力!
这篇文章中的所有图片都是使用 Midjourney 生成的。
译者:Jane
免责声明
本文内容(图片、文章)翻译/转载自国内外资讯/自媒体平台。文中内容不代表本站立场,如有侵权或其它,请联系 admin@eiefun.com,我们会第一时间配合删除。