中国大模型洗牌年将开启,暗藏两大逻辑

来源 | 《财经》杂志 作者 | 《财经》记者 刘以秦 编辑 | 谢丽容  

2024年12月02日 18:44  

本文2927字,约4分钟

高额融资难以持续,短期内技术弯道超车希望渺茫,科技公司们在2025年会减少在技术上的新投入,转向实际应用和商业化,在这个过程中会有一些公司淡出舞台

2024年,AI(人工智能)领域的融资热度终于有所回升。第三方数据机构企名片数据显示,今年前九个月,AI领域共完成融资金额371.5亿元,相比去年同期翻了1倍多。此前AI融资额已经连续两年下滑。

但这一趋势在2025年很难持续。

目前,AI领域的投资方相对集中,以一二线地方政府基金、国央企和巨头科技公司为主,投资方向以AI大模型为核心,包括基础大模型、具身智能、大模型应用等方向。这些方向的特点是资金需求量巨大,也因此大部分的融资额都被头部创业公司拿走了。对应在数据上,今年整体融资额同比翻了1倍多,但融资交易数只增长了约10%。

政府引导基金和国央企组成的国资投资方们,虽然大力支持科技创新创业,但其方向是“投新、投早、投小”,其更愿意投新成立的公司,而非再次投那些已经投过且估值很高的独角兽企业。但接下来还有能力、有决心、有号召力进入大模型领域的创业者越来越难找了。

对于科技巨头们来说,继续对外投资大模型的意愿也在下降。阿里、腾讯、美团等公司已经投资多家大模型创业公司,其本身也有大模型业务,行业竞争越来越激烈,接下来更多的注意力会放在自身业务上,会更关注技术的实际应用。

因此,2025年,一个相对确定的趋势是,高额融资难以持续,短期内技术弯道超车希望渺茫,科技公司会减少在基础大模型上的新投入,转向实际应用和商业化,价格战等抢占市场的动作还将持续一段时间。这个过程中会有一些公司淡出舞台,行业洗牌开始。

亟待形成商业闭环

2022年后,科技巨头和AI创业公司们纷纷投入大模型军备战。中国信通院数据显示,截至2024年7月,全球AI大模型数量为1328个(包含同一企业、同一模型的不同参数版本),美国的AI大模型数量位居第一位,占比44%,位居第二位的中国大模型数量占比为36%。

中国和美国在大模型领域呈现出双强格局,但业内的共识是,中国依然处于追赶状态,尤其在底层技术上,中国科技公司相对薄弱。

2023年至今,几乎所有的头部科技公司都在强调“预训练模型”,也就是通过长期堆算力和数据,将模型训练成接近通用的基座大模型。

所有人都知道这个过程耗资巨大,但只有真正经历过这个阶段的人才清楚到底有多大,持续投入究竟有多难。据媒体报道,GPT-4的一次训练成本约6300万美元,2022年的总训练成本约5.4亿美元。OpenAI称2024年的运营成本将超过85亿美元,预计亏损约50亿美元,预计2023年至2028年的总亏损(不包括股权补偿)将达到440亿美元。OpenAI还提到,模型训练成本还将进一步增长,预计到2026年每年将达到95亿美元。

此外,模型上线后的运营成本也极高,2023年4月,OpenAI每天为ChatGPT支付的运营成本约694.4万美元,年化运营成本约为2.5亿美元,综合年化成本可能超过13亿美元。

对比来看,目前中国头部的AI创业公司单笔融资金额最高在5亿-10亿美元;百度2023年全年的净利润是287亿元(约合41亿美元)。

中国科技公司整体投入的体量没有美国公司那么庞大,但也是一笔不菲的费用。过去大家相对坚定投入有几个因素,对于大型科技公司来说,AI能力可能决定它们是否会被取代甚至淘汰,且AI技术本身和科技公司的业务密切相关,即便要“降本增效”,在AI技术出现新突破时,投入也是必须的。

对于创业公司和投资人来说,OpenAI以及一系列新涌现的独角兽企业证明了这件事的创业和投资价值。它们想做出“中国的OpenAI”,更焦虑于真的有人做成了,但那个人不是自己。

2024年7月5日,上海世界人工智能大会上的大模型、AI+平台能力展示。图:IC

整个科技行业热闹一年多后,不少人冷静下来,他们发现似乎在未来一段时间内,几乎不可能有人能实现这一目标,投资方也意识到大模型的“烧钱”是个无底洞,难以在有限时间内收到投资回报。

大公司们几乎是在开启大模型的第一天就在努力做应用和商业化,创业公司们本可以在早期通过融资,专注打磨技术,但在现实压力下,它们的空间被缩窄,必须提前考虑自我造血。与此同时,市面上的大模型产品和服务没有太多差异化和明显优势,也由此出现了“价格战”。

2025年,中国大模型产业会进一步探索落地应用和商业化机会,良性竞争不能停留在价格上,AI行业需要找到新的突破口。

商业化的基础条件

今天,大模型距离大规模落地应用还有差距。要实现商业化,需要满足几个条件。

一是模型本身的能力。不同的应用场景需要不同的能力,大模型之所以带来巨大的热度,是因为找到了一条大概率能让模型具备通用能力的路径,也就意味着一个基础模型可以在训练后适应绝大部分的应用场景。

二是有愿意为模型能力买单的市场和用户。大部分用户买单的原因是产品和服务能带来价值,价值不光是解决具体问题,如提升工作效率、提供情感陪伴等,市场上还有一类价值是“符合政策方向”。

第三就是要具备找到具体客户并交付的能力,这考验的是AI公司在技术和产品之外的能力,甚至在很多时候,这项能力比技术实力更能帮助AI公司成长。中国的AI市场和美国不同,很难通过平台销售软件的模式打开市场,大部分时候需要抓住一个个的项目和工程来实现商业化。

2025年,大模型依然会在通用的道路上前进,且很难在短时间内实现真正的通用。再加上国外的开源模型能力越来越强,对于多数中国科技公司来说,再去“卷”参数、做预训练价值不大,很可能是几十亿元投入换回“0元购”的订单。但可以通过针对性训练,去提升较小模型的专有能力,也相当于是“降本增效”,是更符合当下市场环境的做法。

巨额投入的AI公司们已经开始陆续对外提供算力服务、模型训练服务等业务。

科技公司们也开始陆续意识到,仅发布一个免费的应用,并不能为公司带来直接收益,C端用户量很难增长,获客成本已经明显提升。更重要的是去直接触及那些愿意付费的行业客户,例如金融、政务、汽车等。2025年还会有更多新行业被挖掘。

通常有大量公司集中进入某个行业时,会出现价格战,因为大家都需要有标杆客户来为之后的市场拓展铺路。价格战会让一些公司主动或被动退出,随后价格恢复常态。但矛盾之处在于,“有钱”的领域大家都想进入。找到那些需求相对分散、竞争者还不多的新领域是一个可选项,但这更适合规模较小或不依靠融资的AI公司们来做。

一些AI公司也开始拓展海外市场,但今天国际形势复杂,尤其是涉及AI技术方面,遇到的挑战更大。不仅如此,一旦进入国际市场,就要和美国公司、欧洲公司正面竞争,会更考验公司的技术、产品和服务能力。

2025年,对于科技巨头公司来说,有自身业务可以和大模型结合,相对安全,更考验的是它们的耐心和继续投入的决心,要跟上新技术的步伐,不断优化研发到应用的流程。创业公司会相对艰难,尤其是今天估值已经很高的独角兽企业,因为需要有力证明自己的商业化能力,甚至要开始考虑IPO(首次公开募股)的方向,这两件事都有挑战。