张宇:人工智能的发展需要普惠算力

2025年01月02日 15:43  

本文4866字,约7分钟

“如果没有这种既强大又廉价的普惠算力,那么各行业可能真的难以承受人工智能发展所需的成本,毕竟在这个行业中已经流传着这样一句话:人工智能的尽头是能源。”12月27日,中科驭数高级副总裁、联合创始人张宇在“2024《财经》跨年演讲:新风向·大家说”上以“高性能算力底座助力数智经济建设”为题带来了分享。

中科驭数高级副总裁、联合创始人张宇

张宇分享了数字化与人工智能的三要素:数据、算法和算力。他表示,数据价值挖掘与呈现依赖算法和算力,过去几十年人工智能历经了三次浪潮,未来 5 - 10 年将成为各行业创新关键。他认为在人工智能发展的应用中,需要突出算力重要性,其来源涵盖多种形式,算力提升与成本降低深刻影响人工智能,政策和芯片创业企业也积极推动其发展。

张宇同时介绍了数字经济中算力系统的发展应用,并强调了软硬结合的重要性,当前数字算力系统已从通用型转向特定类型联合。中科驭数通过技术打造高性能算力底座,在电信、金融和高端工业等领域大量落地,并在技术布局、算力系统构建上实现了从数据清洗到应用全流程覆盖,通过算力组网得以提升效能降成本。中科驭数还在芯片领域布局,于特定领域构建生态,在操作系统方面打造多个系列产品方案,与行业伙伴共同服务多行业,推动数字经济算力系统的发展与应用走向深入。

以下为嘉宾部分发言实录:

各位嘉宾朋友,大家下午好!今天非常荣幸能有机会和大家一起从算力芯片的角度来聊一聊数字化和人工智能。

事实上,数字化的核心要素与人工智能的三要素,乃至过去几十年数字经济发展的三要素是完全相同的,也就是数据、算法、算力。回顾过去,从信息化逐步发展到数字化,再到如今的智能化阶段,我们在这几十年间积累了大量的文字、图片、声音、视频,以及更为复杂的高质量数据。数据的爆发式增长以及对其价值的挖掘,在今天的分享中也能看出是备受重视的,而且数据资产列表也是当下最为热门的话题之一。

而这些数据价值究竟是如何挖掘出来,又是怎样呈现的呢?这就需要算法和算力作为底层支撑。提到算法,在 2022 年底,ChatGPT 横空出世,瞬间引爆了以大模型为主要技术的通用人工智能(AGI)的热烈讨论,时至今日,我们确实看到各行各业都在积极探讨这一话题。不过,我个人很赞同王坚院士说过的一句话,他在一次演讲中提到,人工智能有着非常短暂却又极其漫长的过去。通用人工智能作为整个智能化或者说数字经济算法发展历程中的重要部分,其实早在半个多世纪前,确切地说是从 1940 年代左右就已经开始萌芽。实际上,到 20 多年前,我们如今所看到的无论是大模型,还是传统的算法,其核心的基本算法在那时就已经基本完备了。

然而,为何直到 2012 年,AlexNet 首次使用 GPU 向整个传统算法证明了在同步识别上具有远超传统算法的优越性呢?这就不得不提到 2023 年诺贝尔物理学奖得主杰弗里,当年他和他的团队在做 AlexNet 的时候,首次大规模使用了 GPU 这样更为强大的算力,才得以处理更多、更复杂的算法。用深度学习的术语来讲,就是能够使用更多的隐藏层、更多的参数以及更大的数据量去训练,进而达到了在当时令人惊艳的效果。所以从 2012 年开始,第三次人工智能浪潮被成功推动起来。人工智能在过去的大半个世纪里经历了三次浪潮,当然其中也有两次被称为“人工智能的寒冬”。

纵观整个发展历程,我们可以发现,在 2012 年首次引入 GPU 之前,更多的是采用通用的计算 CPU 芯片,而从 2012 年 GPU 被证明其价值开始,一直到 ChatGPT 出现,再到这两年我们频繁提及的万卡机器人、十万卡集群等,这一切的背后其实都是对算力的一种核心追求。站在今天这个时间节点,距离 GPU 首次被大规模应用已经过去了多年,就像今天我们看到的邓丽君数字人以及数字员工的精彩展示,人工智能在数字人、各行各业、自动驾驶、巨神智能、AI for science 等各个领域的变革,虽然今天看起来还只是一个开端,但我们坚信,在未来 5 至 10 年甚至更长的时间里,就像黄仁勋提出的 “AI Factory” 概念一样,人工智能必将成为各行业创新发展的核心驱动力。而在其中,最为关键的因素是什么呢?那就是算力。我们是否拥有足够强大、足够好用,更为重要的是足够便宜的算力,来为各行业的人工智能发展赋能。如果没有这种既强大又廉价的普惠算力,那么各行业可能真的难以承受人工智能发展所需的成本,毕竟在这个行业中已经流传着这样一句话:人工智能的尽头是能源。

我们来看一下算力的基础构成,在计算中心,或者说数字化以及算力的基础层面,从这张图中可以了解到,在所有的数据中心或者说计算中心(如今我们更多地称之为算力中心),当我们把每个机柜打开,会发现其中有不同的服务器,再将服务器打开,就会看到所有的算力来源基本上都来自这三种芯片:CPU,它已经有着大半个世纪的发展历程;GPU,从上世纪八九十年代开始兴起,并逐渐成为人工智能领域的核心商业部分;还有 DPU,它主要承担着网络连接的功能,就如同高速公路建设一般。这三种芯片相互协同,构成了我们现在数字经济以及数字经济核心数据的来源基础。单从这方面来看,英伟达无疑是当前最顶尖的算力基础设施的引领者。

我们可以看到,从 2020 年英伟达的 DGX A100 版,到两年前的 H100 版,再到去年的 GH200,其基本上都是按照这样一种算力布局在发展,也就是所谓的 “三U一体”,即 GPU、CPU 和 DPU 的配比,并且在架构上也做了相应的变化。而这正是我们如今在各行各业的上层应用中所看到的那些纷繁复杂且令人惊艳的表现的最底层来源,算力的发展就是这样一个逐步演进的过程。这里有一些具体的数据可以说明,从英伟达引领的角度来讲,在过去的 8 年时间里,其算力提升了 1000 倍。

但同时还有另外一些数据值得我们关注,仅仅对比 2023 年和 2024 年这两年的数据,根据一些报告显示,我们的算力推演性能提升在一年的时间内下降到了原来的 1/4,而训练成本方面,推理成本在仅仅 2023 年这一年的时间里就降低了 86%。这意味着什么呢?这就导致了在 2023 年的时候,GPT-4o的推理成本实际上要比GPT-3还要便宜。

所以说,我们既需要有非常强大的算力不断发展进步,同时也要求算力能够足够便宜,只有这样,我们才能够逐步将人工智能应用到各行各业,并且将其作用发挥到极致,从而推动每个行业的变革发展。回到国内乃至全球的范围来看,我们不得不承认,整个算力的基础建设确实至关重要,因为它承载着所有行业的发展需求。同时我们也注意到,在这两年,国内在算力方面做出了很大的政策支持,并且涌现出了大量的算力芯片创业企业,例如 GPU 相关企业,以及像我们中科驭数一样专注于 DPU 的创业企业,大家都在共同通过创新的方式,努力让算力变得更加强大,更加普惠。

但是我们也要清楚地认识到,整个算力体系光有芯片是远远不够的。正如我之前所提到的,芯片需要被安装到服务器中,然后放置在整个机柜以及数据中心里面,除此之外,还需要有一整套完善的系统,能够将不同的算力整合成为一个有机的系统,这样才能够真正被我们各个行业所应用。在数据系统方面,云计算可以说是整个行业过去几十年发展的集大成者。我们可以看到,在当前最为主流的云计算汇聚模式中,也是将 GPU、CPU 和 DPU 整合在一起进行应用的。所以说,整个算力系统,包括底层的芯片以及上层的数据系统,共同构成了我们整个数字经济的整体算力系统。在这里,我想引用一句非常著名的话,是 LNK 说的,他提到,从算力的角度或者从数字系统的角度来看,如果我们非常关注性能,并且极力追求极致的体验,那么我们就必须既要做软件也要做硬件。在今天的算力发展中,这其实已经成为最为核心的思想,也就是我们常说的软硬结合、软硬异构。我们需要将各种各样的芯片,无论是 GPU 也好,DPU 也好,还是其他的芯片,综合地利用起来。我们也能够明显地观察到,当前的数字算力实际上已经从传统的通用 CPU 逐渐转向了 GPU 和 DPU 联合的模式。整个算力系统的演化发展到今天,基本上就如同这张图所展示的那样,成为以 CPU、GPU 和 DPU 联合组成的万卡集群,甚至发展到 10 万卡集群、20 万卡集群的规模。在这个发展过程中,我们确实看到国外的一些企业,例如英伟达、英特尔、谷歌等,在云基础设施创新方面做出了很大的引领作用,而且他们所构建的这套系统,我们称之为“IaaS on DPU”。

在国内,中科驭数这家企业联合整个行业内的生态伙伴,也在很早的时候就开始在这个领域进行布局,并且推出了一整套基于 IoD 技术的算力系统。这套系统主要是围绕 DPU 来打造高性能算力底座的,并且已经在电信、金融、高端工业等多个领域实现了落地应用。那么这个 IoD 技术的核心思想究竟是什么呢?其实就是将整个云算力的基础设施中,传统的 CPU 和 GPU 更好地联合起来,然后把整个网络的部分交给 DPU 去处理,这样做确实能够在性能上带来非常大的提升。

具体来说,从安全性和计算性能方面来看,大概能够有 10 倍左右的数量级提升;从一些更为专业的指标,例如金属启动等方面来看,也会有 10 倍左右的性能提升。同时,对于这种软硬结合的模式,以及对于 “三U一体”(DPU、GPU 和 CPU)的大规模组网构建来说,它具有更高的效率,这就是 IoD 技术的优势所在。回到智算中心以及整个数字经济这一板块的系统性能方面,围绕着 IoD 技术,我们构建了一整套从数据的清洗、模型数据的因子分析,到训练推演的部署,再到最后的应用,这样一个全系列的算力操作系统。所以说,我们采用 IoD 技术,已经在多个行业实现了广泛的落地部署,并且我们也看到整个业界在当前最主要的算力系统发展上,也是围绕着 IoD 技术实现了非常快速的发展。同时,我们公司也联合中国计算机协会,连续三年发布了围绕 DPU 的技术白皮书,在白皮书中详细讲解了 IoD 这样的算力底座是如何通过大规模的组网,更好地提升我们的整个算力效能,以及降低我们的整个算力成本的。

特别是考虑到如今人工智能每半年就会有新的发展变化,其在各行业的应用情况已经让我们难以预测未来到底会是什么样的景象。甚至说,对于三年后的未来,仅仅在一年之后的模型发展情况,我们都无法准确预知。就像昨天DeepSeek的 V3 正式发布,又给我们带来了很大的冲击。也许预测未来最好的方式就是Alan Kay所说的创造未来,一步一个脚印地去实现它,而解决当下我们最应该集中力量去做的事情,或许才是最为关键的。

最后,我想用一分钟的时间简单介绍一下中科驭数这家公司。中科驭数是在国内 DPU 行业中唯一的一个“专精特新”小巨人企业,我们成立于 2018 年,在这个行业里深耕许久,也荣获了各种各样的奖项。目前,我们在多地进行了布局,并且在国内的 DPU 芯片行业中,已经连续发布了三款芯片。今年我们发布的 K2Pro 芯片,是国内在 GPU 量产芯片中的第一颗。在明年和后年,我们还会有性能更高的芯片研发成果推出。同时,我们在 DPU 这个行业中,围绕着 DPU 的 IoD 技术构建了整个生态系统,这个生态系统是对标英伟达的 GPU 和它的操作系统而打造的。在过去的几年时间里,我们围绕着整个芯片以及操作系统,还有我们的生态系统软件,投入了大量的心血,基本上打造出了三个系列的产品方案。同时,我们也在联合整个算力行业的生态伙伴,包括 GPU、服务器、CPU 等相关企业,共同为多个行业提供服务,实现落地应用。

以上就是我的全部分享内容,谢谢大家!

“新风向·大家说”2024《财经》跨年演讲于12月27日在郎酒庄园举行。活动由《财经》杂志、财经商业治理研究院主办,郎酒股份承办,TalkingData联合呈现,长江教育基金会提供学术支持。多位商界领袖及专家学者莅临现场,共同探讨未来发展的新风向与新机遇。