中国工程院院士高文:要给AI算力建国家高速公路 将让算力像用电一样方便

2025-03-17 07:26:47 来源: 同花顺7x24快讯
导语: 中国工程院院士高文领导的鹏城实验室,是中央批准成立的网络通信领域新型科研机构,牵头推进“中国算力网”的研发与建设。这里所说的算力特指专门为AI训练设计的智能算力,需要成千上万颗专用芯片协同工作。(央视新闻)

  2025年全国两会期间,“人工智能”成为被频繁提及和讨论的热门话题。全国人大代表、中国工程院院士、鹏城实验室主任高文今年也提出了关于加快打造“人工智能先锋城市”等建议。2025年年初,杭州深度求索公司发布的DeepSeek-R1大语言模型引发全球轰动,它的性能比肩国际顶尖模型,但开发成本仅为同类产品的三十分之一。鹏城实验室已在开源社区上线DeepSeek系列模型,供国内开发者测试验证。

  记者:DeepSeek的出现给你带来什么影响?

  高文:我觉得会把整个领域的应用提早很多年,原来像ChatGPT、LLaMA、谷歌或者Facebook的大模型,要头部企业有足够的资源、算力、人才、数据,才能把这个东西做出来。现在国外人工智能的应用,主要都是在几个大厂手里,像微软、谷歌等。DeepSeek出来就不一样了,一下就把这个应用平民化了,不是说只有少数头部企业,或者顶级玩家才玩得动,所有的初创企业都玩得动,这是它最大的贡献。

  DeepSeek的出现,引发一系列连锁反应,应用门槛的降低,刺激更多的需求被释放,导致全社会对算力的需求出现激增。如果把人工智能比作“智能汽车”,那么“算力”就是驱动它奔跑的“汽油”。唯有算力供给充足,人工智能才能得到充分的发展。

  记者:如果从对算力的需求是增加的这个角度来看,你这个实验室接下来的计划和以前相比会有什么变化?

  高文:开始没有预料到会有这么快的需求,但现在我们要快速调整了。有很多工作要提前了。

  高文领导的鹏城实验室是中央批准成立的网络通信领域新型科研机构,主要任务之一就是围绕“东数西算”“数字中国”“全国一体化算力网”等国家重大战略,牵头推进“中国算力网”的研发与建设。

  记者:你做的中国算力网的建设,要解决的是什么问题?

  高文:希望能够实现让用户像用电一样使用算力,需要的话你就可以去购买,而且哪里的算力最便宜,你就购买哪里的算力。

  这里所说的算力特指专门为AI训练设计的智能算力,不同于普通电脑的算力,它需要成千上万颗专用芯片协同工作,同时也需要基础设施的投入和能源的支持。

  “东数西算”工程希望把东部需要计算的数据送到西部数据中心处理、结算和存储,中国算力网建设的初衷,就是将散布在全国各地的计算资源进行整合,包括超级计算中心、数据中心、云计算平台等,形成一个统一的算力资源池,构建资源方便接入、任务统一调度且具有可持续发展运营模式和机制的数字经济基础设施,从而推动国内自主算力资源迈入“全民共享”的时代。

  记者:千行百业都在应用,对算力会有影响吗?

  高文:应该是比以前的需求更大了。

  记者:需求很大,你能不能跟得上人家的需求呢?

  高文:社会对算力的投入还是蛮大的,那当然可能就不太平衡,有的算力投完了以后,使用效率比较高,有的可能使用效率比较低,水平参差不齐。我们希望通过算力网,能够把整个投入的资源利用率提高上来,其实这个也和当初的电力网思路非常相近。当时电力开始都是自己一个工厂给自己生产用,后来发现居民也需要用电,其他的事业单位也需要用电,所以到处在建电厂。有的地方可能建了也不够用,有的可能建了就多了,那多了怎么办呢,通过网络把多余的电卖出去,算力网其实也是希望走类似的这条路。

  我们现在就是要给这些算力建国家高速公路,首先用新的技术把它建起来,同时希望引入一些新的管理模式,不是常规那种通信的管理模式,用一些比如数据关联,现在我们也正在和国家数据局在一起沟通,用一种新的模式。

  算力网的建设包含三个核心要素:大规模核心算力、超级光网络和算力调度系统。它的理想图景是当我们需要用算力时,只需插上插头,不用关心算力来自哪里,也无需自己比价,系统会自动匹配性价比最高的算力中心。这种模式不仅能提升现有算力资源利用率,还能避免各地重复建设造成的浪费。

  记者:如果我们各方面哪怕有一点跟不上的话,可能在AI的竞争上面就会落后,现在是这种局面吗?

  高文:是,因为这是一个系统性的。

  记者:你现在会焦急吗?

  高文:应该不会,技术上其实我们还是蛮自信的,按部就班地往前走,还是非常自信的,当然我们也希望拿到最好的东西,比如最好工艺的东西,最好软件的东西,包括机器也是最快的,世界上最领先的。但是现在卡了以后,我们就只能比如用集成的技术去做出最好的设备来。

  由于算力网中的计算任务可能涉及科学研究、国防、金融等关键领域,防止数据泄露和网络攻击成为算力网建设和运营中的重要任务。鹏城实验室有专门的团队致力于网络安全技术的科研与应用。不久前刚结束的第九届亚洲冬季运动会,鹏城实验室参与了亚冬会的网络安全保障。

  记者:要保护什么?

  高文:很多的管理都是在网上管的。一旦这个系统被攻击,瘫痪了,整个就全部瘫痪了。

  记者:这种被攻击的风险是想象出来的,还是现实世界中真实存在的?

  高文:现实世界中存在的,有的是属于恶意的,就是要让你难堪。还有很多黑客,是为了显示我厉害,就是我能攻进去,我能把你搞瘫痪了。这两类性质都有。

  记者:在网络上保障安全,一些商业化的公司,甚至都可以去做,那为什么你要去做?

  高文:遇到很难的问题,需要团队实力非常强,有一些商业公司,它不见得解决得了。

  记者:它的难点是在哪儿?

  高文:常规的那些公司用的一般方法,比如上一个工具程序,从头到尾把数据扫一遍,看看里面有没有异常。但是通常高手不会让你找到,所以可能就需要技术更专业一点,我们这个团队有很多工具,看响应是什么,根据这个再来分析,可能会有蛛丝马迹,最后把东西挖出来。

  2022年,“中国算力网”一期工程“智算网络”正式上线。它连接并管理了20多个不同地域、不同类型的算力中心,汇聚算力规模逐步增加到5E Flops,相当于每秒完成5万亿亿次计算。其算力枢纽节点之一,就是鹏程实验室的人工智能算力平台“鹏城云脑Ⅱ”。

  高文:你从这看过去,这是八行,八行其实就相当于是四台机器,每两行是一台机器。

  记者:你那它的耗电量大不大?

  高文:不小,每个月可能都要一两百万的电费。

  “鹏城云脑Ⅱ”是鹏城实验室与相关企业联合研发的超级智能计算机,峰值算力达到每秒完成100亿亿次计算,于2020年启动运行。它比每秒能完成100千万亿次计算的“鹏城云脑Ⅰ”,计算能力强了10倍,而完成这次升级,仅用了一年时间。

  记者:只用了一年提高了10倍?发生了什么?

  高文:我们做“鹏城云脑I”的时候,那时候还是做判别式人工智能,通常它需要的算力没有那么大,100P其实已经可以满足需要了。通常我们会预判,对语言模型需要的计算和存储的能力,会比图像的应该要求更高一些,因为语言的语料更容易获得,可能语言处理需要的处理能力更强,所以要比做图像大10倍。

  目前,“鹏城云脑Ⅱ”已在衡量全球高性能平台数据吞吐能力的IO500总榜单上连续9次取得冠军,同时在国际人工智能算力性能AIPerf500排行榜上连续4届排名第一。基于“鹏城云脑Ⅱ”,鹏城实验室搭建了一个AI训练平台,能够同时处理包含上千亿参数的超大规模AI模型。“鹏城.脑海”就是鹏城实验室在“鹏城云脑Ⅱ”上训练和运行的一个超大规模自然语言处理模型。

  记者:为什么脑海没跑出来,DeepSeek跑出来了?

  高文:倒不是说我们脑海不行,其实这个就是DeepSeek很聪明的地方,脑海和ChatGPT完全是同样的技术,它里面有一个模型叫注意力机制,像以前比如一篇文章,进到计算机里面,你让它处理,等处理到最后,前面的已经忘了。但是GPT就是Transformer,发明了一种方式,叫注意力机制,或者叫注意力模型,就是我只注意相关的,其他东西我就不管了,抓大放小。

  原来的GPT是一个大包,所有的功能都在里面,所以用的时候就很累。DeepSeek就做了这样一件事,他把特定领域用特定的表述去训练它,这样训练的时候,开销就没那么大。它一共有256个专家,使用的时候不需要256个都装,最多装8个就够了,这样用的时候,需要的成本很低,训练的时间可以节省。DeepSeek我认为它不是理论上的创新,它更多是工程上。

  目前,“鹏城.脑海”大模型的两个版本已向社会开源。高文和团队希望通过模型训练全流程开源开放的方式,将“鹏城.脑海”培育为中国算力网上的一个种子应用。

  记者:你是最底层的这个源代码开源还是参数开源?

  高文:其实两层都有,我们是把所有参数,我们叫切片,就是它在训练过程中,我每隔多长时间,我就开一个切片,研究者可以通过这个切片,去研究它在训练的过程中,它是怎么受训练的,中间有什么变化。另外我们源代码也开源,源代码开源以后,基本上用户其实拿着这个源代码,用他自己的数据就可以重新再去训练。

  记者:那你付出所有的人、精力、资金,等于是你做了别人得益,可以这样理解吗?

  高文:但是开源不仅仅是别人得益的问题。我开源了以后,别人在我这开源的东西,他也要开源,他开源以后,会使原来我的系统做得更好,然后我们会在所有开源的东西之上,再往上迭代,众人拾柴火焰高,所有参与的人都在添柴,都在加火。

  培育出“鹏城.脑海”的算力平台“鹏城云脑Ⅱ”同样秉持开放理念。“鹏城云脑Ⅱ”算力的50%是鹏城实验室自研使用,40%开放提供给国内的合作伙伴、科研机构和高校,10%则释放给深圳市工业和信息化局,供社会开发者申请使用。在人工智能浪潮中,开源与开放精神正在成为业界共识。

  记者:开源就意味着共享,对吧?共享和竞争矛盾不矛盾?

  高文:其实从开源的角度,技术是不是自己的没关系,因为你就在那上面迭代。为什么现在OpenAI比较难受,因为它是闭源的,闭源就是别人只能求他,要和他签协议,他同意才行,他不同意就不行。

  高文:这是整个生态的两条技术路线,这个生态早期都是闭源的,因为有版权,实际上是保护你这个软件的权利的。但是后来Linux(操作系统)是第一个把软件开源的,他的理念是这个东西是人类的资产,我把它放出来,但是我要求所有用这个软件的人,在上面做开发的人,你要给我一个承诺,就是我开源了,你要新做的东西你也要开源。

  我个人理解就是开源可能更符合人类社会发展的方向,这和知识是一样的,以前那些手艺人、工匠,很多东西是代代相传的,万一哪一辈没传好就失传了,那后来为什么我们现在学的知识,每个人都可以学,因为这个东西开源了,知识就是开源的。

  其实软件也一样,如果软件也变成知识,那你就应该开源,开源以后才能迭代。

  “鹏城云脑Ⅱ”平稳运行的同时,高文已经开始着眼新的问题。目前,他正带领团队联合相关企业研发下一代超级智能计算机“鹏城云脑Ⅲ”,智能算力规模目标为每秒完成1600亿亿次计算,能力比“鹏城云脑Ⅱ”提升16倍。

  记者:这个云脑Ⅲ未来可以做什么事?

  高文:可以做多模态大模型的训练和使用,现在大语言模型的智能只是语言智能,其他智能还比较弱一点。所谓多模态模型,就是除了语言之外,我要把声音、视觉和语言都掺杂在一起,然后去训练,这样整个智能的水平,就和人慢慢比较接近了。我们也希望通过我们这台机器的建设,对国内的生态有所帮助。

  整个机器还没出来,但是我们的原型机已经出来了。我们整个机器是157个机柜,但是我们现在已经做了3个机柜了,这些模型已经在这3个机柜上的原型机上面做训练,国家给我们的使命,是要去攻一个山头,就是要爬一个高峰,这个高峰肯定是别人都没有上去过的,所以你要先上去。(央视新闻) 

关注同花顺财经(ths518),获取更多机会 返回首页举报 >

1019

+1
advert
advert
advert
advert
advert
advert
advert
advert
  • 三德科技
  • 沃尔核材
  • 电光科技
  • 钧崴电子
  • 金安国纪
  • 长盛轴承
  • 广和通
  • 科泰电源
  • advert
    advert
    advert
    advert