伴随ChatGPT概念持续走红,AI技术与千行百业的融合进程加速,愈发多元、复杂的应用场景涌现出来,对算力服务提出了更高的要求。如何为市场提供多样性、一体化的算力服务,成为产业共性课题。

5月29日,由中国智能计算产业联盟主办的2023中国算力发展研讨会在京召开。会议以ChatGPT下算力的机遇与挑战为主题,汇集了包括中国科学院院士陈润生、钱德沛,中国工程院院士郑纬民、廖湘科,北京应用物理与计算数学研究所研究员袁国兴,中国信通院院长、党委副书记余晓晖,国家信息中心信息化和产业发展部主任单志广,中科院计算所研究员张云泉,清华大学教授陈文光,中科院计算机网络信息中心研究员陆忠华,国家高性能计算机工程技术研究中心副主任曹振南,中国智能计算产业联盟秘书长安静在内的多位业内权威专家与学者,从技术、生态等多维度展开深度交流研讨,厘清多样性、一体化的算力服务建设方向,并给出实践路径。

多样性算力服务的基础:"通专"结合的算力底座


(资料图片仅供参考)

作为多样性、一体化算力服务的底层支撑,人工智能算力基础设施在建设布局等方面迎来"大考"。据不完全统计,全国有超过30个城市正在建设或提出建设智算中心,基本都是采用"政府主导、企业承建、联合运营"的模式。即由地方财政统一出资,建成后为各行各业提供公共算力服务。在此模式下,智算中心定位于公共服务设施,首先要满足广泛的应用场景,具备普适性,实现通用。其次,也要能支持部分对于计算精度、效率要求高的个性化应用场景,具备高效性,实现专用。

多位与会专家指出,"通专"结合的人工智能算力基础设施建设将成为实现多样性算力服务的关键基础。张云泉老师表示,ChatGPT的出现首次实现了认知智能的智慧涌现,同时也让算力产业面临需求上升、多样化发展、能耗问题凸显、使用门槛过高等新挑战。人工智能算力基础设施在变局中求发展,算力融合、要素协同、生态协作是关键。

张云泉 中国科学院计算技术研究所 研究员

陈润生认为,目前大模型的学习速度比我们想象中快得多,"这两家公司(OpenAI与 Anthropic)你追我赶,说不定再过一段时间,GPT-5出来之后又比Claude强了,它发展那么快,将来人们赶不上。"

"更麻烦的是,这些大模型公司都在考虑去操纵第三方设备",陈润生说,"能够去操纵第三方设备是令人担忧的一个事情,如果操纵和安全、国防相关的东西,那就不得了了。"

陈润生表示,人类的神经网络结构远比目前的大模型复杂得多,人工智能的发展还有很长的路要走,"现在的(人工智能)神经网络在空间结构模型上应该有革命性的变化,也许那个时候真的能够超越人的智力。"

陈润生 中国科学院 院士

钱徳沛院士表示,通用还是专用的问题,不止出现在大模型领域,其实从计算开始的时候就一直存在。异构是一个趋势,不同的事情要用不同的高效工具来做。然而,在现代工业化体系下,要考虑成本,性能高了,能耗少了,但是设计成本、制造成本太高,也不行。要折中,既要达到高的性能,低的运营成本,又要有低的设计成本、制造成本,使得全系统成本是低的。在设计成本和制造成本容忍的情况下,应该尽可能地用更高效的异构结构和部件来支持不同的计算。

钱德沛 中国科学院 院士

袁国兴老师指出,科学计算最重要的是要提高可信度,人工智能同样如此。要让模型更可信就得不断提高模型精度。现在为了提高精度,模型越来越大,也越来越复杂,数据量增加也是越来越大。然而超出一定范围之后,打造一个通用模型的代价太高,这就需要通过专用模型来解决问题,所以还是应该分类来研究这个问题。

袁国兴北京应用物理与计算数学研究所 研究员

廖湘科院士认为,通用模型可以服务各行各业,我们需要可以对标ChatGPT的通用大模型,而各行各业可以根据行业实际需求在通用大模型的基础上进行微调和推理,定制行业的专用模型。

专家们一致认为,一方面,人工智能算力基础设施应具备全精度算力,成为一个算力"通才"。让用户可以根据 AI for Science、AI for industries等实际应用场景调配算力资源,包括通用算力、专用算力,乃至高性能的算力,来支持自身业务的发展。另一方面,"通专"结合的人工智能算力基础设施是一套综合性方案,更考验底层架构的开放性。既需要不同技术路线的百花齐放,也需要殊途同归的适配兼容,以便形成包罗万象的整体架构。在降低应用迁移门槛的同时,也带动产业生态的发展。只有这样,才能更好地为多样性算力服务提供支撑。

廖湘科中国工程院 院士

一体化算力服务的核心:重在连接产业生态

作为多样性、一体化算力服务的载体,算力网络的发展也成为当下备受瞩目的话题。大模型热潮带来了庞大的算力需求,导致行业与区域算力分布不均问题日益凸显。与会专家在探讨中认为,对于算力网络建设而言,将遍布全国的各类型计算中心统一管理调度,实现对算力、存储、网络以及数据等分布资源的整合,只是初级阶段。更重要的建设环节,在于整个产业生态的深层连接,即连接人、连接应用和服务。只有这样才能实现技术、资源、应用、服务等多维合一的一体化算力服务。

余晓晖院长指出,人工智能带来的算力需求首先体现在大模型训练会带来算力要求的提升,接下来可能还有模型二次训练,再往后如果说大模型真能变成一种基础设施时候,在云端的推理同样需要算力,终端也是需要算力的。人工智能算力基础设施框架正在慢慢浮现出来。

"AI算力集中在不同的地方,怎么把它集中在一起形成统一算力,这个里面也隐含了一种可能性,就是目前分散的异构算力有没有可能连接起来变成一种可调度的算力基础设施。过去算力设施基本是以传统的CPU通用数据中心为核心。下一步发展AI算力基础设施会成为非常重要一个方向。"余晓晖院长说道

余晓晖中国信通院院长、党委副书记

郑玮民院士坦言:"国内当时很多机构、企业都在做大模型,每个参与方都需要有很大的算力支撑,这有可能会造成算力资源的浪费,可以合起来组成一个大的算力,做模型来共享,并让这个模型成为新型基础设施,但实现这个目标还有很多问题待解决,比如怎么才能把不同的模型连接起来,怎么实现传输,怎样才能即满足对算力的要求,又能比较节省成本。"

郑纬民 中国工程院 院士

通过物理及生态层面的双重互联,算力网络可进一步使能多样性、一体化的算力服务,合理配置、融合、释放算力,降低应用门槛。让算力资源从高不可攀的技术变成普适普惠的服务,支撑国家重大的科研项目、社会民生以及千行百业的发展。

单志广主任表示,目前来看,算力是我们的短板,也是未来有机会发力的地方。ChatGPT是采用集中式的算力来推动,未来我们或许可以换一条路,比如走下一代分布式系统路线,可以通过更先进的互联技术将国内的一些算力基础设施更好的连接起来,打造更强的计算能力,构建更先进的创新基础设施。

"我们要从基本的计算模式演化规律和人工智能的发展规律出发,加强基础性、前瞻性研究和探讨,避免一哄而上或者现象级跟风,否则就只能跟在别人后面跑,避免在新一代信息技术领域出现隔代竞争、越追越远的风险。"单志广主任说道。

单志广国家信息中心信息化和产业发展部主任

超算互联网作为算力网络的重要形态,从实践层面诠释了算力网络的建设本质。首先是狭义的互联,即在物理层面,连接不同体系架构的算力中心,构建可以统一使用、对外服务的基础设施,实现资源的调度、共享。其次是广义的互联,即在生态层面,以互联网的思维运营超算中心,基于计算、软件、应用解决方案等资源进行深度整合,建立一个以应用服务为主导的创新型平台,并通过市场化的运营和服务体系,紧密链接上下游,使供需方快速对接,快速找到各自需要的资源。

"从超算互联网的角度,我们期望不仅是把机器连基础,还希望把人、设备、应用都连起来,从提供超算算力转变为提供超算算力服务和应用服务,并且将算力供应商、应用软件商、开发者、最终用户有机链接成一个超算生态圈,最主要核心还是做超算平台。通过这个平台,一方面让用户可像"网上购物"一样便捷使用超算应用和算力服务,另一方面也让更多企业自主开发的应用能被更多用户看到和使用。"曹振南副主任表示。

曹振南国家高性能计算机工程技术研究中心副主任

"我认为通用的概念正在发生变化,"清华大学教授陈文光表示,人工智能计算形态在整个数据中心中占的比例会越来越大。不过现阶段AI算力中心仍处于非常初期的发展阶段,在这个阶段还是应该鼓励多方探索。

陈文光 清华大学教授

陆忠华老师表示,随着AI的发展,AI服务的算力需求越来越多了,而且趋势是不可挡的,我们应该去迎接这个趋势。如何满足大家日益增长的算力需求,在5-8年的时间里,应该努力用好已经建设的超算中心、智算中心,使得已经投入建好的中心资源不要浪费。可以率先尝试在某些领域开展大模型应用,鼓励生态建设。另外,构建人工智能基础设施体系,不应过分强调一体化布局,还是应该在国家政策指导下支持百花齐放,把剩下的交给市场。

陆忠华中科院计算机网络信息中心 研究员

安静秘书长表示,"在算力互联方面,中国目前有智算网络、超算互联等不同的方案。其中,超算互联网就是以互联网的思维运营超算中心,并连接产业生态中的算力供给、应用开发、运营服务、用户等各方能力和资源,构建一体化超算算力网络和服务平台。在算力网络建设大潮当中,中国最后走哪条路,怎么把我们国家算力资源连起来,调度起来用好,发挥作用,降低它的门槛,都是需要我们研讨的话题。"新算力时代已经到来,算力将是未来拉动数字经济镶嵌发展的新动能,新引擎。与此同,算力正在成为影响国家综合治理和国际话语权的关键要素,国与国的核心竞争力正在聚焦于以计算速度,计算方法,通信能力,存储能力为代表的算力,未来谁能掌握先进的算力,谁就能掌握了发展的主动权。希望联盟能够发挥平台优势,引领行业健康发展。

安静 中国智能计算产业联盟秘书长

推荐内容