大模型时代 算力新需求
图文生成、无人驾驶……ChatGPT横空出世至今不到两年的时间,大模型已经从实验室走到产业化,背后离不开算力支持。
业界戏言“无算力不模型”。在直播中,中国信息与通信研究院产业与规划研究所副总工程师王青分析,大模型带来的算力需求变化主要体现在规模、性能和异构性等方面。
首先,大模型的参数规模与对算力的消耗成正比,参数规模越大,对算力的需求越大,随着大模型参数量从千亿迈向万亿,未来万卡集群成为新一轮大模型基建赛道竞争的配置。
其次,大模型对算力性能的提升需求迫切,包括:①加速芯片和微架构创新等使得芯片能支撑更高精度的计算和更复杂的算法,提升大模型训练效率。②智算中心部署层级分为芯片级、单服务器节点级、多服务器集群级,大模型发展对智能算力扩展性提出高要求,多以服务器单点或集群模式部署以提供并行计算能力。③软件优化,通过强化大模型加速库能力建设,向用户提供高效编程接口、优化编译器等工具,提升算力效率和性能。
最后,随着大模型应用不断拓展,对异构算力的需求也日益增加,并且涵盖GPU、CPU、NPU等多种芯片类型、多种算力类型,以及国内外芯片结合等多样化算力需求。
通过对芯片、服务器、多服务器集群三个层级的分析,指出:智算服务的本质是利用IDC中的“分布式智能计算”环境,通过“互联网”为客户提供“本地化体验”的“智能计算服务”能力。
- 上一篇:没有啦
- 下一篇:北京电信通网络状况分析 2013/3/26