塔斯娱乐资讯网

同济大学全国首个千卡工科智算集群落地,海光DCU迎来国产工程大考! 同济大学今天

同济大学全国首个千卡工科智算集群落地,海光DCU迎来国产工程大考!
同济大学今天算是刷屏了,和海光信息正式签约,全国首个千卡工科智算集群落地。现场放了一段视频,里面几个师生聊了些正在做的项目,还挺有代表性的。有研究人形机器人在石子地、沙地、上下楼梯这些复杂地形里做自主适应和动作生成的,有搞无人机集群在弱通联场景下做自主通信和协同增强的,还有做"同济飞鱼"那种水空跨介质无人机的。这些方向听着前沿,但背后都指向同一个痛点,对大规模算力的刚性需求。
为什么需要千卡级别的集群?因为他们做的是大规模并行仿真、强化学习、虚实融合验证。跨域协同系统涉及分布式决策、信息共享融合,算力跟不上算法就白搭。而且这些场景对精度的要求非常具体,不是跑个通用大模型就完事的。同济这次搞的AI4E,本质上就是让AI真正钻进工程世界里解决实际问题。
海光DCU能被选中,至少有两个原因说得通。一是兼容,高校积攒了那么多CUDA老代码,不可能推倒重写,DTK能实现无感迁移算是扫清了最大的障碍,主流框架也开箱即用。二是安全性有保障。海光方面提了个说法叫“内生安全”,具体来说,DCU内置了国密SM 2、SM3、SM4算法,支持机密计算和可信计算,数据全链路加密,训练和推理过程中的数据“可用不可见”,而且核心技术和供应链都是完全自主可控的,不存在国外芯片那种后门或断供的风险。对高校来说,科研数据、模型参数、算法代码都是多年积累的核心资产,安全这事不能靠赌。
同济大学 gpgpu 全国首个GPGPU千卡集群