工作动态
高性能计算应用的性能可移植性是应对异构架构演进的关键。近日,中心运行与应用服务室与崂山实验室合作,在国产超算编程模型研究方面取得重要进展,自主研发了面向神威异构架构的性能可移植后端——swKokkos。
研究团队针对神威处理器独特的硬件约束,通过引入并行执行抽象,实现了源代码到二进制级别的性能可移植,有效打破了C++模板密集型库难以在神威从核执行的障碍,极大降低了超算应用的开发与迁移成本。swKokkos引入了向量化哈希索引与FDSL快速调度库以降低内核启动开销,并提出分块并行映射算法来提升负载均衡与缓存利用率。在AXPY、数值求解器等任务中,swKokkos性能达到原生 Athread的 99%以上,并在海洋模型LICOM中成功支撑超10万核规模的稳定模拟获得显著加速。
相关研究成果已被系统软件领域国际学术会议EuroSys 2026录用。EuroSys为中国计算机学会(CCF)推荐的A类会议,代表了系统研究领域的最高水准。本届会议录用率低至18.3%,该论文的第一作者为运行与应用服务室博士生韦俊林,通讯作者为运行与应用服务室姜金荣研究员。研究工作得到了中国科学院战略性先导科技专项、国家重点研发计划等项目的支持。

swKokkos示意图
责任编辑:郎杨琴
附件下载