神威·太湖之光

31°32′55.01″N 120°14′52.94″E / 31.5486139°N 120.2480389°E / 31.5486139; 120.2480389

神威·太湖之光
激活时间2015年12月31日
承建商国家并行计算机工程
技术研究中心
作业管理者国家超级计算无锡中心
清华大学
置放地点 中国江苏省无锡市
架构40,960枚申威处理器
SW26010型 260核心CPU
最大消耗功率15,371.00kW
操作系统基于Linux核心的神威睿思 2.0.5
容积、占地面积605 平方米
内部存储器1.31PB
运算速率实际性能:93.0146PFlops
理论性能:125.4359PFlops
造价18亿元人民币
(约合2.73亿美元)
排名TOP500: #4, 2020年6月
用途石油勘探,生命科学
天气预报工业设计
药物研发
成就戈登贝尔奖获得平台,打破30年来该奖都由美日获得的情况
官方网站www.nsccwx.cn
资源top500.org

神威·太湖之光 (英语:Sunway TaihuLight)是由中国国家并行计算机工程技术研究中心研制的超级计算机,2016年6月20日在LINPACK性能测试中以 93 PFLOPS 的测试结果超越同为中国组建的天河二号(LINPACK成绩约为34 PFLOPS),成为当时世界上最快的超级计算机[1][2][3][4],直到2018年6月8日被美国的超级计算机高峰Summit)超越[5]。“太湖之光”的命名来源于无锡旁边的太湖。目前神威·太湖之光部署在江苏省无锡市国家超级计算无锡中心[3][1],由清华大学负责运营[6]

神威·太湖之光也是中国大陆首度自行设计不使用英特尔等美国公司的核心产品而登上TOP500第一名宝座的超级计算机。[7]该机组在天河二号被禁之后,也被认为是中国政府面对美国政府限制英特尔、英伟达等厂商对华出售运算设备的正面回应[8],在中国大陆的媒体报导中,也多强调该机组的组件均由中国自主设计并于中国生产。[9] 不过国产化程度仍有提升空间,特别是美国对于中国超算技术已经进展到连设计工具跟代工制造都加以限制的地步,仍在不断加强制裁力度[10]

硬件

编辑

神威·太湖之光使用国家高性能集成电路(上海)设计中心研发的SW26010[11]此款处理器,基于DEC Alpha 64微架构、64位、精简指令集乱序执行、支持SIMD申威-64架构,制程未知。每个处理器芯片中有260个核心英语Compute kernel,采用大规模多核心并发运算的结构,其中4个为资源管理用途,称为MPE(Management Processing Element,管理处理组件),采用对称多处理器的结构;另外256个作通用运算用途,每64个核心组成一个处理器核心阵列,共计4个阵列,合称为CPE(Computing Processing Element,运算处理组件)。MPE和CPE的连接布局类似于Cell的协处理器式、非对称多处理的布局(PPE+SPE),而CPE的阵列则与Xeon PhiGPGPU等的流处理器形式相近。CPE核心和MPE核心都是相同的指令集,同样具备256比特SIMD单元,但不同的是MPE均支持用户模式和系统模式、32KiB一级指令缓存、32KiB一级资料缓存、256KiB二级缓存,而CPE仅支持用户模式、16KiB一级指令缓存、64KiB本地暂存式存储器英语Scratchpad memory而无资料缓存,而且访问系统存储器需要与MPE沟通。该CPU主频设置在 1.45GHz。不过,存储器访问方面的规格相对较为贫弱,使用的是四通道DDR3 SDRAM,而不是最新的DDR4 SDRAM,各通道拥有独立的、128位位宽的存储器控制器,每通道容量 8GiB,一颗CPU可最大支持32GiB的DDR3-2133,尽管如此,每个芯片的存储器带宽仍达 136.5GB/s。除此以外,每颗芯片上还内置了片上网络互联英语Network on a chip,而非传统的缓存一致性处理。因此,该CPU与Cell宽带引擎一样,偏重于浮点数运算。[12][13]

整套系统高达 40,960 个 SW26010处理器,共有 10,649,600 个CPU核心。每个处理器为一个节点单元,一块主板上有两颗处理器,32块这样的主板组成一架主机,每台主机作为一个“超级节点”,一共有256个这样的超级节点。根据资料图显示,这样的构造使得主机需采用非标准设计,而非标准的刀片服务器机架和机柜,这样的一种机柜可以容纳4台主机机架。运算节点单元之间全数采用PCIe总线互联,互联结构分为三层,顶层网络是“中央切换网络”,中间层是“超级节点网络”,底层是“资源共享网络”。[13]

软件

编辑

神威·太湖之光采用的是基于Linux核心的神威睿思(即RaiseOS 2.0.5),也是分布式操作系统[13],已有10多年历史,主要面向高性能领域和通用计算领域。中国工程院院士陈左宁表示,在通用计算领域,神威睿思操作系统的主要优势在于自主可控度高和安全性强等方面[14]

该系统具有其自身的定制化实现的OpenACC2.0以帮助代码并行化[15]

性能

编辑

理论浮点数运算性能为125,435.9 TFlops,而LINPACK测试中的实际性能为93,014.6 TFlops,有74%的效率,相比天河二号(62%)以及排名第三的泰坦(65.8%)都要高。本机组的图形性能也较为突出,在Graph500排名中位列亚军。[16]不过遇上存储器访问较为频繁的运算处理操作、整数数值较多的运算,存储器访问的樽颈效应就开始显现了。[17]

相较天河二号系统功耗达17.8百万瓦(开启散热系统全速运转时则高达24百万瓦),神威·太湖之光仅使用15.3百万瓦,且每瓦性能达到 6 GFLOPS/W,截至2017年11月为止,在Green 500能效比排名中排名第20位。[18][16]

应用

编辑

清华大学地球系统科学研究中心计算机系合作,利用“神威·太湖之光”首次实现了百万核规模、高分辨率的地球系统数值模拟。此前,中国大陆的地球模拟系统模式只能达到200公里网格规模的分辨率,但现在已可开展25公里网格分辨率的地球系统模拟工作,在海洋上可达到10公里分辨率。

目前,三十多家用户单位在天气气候航空航天海洋科学、新药创制、先进制造、新材料等领域与国家超算无锡中心开展了合作[6]。2016年神威·太湖之光超级计算机上的“全球大气非静力云分辨模拟”应用软件得戈登贝尔奖,该奖项是颁发给超级计算机上的应用软件设计奖,因为硬件性能的有效发挥最终还是取决于软件设计,此前30年该奖都由美日两国获得,首次有第三国打破此规则。[19][20]

逸闻

编辑

2017年网络春晚,举办了欢唱太湖之光桥段,由羽泉演唱成名曲《奔跑》,与太湖之光20多位科学家连线接龙对唱。[21]

同时网络春晚公开了目前太湖之光计算机的维护与操作小组成员,由清华大学博士(在读)丁楠领队,杨晋喆(伦敦帝国理工学院博士),甘霖(清华大学博士后),刘加贺(清华大学硕士在读)等20多人组成。[22]

参见

编辑

参考文献

编辑
  1. ^ 1.0 1.1 China Tops Supercomputer Rankings with New 93-Petaflop Machine. www.top500.org. [2016-06-20]. (原始内容存档于2019-05-31). 
  2. ^ 陸神威太湖之光 躍居全球最快超級電腦. [2016-06-20]. (原始内容存档于2016-06-23). 
  3. ^ 3.0 3.1 Clark, Jack; King, Ian. World’s Fastest Supercomputer Now Has Chinese Chip Technology. Bloomberg.com. June 20, 2016 [2016-06-20]. (原始内容存档于2019-05-14). 
  4. ^ China builds world's most powerful computer. BBC News. 2016-06-20 [2016-06-20]. (原始内容存档于2019-04-04). 
  5. ^ Lohr, Steve. You’d Need 63 Billion Years to Do What This Supercomputer Can Do in a Second. New York Times. 2018-06-08 [2018-12-08]. (原始内容存档于2018-06-10). 
  6. ^ 6.0 6.1 清华运营的“神威·太湖之光”荣膺世界超算冠军. 清华大学新闻中心. [2016-06-30]. (原始内容存档于2019-05-20). 
  7. ^ 全球最快超級電腦 中國大陸神威太湖之光. [2016-06-20]. (原始内容存档于2016-08-11). 
  8. ^ “纯中国制”スパコン、速度世界一 心臓部も自主开発、米国の输出规制が促す?页面存档备份,存于互联网档案馆) 朝日新闻デジタル
  9. ^ 最新世界超级计算机TOP500榜单出炉:中国“神威·太湖之光”夺冠. IT之家. [2016-06-21]. (原始内容存档于2016-06-27). 
  10. ^ 存档副本. [2021-04-14]. (原始内容存档于2021-04-26). 
  11. ^ 申威处理器 中国超算最强芯此款處理器. [2017-06-20]. (原始内容存档于2019-09-16). 
  12. ^ China Tops Supercomputer Rankings with New 93-Petaflop Machine. top500.org. [2016-08-07]. (原始内容存档于2016-10-03). 
  13. ^ 13.0 13.1 13.2 Dongarra, Jack. Report on the Sunway TaihuLight System (PDF). www.netlib.org. June 20, 2016 [June 20, 2016]. (原始内容存档 (PDF)于2018-11-10). 
  14. ^ 神威太湖之光的操作系统是基于 Linux. [2016-06-30]. (原始内容存档于2017-03-05). 
  15. ^ Fu, H H; Liao, JF; Yang, J Z. The Sunway TaihuLight Supercomputer: System and Applications. Sci. China Inf. Sci. 2016 [2016-06-22]. doi:10.1007/s11432-016-5588-7. (原始内容存档于2020-01-25). 
  16. ^ 16.0 16.1 神威太湖之光超算揭秘:国产260核自研处理器,能效比超高. expreview.com. [2016-08-07]. (原始内容存档于2021-01-26). 
  17. ^ ISC 2016开幕、93PFLOPSの“中国纯正”スパコンが世界首位页面存档备份,存于互联网档案馆) 日経テクノロジー
  18. ^ 260核心!中国全新超算自主CPU揭秘:举世震惊. mydrivers.com. [2016-06-21]. (原始内容存档于2019-05-21). 
  19. ^ Chinese Research Team that Employs High Performance Computing to Understand Weather Patterns Wins 2016 ACM Gordon Bell Prize. Acm.org. 2016-11-17 [2018-07-22]. (原始内容存档于2021-01-24). 
  20. ^ Chinese research team wins top award in supercomputing. News.xinhuanet.com. 2016-11-18 [2018-07-22]. (原始内容存档于2016-11-20). 
  21. ^ 央視官方頻道-欢唱太湖之光《奔跑》. YouTube.com. 2017-01-20 [2018-07-22]. (原始内容存档于2017-02-20). 
  22. ^ CCTV春晚. 央視官方頻道 - 2017年網路春晚. YouTube.com. 2017-01-20 [2018-07-22]. (原始内容存档于2017-08-18). 

外部链接

编辑
纪录
前任者:
天河二号
世界最强的超级计算机
2016年6月20日 – 2018年6月25日
继任者:
高峰