您现在所在的位置:博域科技>首页 > 新闻资讯

中国超级计算机,硬件领先软件仍需大量投入

2018-05-16 13:56:59 7 Views

摘要: 超级计算机领域,是一个以万亿为计量单位的世界,硬件领先软件仍需大量投入。

  2018年世界大学生超级计算机竞赛(简称ASC18),在2天20小时的规定时间里,要求每个队伍需要自己搭建小型超级计算机,完成组委会布置的4道题目,运算的结果将作为最后成绩的评分依据。

  李北辰队伍搭建的机器的运算能力,约为1万台现在市面上主流家用电脑运算能力之和,但相比目前世界上最快的超级计算机“神威·太湖之光”,他们的算力还不到百分之一。

  国家超级计算济南中心主任张云泉说:“超级计算机的研究水平决定了一个国家的尖端科研实力”。目前中、美、日、俄等国对高性能超级计算机研究大力投入的背后,也是抢占科研制高点的竞赛。

1后面17个0

  在超级计算机领域,有着一份世界500强榜单。根据最新的排名,如果一台机器的运算能力达不到500万亿次每秒,它将被“除名”。衡量超级计算机的标准“简单粗暴”:运算能力够快。上一代超级计算机使用的架构与目前主流的不同,现在的技术将来也可能被量子计算机取代。

  2013年至今,中国自主研发的超级计算机就一直稳坐榜首。最近两年,这个位置属于“神威·太湖之光”,它的峰值运算速度达到每秒12.5亿亿次,“1”后面17个“0”,大致相当于200万台普通电脑同时运行。

  但它远不止是堆积用于运算的中央处理器(CPU)和图形处理器(GPU)这么简单。张云泉告诉记者,超级计算机的运算速度不遵循“1+1=2”的公式,还得考虑它们之间工作分配、数据传输的损耗。

  在国家超级计算济南中心,“神威·蓝光”超级计算机黑色的机箱紧密排布,围成一个大圈,被小心安放在数百平方米的一楼大厅内。当这台研发费用数亿元的机器运转时,功耗是1兆瓦,大致相当于1.5万户家庭的家电功率总和,每年仅电费一项支出就接近2000万元人民币。

  相比国家超级计算中心的“大手笔”,李北辰参加的ACS18则要求机器总功耗在3000瓦以内,这意味着能使用的CPU、GPU数量有一个上限。为了最大化利用它们的运算能力,他们必须精打细算,一方面仔细分配每个节点的运算内容,另一方面还要简化复杂的运算,让每个节点能同时计算尽可能多的内容。在这次比赛中,他们队伍用了16块GPU,总价值超过60万元人民币。

租用超算一天,花费上万元

  比赛现场,设备高速运转时,会释放大量的热量。每个GPU都必须配备降温风扇,否则就会因温度过高而停止运行。

  对超级计算机来说,如何有效地带走这些热量一度是发展瓶颈。在国家超级计算广州中心,工程师专门建造了冷水厂,不间断运送8摄氏度的水进入“天河二号”的水冷系统。

  机房还安排人员24小时值班,监控机器的运转状况,清理垃圾进程,实现效率的最大化。“是机器就有损坏和出问题的概率,怎样让它们的影响尽可能小也是门学问。”张云泉说。

  李北辰曾参加另一场大学生超算竞赛,48小时不间断地比赛,他和队员只能轮流睡觉,保证有人时刻盯着机器运行。此外,组委会还随机对赛场断电,考查程序及时备份的能力。在实际使用中,这些都是极可能出现的挑战。

  中山大学肿瘤防治中心的博士后赵齐对此深有体会,他所在的团队是最早用“天河二号”测试生物应用的团队之一。因为需要处理大量的生物基因组数据,他们从2012年起就开始使用超级计算机。他曾遇到各种奇怪的报错和任务丢失,环境配置也不定时出问题,经常算出他自己都不敢相信的结果。这是因为生物信息领域在超级计算机上的应用还在起步阶段,成熟的软件不多,很多时候需要用户和超算中心的工作人员合作开发解决问题。

  在过去5年,光他一个人就用“天河二号”处理了超过100TB的数据。超级计算机能在几天或几小时里,处理一般计算机半年乃至几年才能处理完的工作。”

  因为需要处理的数据太多,网络传输较慢,赵齐有时会采用邮寄硬盘的方式,“邮递员最快”。只是这样的代价很高。赵齐所在的实验室每年消耗在数据存储上的钱就在5万元左右。租用超级计算机进行数据处理,有时一天就会花费上万元。

超算世界500强前两名是中国

  过去,超级计算机的主要任务是进行科学计算。最近几年,有关人工智能的运算请求也越来越多。

  2001年时,超级计算机500强名单中没有一台来自中国。而现在,榜单前两名都被中国占据。此外,中国的上榜数量达到204,排名第二的美国只有143。

  张云泉告诉记者,我国已经掌握超级计算机的制造技术,包括“神威·太湖之光”“神威·蓝光”的一系列设备,从芯片、操作系统到冷却系统都完全由我国自主研发。虽然中国在硬件条件上取得领先地位,但软件方面仍需要大量的投入。目前应用于超级计算机的商用软件几乎全部由美国、日本等国开发,中国的市场占有率基本为零。

  在计算机科学领域,超级计算机不是热门方向。大部分人选择投身人工智能的研究。

  在张云泉看来,解决软件问题需要政策和财政两方面的支持。“中国一直是制订5年计划,规划不够长远,技术团队难以保持稳定。”他介绍,我国对超级计算机领域研究的总投入与美国接近,但对软件的投入偏低,目前仅占总投入的20%。



博域科技订阅号

博域科技服务号

上一篇: SaaS——衡量小企业成功的重要工具

下一篇: 博域科技承办精益人官网的改版工作