清芬领航企业(八)超算长跑者陈健
IIIF 清华大学产业创新与金融研究院
超算长跑者陈健
被誉为"世界长跑火车头"的艾米尔·扎托贝克(Emil Zatopek)说过这样一句话:“如果你想赢得什么,去参加100米比赛,如果你想经历些什么,去跑马拉松吧。”在创业者陈健看来,人生就像一场马拉松比赛,要达成目标,更需要坚持和专注。
陈健认准的跑道是超算行业,这是科技领域的高精尖技术,超算最初被应用于能源勘探、天气预报、高能核物理等科研领域,随着人工智能、大数据融合发展,超算逐渐在材料化学、生命科学、基因分析、游戏视频制作、电力、教育、工程、政府决策、互联网服务等众多领域获得应用。从事这一行业的人尤其对创业者来说,要具备优秀长跑者的胸怀、智慧、定力和勇气。
专注超算的28年中,陈健从超算使用者转变为超级计算机的建设者,再到创立北京并行科技股份有限公司,成为超算云服务的提供者,陈健在超算的赛道上一路长跑。
九年清华生涯 萌发人生理想
清华力学学子偏爱计算
1993年,作为山西省朔州市的高考状元,陈健考取清华大学工程力学系,但他对于计算机的偏爱达到了狂热的程度。他将计算机作为第二选修专业,并担任水木清华BBS电脑硬件版版主,创办电脑市场版。陈健在担任清华大学工程力学系科协主席期间,获得清华大学挑战杯一等奖,并代表清华大学参加了1997年的全国大学生电脑大赛。
作为国内顶尖学府,清华大学当时建立的计算机中心也只是用普通PC机搭建起的计算环境。1999年至2000年间,国内计算机普及发展处于起步阶段,国人对计算机的认识尚在PC机。在应用层面,超算概念只出现在极少数顶尖专家的认知中。
中国研制超级计算机的历史要从20世纪60年代开始。80年代末,受日本第五代机计划的影响,国家开始研究支持人工智能应用的计算机系统,1990年转向支持计算密集型应用的并行计算机;1998年,我国进入了高性能计算机与网格计算环境并重的状态,以便形成可以使用的计算能力。浓厚的兴趣和发自内心狂热的喜欢,促使陈健快速学习计算机知识,为他日后从事超算事业奠定了坚实的技术基础。
陈健:三排左三
初识超算威力,播下理想种子
1997年,陈健作为清华本硕博联合培养的第一批实验生,提前一年完成本科学业,作为直博生继续在清华攻读流体力学博士课程。2000年,陈健赴荷兰代尔夫特理工大学(TUDelft)做访问学者。
代尔夫特理工大学(TUDelft)拥有世界一流的流体力学实验室,流体力学中湍流模拟对计算的要求非常高,这个实验室可以同时使用荷兰国家实验室的超级计算机资源。在学习期间,陈健第一次使用Cray、SGI等超级计算机来做DNS大规模湍流模拟。
陈健发现,在国内使用PC机需要几年才能完成的计算任务,使用超级计算机仅需要一天或者更短时间,这极大地提升了科研速度和效率。原本对计算就很着迷的陈健,对超级计算机更是产生浓厚的兴趣。这段出国攻读博士的经历,让陈健深深体会到将超级计算机和科研相结合所带来的飞跃和效率,内心悄然种下了使用超算、助力超算在中国发展的种子。
那些黑白颠倒的日子里,萌发新愿望
2001年回国后,陈健发现有些科研资料数据没有计算和处理完毕,学校又没有相应的机器,国内没有相应的硬件资源,陈健意识到国内在“计算”这件事情上没有想象的那么简单。他只能通过国际互联网,连接到荷兰国家超算中心使用计算资源。
但当时的国际网络很差,坐在计算机面前,敲了字符等待缓慢的回显是一件非常痛苦的事情。陈健发现只有在夜间网络才会稍快些,于是之后的一年时间里,每天晚上八点到早上六点,陈健在实验室使用荷兰国家超算中心的资源,算完后将数据传回在国内进行处理,但传回的过程中又经常会出现传输错误,断点续传也不可靠,无奈陈健只好将大数据分割成10M的小文件,一个大数据最多的时候需要分成1000多个小文件。
作为一名普通用户,陈健感受到了计算技术的落后给科研带来的痛苦,不仅科研人员的生物钟被打乱,最重要的是想找的计算资源找不到,找到计算资源后,网络连接很慢,还会出现数据传不回来或传输错误的情况。
从那时起,陈健坚定了自己的理想:要发挥自身跨界优势,让国内的科研工作者也能够高效、快速地“做计算”,让科研工作者把精力放在解决问题上,而不是到处找机器、找计算资源。接下来,陈健做了一个惊人的决定。
力学跨道超算 在超算赛道中跟跑
体验过超级计算机无与伦比的性能后,陈健开始反思国内超算发展落后的现状,希望奉献一己之力。
2002年,陈健从清华大学博士毕业,暂时放下自己的力学专业,坚定地投身于超算事业,希望能找到创新模式来提升国内科研人员的工作效率,惠及更多企业用户。
起跑第一棒,一锤定音联想
2002年,我国认识到超算在未来国际博弈中的战略地位,大力支持超算事业。当时联想作为国内计算机技术领先的标杆企业,一方面开展品牌整机走进社会各界的推广落地。另一方面邀请了当时中国科学院计算技术研究所研究员祝明发老师成立联想高性能服务器事业部并出任总经理,将一批年轻优秀的计算机人才网罗到旗下。
此时的陈健,博士毕业拿着几个录用信正举棋不定,听到这个消息,向联想投了一份简历。陈健被联想一眼相中,立即签约,担任高性能服务器事业部方案处高级方案工程师,陈健的超算事业正式开启。
在随后三年的联想工作中,陈健全力付出,凭借扎实的计算机技术功底,参与了联想深腾万亿次、四万亿次超级计算机的研制,解决了诸多项目的攻坚技术难题,不仅成为名副其实的事业部超算技术专家,也是攻克突发技术难题的救火特派专使。
遗憾的是,2005年联想战略转型将高性能服务器事业部撤销,并入服务器事业部。经过认真思考后,陈健依然坚定超算方向,出于对顶尖技术的狂热追求,陈健选择加入了英特尔公司。
从量变到质变:跟跑中拓宽全球业务视野
2005年到2010年,陈健实现了超算生涯的新突破。在英特尔工作期间,陈健历任资深性能优化工程师、高性能计算架构师,负责中国大型HPC(高性能计算)及前沿HPC项目系统架构设计、HPC系统优化及高性能计算技术推广。
这五年陈健接触到更广泛的超算应用项目,从技术攻坚者转变为HPC项目系统架构设计者,对效率的极致追求直接转变为对系统、应用、代码、芯片微架构指令的顶级优化。
凭借突出的业绩,陈健2010年荣获英特尔中国奖(Intel China Award)(英尔特中国最高奖)。从联想到英特尔,在一次次帮助客户解决一线问题的过程中,陈健积累了丰富的经验,从技术层面感受到了用户使用超算中的痛点:一是在系统级别层面,系统应用是个黑匣子,用户看不到系统运行中诸如CPU指令执行,内存带宽、浮点运算性能Gflops值等情况,导致一旦出现问题时,用户无法快速识别并了解故障程度;二是在性能级别层面,一些海洋模拟、大气预报、基因监测等大型应用移植到超级计算机的过程,增加了科研人员的工作量。
国内很多应用行业的专家在做科研时,常会被逼着学习计算机的知识,但隔行如隔山,这样导致科研时间变长,影响科研效率。基于自己清华时代的“用户背景”和对用户痛点的了解,陈健继续寻找让用户用好超算的最佳途径。他想到了一个落地的模式。
十年磨一剑 超算赛道中领跑
在马拉松比赛中,前期领跑,一马当先,一骑绝尘固然潇洒,但是科学规划全程、合理分配体力才是关键,什么时候该快,什么时候该慢是最重要的。
找到用户使用超算痛点的原因后,陈健思考如何在“超算应用”这个点上做得更好。这时,他发现国内没有找到一家公司专门做超算性能优化,只有一些硬件厂商里的小部门团队为硬件的应用在做支撑。
2005年英特尔公司宣布首款双路服务器的双核、超线程英特尔至强处理器时,激发了陈健的灵感,至强可以提高多线程服务器的应用性能并缩短响应时间。陈健认为这将是并行时代来临的标志,跟随这个潮流最好的方式就是以公司模式满足用户的并行化、优化需求,而这个模式也恰恰可以实现他的愿望。梦想照进现实的契机从2010年开始,一波三折。
加入、离开到参股北龙超云,摸索细分赛道
2010年,中国科学院计算机网络信息中心等9家单位共同投资北京北龙超级云计算有限责任公司(以下简称北龙超云),邀请陈健以合伙人身份出任CTO(首席技术官)。陈健放弃英特尔高薪待遇,选择来到中国科学院计算机网络信息中心,承建 “中国国家网格”这张超算资源共享的大网。
(图片来源于:中国国家网格,http://www.cngrid.org/hjjs/jqyjxx/)
“中国国家网格”是国家863计划重大专项支持的,聚合高性能计算和事务处理能力的新一代信息基础设施的试验床,通过资源共享、协同工作和服务机制,有效支持科学研究、资源环境、先进制造和信息服务等应用。
实际运营需要快速灵活决策,而对速度和效率的追求则根植于创业者的灵魂气质。北龙超云无法接受早期亏损运营,在尝试了三年之后,陈健辞去北龙超云的CTO职位,只保留了股东身份,继续寻找合适的途径,实现超算助推中国科研高速发展的理想。
2013年,陈健正式出任并行科技总经理,带领只有几十个人的队伍开启了新的征程,希望通过并行服务继续筑梦,用“互联网+运维”“互联网+计算”的理念,提升服务效率,从传统的软件服务开始,不断向云服务迈进。
2017年,中国科学院计算机网络信息中心决定北龙超云和并行科技全面深入合作。从此,北龙超云作为中国科学院计算机网络信息中心超算方向仅有的独家战略合作单位,北龙超云继续运营北京超级云计算中心,并行科技成为中国国家网格服务公司,依托全国超算中心通过中国国家网格服务平台推出“超算云服务平台”,在不断探索中找到创新点。2020年11月北京超级云计算中心A分区以3.74PFlops,6000颗AMD最新罗马处理器的超算系统荣获中国超算Top100排行榜第三名,紧随曾经的世界第一“太湖之光”和“天河二号”之后,成为支撑中国科研发展的生力军。
(图片来源于:北京超级云计算中心,http://www.blsc.cn/view.asp?classid=1)
开启领跑模式,让并行超算云
成为中国科研用户首选的计算资源平台
通过并行超算云服务平台,用户可以在统一的超算云桌面完成所有工作,实现在一个桌面下采用同样的使用方法和习惯,用户可以便捷地使用上百种应用和几十家超算中心的资源,确保科研用户聚焦在自身业务上而不用关注IT本身。
至此,并行科技服务的行业得到拓展,包括科研、教育、政府机构、企事业单位、汽车制造、海洋环境、生物基因、新能源、航空航天与船舶等。
2013年,中国自主研制的嫦娥三号探测器由长征火箭成功发射升空,并准确送入地月转移轨道,正式开启了中国首次地外天体软着陆之旅。嫦娥三号探测器在月球表面虹湾以东地区域成功着陆,标志我国已成为世界上第三个实现地外天体软着陆的国家。并行科技协助射电天文技术实验室从计算机系统角度对测轨程序进行并行化与优化,通过提升VEC比例、降低CPI等手段深度挖掘计算机的潜力,使之达到嫦娥三号VLBI信号处理的性能要求。
2018年,并行科技助力青岛海洋科学与技术国家试点实验室研发的“海洋业务运营大屏展示系统”,与实验室重大前沿科学问题、系统布局和自主研发的海洋高端装备、推进海洋军民融合等项目一并接受了国家领导人的检阅。
一直以来,并行科技为众多科研项目做出了自己的贡献。让中国科研人才更高效专注科研,是并行科技的愿景。过去十年,并行科技一步步创新,构建超算云平台实现这一目标。未来,并行科技将通过并行超算云开启新起点,为超算在各领域广泛应用提供一条高速发展的路径。

在超越自我中实现社会价值
近年来,基于高性能计算的人工智能应用呈拓展趋势,大数据、金融计算、社会计算等都成为高性能计算的新领域。相对于美国等超算强国而言,中国超算研发人才具备相当实力,但在超算应用人才方面存在短板。
这是一个产业生态问题,从行业来说,需要培养大批超算应用人才,而这项工作绝非一朝一夕就能够完成,需要超算产、学、研、用各方面努力去破解。
高性能计算应用的开发、实施、推广和普及需要大量高素质人才,从2013年开始,并行科技开始承担超算人才培养的重任。
以赛促教,以赛促学,着眼应用培养人才
在超算领域,目前缺乏自主研发的大型高性能计算应用软件,缺少具有跨学科知识和视野广阔的高水平人才,应用领域的软件开发和人才培养投入显得迫在眉睫。换句话说,超算需要建立一个全新的,不同以往的生态环境,才能促进超算应用长远发展。
要破解超算领域的人才发展难题,归根结底还是需要用系统性的思维来看待这一问题,并做出积极应对。并行科技希望以竞赛的形式,提升并行性能优化创新,促进并行应用学术交流与发展,培养更多优秀的高性能计算并行应用领域人才,进而将蕴藏在学术界的优秀并行优化技术与应用能力融入到企业实际应用中。
2012年,并行科技设立并行大讲坛,在HPC领域第一个提供免费技术讲座服务。2013年,并行科技联合英特尔创办并行应用挑战赛全国并行应用挑战赛,以赛促教,以赛促学,旨在为中国高性能计算和新兴人工智能领域培养选拨优秀人才。大赛设置并行优化、HPC应用、人工智能三大赛道,累计吸引全国300所高校,6000余名师生参与。
2016年,并行科技开始承办中国高性能计算领域一年一度最大的行业盛会——HPC全国高性能计算学术年会,打造集产、学、研、用于一体的行业生态的交流平台。2019年8月20日至24日,并行科技承办的第十五届全国高性能计算学术年会在内蒙古呼和浩特市召开。
2017年,并行科技联合国家超级计算无锡中心举办了国产CPU并行应用挑战赛(简称CPC),发掘典型应用,培养创新人才,提升我国高性能计算的整体水平。
并行科技还于2017年设立并行学院,专注高性能计算应用领域,打破传统培训机构教育模式,从行业应用角度出发,为参加培训的学员提供技术+案例+实操等全方位实用技能进阶教育,为高性能计算企事业单位输送优质人才,成就企业优才和个人晋升的职业价值梦想。目前,并行学院在全国各高校及北京总部举办了30余场专场培训和技术交流会,吸引了近千名高性能计算应用领域人才。
设立“并行基金”,承担社会责任,促进产业发展
并行坚持奉行“为教育奉献回报”的企业理念,旨在传播公益教育,倡导发现和资助高校优秀人才,践行企业社会责任,为中国高性能计算行业培养跨学科复合型人才,为搭建行业公益生态系统奉献力量。
如今,并行基金用于奖励在并行应用挑战赛中有突出成绩和贡献的学生,资助西部及偏远地区高校优秀人才参加全国高性能计算学术年会,支持中国高校优秀参赛队出国参加世界级高性能计算领域赛事等。
创立 “超级云计算教育基金”,培养学科人才,助力科技成果产出
2019年10月,并行科技联合中国科学院计算机网络信息中心、中国科学院大学教育基金会共同创办“超级云计算”教育基金,由北京超级云计算中心提供支持。“超级云计算”教育基金旨在大力培养各学科领军人才,推进超级云计算创新服务模式在各领域的应用,助力我国重大科技成果的产出和科技创新能力的提升。
情系母校,茂密树干对根的深情回首
在并行科技一路成长中,母校不断给予滋养,2014年,并行科技获得清华创投天使投资,2015年获得清华银杏投资,校友的支持和激励鞭策着陈健在超算道路上加速前进。25年来,“自强不息 厚德载物”的校训也深深融入陈健的言行中,作为清华航天航空学院校友会常务理事、清华企业家协会会员,陈健热心于校友事业,回馈母校。
如今,“做计算,找并行®”,不仅是一个口号;“并行超算云,用超算更省心”也已经成为超算行业内用户的共识。
作为一名清华人,陈健希望不断传承“自强不息 厚德载物”、“行胜于言”的清华精神,非串行、非独行,而是并行;在行动中实现自我价值,实现企业的社会价值。勇于奋斗,敢于创新,追求卓越,在“超级计算”这场长跑中与更多同行者一起实现中国梦!
文章来源于《清芬领航企业创新辑录》,有部分删减
部分图片来源于网络
编辑:高娜
责编:刘颖
附:《清芬领航企业创新辑录(第一册)》
清华大学产业创新与金融研究院(IIIF)主编的《清芬领航企业创新辑录(第一册)》,由清华大学出版社出版。该书收录了十六家清华校友企业的创新创业故事,全面记录了这些企业创办、发展、成长、壮大的发展历程,十六家企业涉及行业包括生物医药、电子信息技术、能源与环境保护、先进制造、新材料技术等。该书通过真实记述企业家的创新行为、创业现象、创业过程、创业方式,以及企业与外部环境相互作用等动态历程,为读者呈现了企业家、创业者宝贵的创新精神。并有助于读者进一步认知创业企业特别是高新技术企业的构成要素、运行体系、内外环境以及创新与发展规律。
清华大学
产业创新与金融研究院