邓稼先创新研究中心

超大规模并行算法研究团队介绍

1.  主要研究方向

本团队面向武器物理、激光聚变、材料科学、重大装备工程力学等重大应用领域对超大规模计算的需求,针对实际数值模拟应用的多物理、多介质、多尺度、强非线性、强间断等复杂应用特征和计算机多级嵌套海量并行、异构众核协同计算的体系结构特征和发展趋势,研究适应千万亿次、亿亿次/十亿亿次和未来百亿亿次计算的超大规模并行算法及性能优化方法,突破实际应用数值模拟在当前和未来超级计算机上的并行可扩展瓶颈,形成面向超大规模高效能计算的并行算法研究体系。

主要研究方向包括:

1)应用驱动的数值并行算法。面向实际数值模拟应用大规模计算面临的数值计算效率问题,设计应用特征驱动的快速数值并行算法,包括;结构和非结构网格并行自适应算法、稀疏线性或非线性代数方程组并行求解算法、稀疏矩阵特征值算法、并行多重网格与区域分解算法、第一性原理计算并行算法、并行快速多极子算法、三维并行FFT算法等。

2应用驱动的非数值并行算法。面向实际数值模拟应用大规模计算面临的并行可扩展等非数值计算问题,设计应用特征驱动的高可扩展非数值并行算法,包括:网格剖分与动态负载平衡算法、数据通信算法、稀疏矩阵与图剖分组合算法、输运扫描并行算法、自适应网格管理算法等。

3计算模式驱动的性能优化。针对实际数值模拟应用中的批量应用软件,面向国产高性能计算机体系结构,凝练影响浮点性能的共性计算模式(如Stencil、扫描计算、稀疏矩阵操作等),基于共性计算模式特征,研究匹配国产计算机体系结构的性能优化方法,研发相应的性能优化工具和软件模块。

4)浮点字长匹配性理论与优化方法。面向实际数值模拟应用的超大规模计算,开展浮点舍入误差的建模与分析,研究均衡精度与性能的优化方法,建立面向应用特征的浮点字长匹配性理论。

5)物理特征驱动的数据分析与可视化算法。面向实际应用中海量模拟数据的可视分析瓶颈问题,研究物理特征驱动的高效可视分析算法,包括:特征抽取与数据约减算法、模式驱动的高表现可视分析算法、多物理耦合可视化算法、原位可视分析算法等。

6)高效能共性算法库研制。基于个性与共性分离原则,凝练算法的基本运算与计算模式,集成算法研究成果,形成一批适应亿亿次至百亿亿次量级计算的高效能基础共性算法库。

本团队长期招聘上述研究方向的工作岗位、博士后和研究生。

联系:徐小文(xwxu@iapcm.ac.cn

在研科研项目(团队成员作为负责人)

1)国家自然科学基金项目:5

2)国家重大研发计划重点专项课题:3

3)国防科工局基础科学挑战专题项目:9

3团队成员

团队首席:徐小文,博士,研究员(联系:xwxu@iapcm.ac.cn

2002年本科毕业于湘潭大学数学系,2007年毕业于中国工程物理研究院研究生部获计算数学专业博士学位,同年进入北京应用物理与计算数学研究所高性能计算中心工作。主要从事大规模数值模拟应用中的并行算法研究及并行软件研发,研究兴趣包括多重网格算法、并行预条件迭代方法、并行数值代数解法器、并行编程框架及应用等。近年来,承担国家自然科学基金2项、国家重点研发计划高性能计算重点专项课题1项、国家重大任务课题多项,获国家技术发明二等奖1次、军队科技进步一等奖2次,授权国家发明专利2项,合作出版著作1部,发表学术论文20多篇。现担任北京应用物理与计算数学研究所高性能计算中心主任、国防基础科研科学挑战计划计算科学领域百亿亿次高效能实现方向首席专家、中物院高性能数值模拟软件中心编程框架团队首席专家。在本团队中,全面负责团队科研工作组织与团队建设,承担并行预条件迭代方法等快速算法方面的研究工作。

团队主要成员:

安恒斌,博士,研究员(联系:an_hengbin@iapcm.ac.cn

2004年获中科院计算数学所理学博士学位,2006年从北京应用物理与计算数学研究所博士后出站,2006年至今在北京应用物理与计算数学研究所高性能计算中心工作。主要从事并行数值算法研究及解法器库研制,发表学术论文20多篇,合作出版著作2部。主持国家自然科学基金项目3项,科技部国家重点研发计划全球变化及应对专项课题1项,曾获首届应用数值代数奖,中国博士后科学基金一等资助,军队科技进步一等奖1次。在本团队负责非线性代数方程组的迭代方法研究及解法器研制。

谷同祥,博士,研究员(联系:txgu@iapcm.ac.cn

2001年获中物院研究生部理学博士学位,2003年从中科院软件所博士后出站,2003年至今在北京应用物理与计算数学研究所计算物理实验室工作。长期从事大型稀疏代数方程组的并行迭代算法及预条件技术的研究与软件开发工作,发表学术论文90多篇,出版专著3部,教材1本,现任北京计算数学学会理事。在本团队负责稀疏线性代数方程组的并行迭代方法、预条件技术及浮点字长匹配性理论与优化研究。

张爱清,博士,研究员(联系:zhang_aiqing@iapcm.ac.cn

2001年毕业于浙江大学数学系获硕士学位,同年进入北京应用物理与计算数学研究所高性能计算中心工作,2009年于中国工程物理研究院研究生部获博士学位,长期从事高性能应用软件编程框架研制、高性能应用软件研发和并行算法基础研究工作,获国家技术发明二等奖1次、军队科技进步一等奖3项,二等奖1项,国家发明专利3项,发表学术论文10多篇。在本团队负责浮点性能优化方法研究。

高兴誉,博士,副研究员(联系:gao_xingyu@iapcm.ac.cn

2004年本科毕业于南京大学数学系,2009年获中科院计算数学所理学博士学位,同年进入北京应用物理与计算数学研究所高性能计算中心工作。主要从事非线性特征值问题算法研究及第一性原理并行软件研制,发表学术论文10多篇,20112013年获全国高性能计算学术年会优秀论文奖。在本团队负责KKR格林函数的第一性原理并行算法研究和解法器研制。

刘旭,博士,副研究员(联系:liu_xu@iapcm.ac.cn

2003年本科毕业于北京大学数学学院,2008年获中物院研究生部理学博士学位,2008年至今在北京应用物理与计算数学研究所高性能计算中心工作,长期从事负载平衡方法研究和负载平衡工具箱的研发。近年来,发表10多篇学术论文,获国家技术发明二等奖1次、军队科技进步一等奖1次和国家发明专利1项。在本团队负责负载平衡算法研究。

王华维,博士,副研究员(联系:wang_huawei@iapcm.ac.cn

1998年本科毕业于清华大学应用数学系,2004年获清华大学计算机科学与技术系工学博士学位。2004年至2009年先后于清华大学、香港科技大学和香港城市大学从事博士后研究。2009年至今在北京应用物理与计算数学研究所高性能计算中心工作,主要从事科学计算可视化和计算机图形学方面的研究,发表学术论文30多篇。在本团队负责PB量级数据场的可视分析算法研究。

徐然,博士,副研究员(联系:xu_ran@iapcm.ac.cn

2012年在清华大学航天航空学院获得工学博士学位,后进入清华大学动力工程与工程热物理博士后流动站工作,2014年加入中物院高性能数值模拟软件中心领域编程框架团队。研究方向包括PDE结构和非结构网格离散并行算法及实现、线性代数问题快速算法、油藏模拟问题、地震勘探的反问题和纳米/生物材料优化等。目前共发表论文十余篇,主持或作为主要参与人申请获批国家自然科学基金等课题十余项。在本团队负责结构力学快速算法研究与解法器开发。

杨章,博士,副研究员(联系:yang_zhang@iapcm.ac.cn

2006年本科毕业于四川大学数学学院,2011年获中科院数学与系统科学研究院计算数学博士学位,2011年至今在北京应用物理与计算数学研究所高性能计算中心工作。主要从事高性能计算研究和并行编程框架开发。获军队科技进步一等奖1项,发表与团队方向相关的学术论文4篇,获高性能计算相关专利授权3项,获得计算物理实验室应用基础创新奖1项。在本团队负责数据通信算法及浮点性能优化方法研究。

游春光,博士,助理研究员(联系:you_chunguang@iapcm.ac.cn

2017年获中科院数学与系统科学研究院计算数学博士学位,2017年加入中物院高性能数值模拟软件中心领域编程框架团队。在本团队负责大规模稀疏矩阵特征值并行算法研究。

4. 代表性科研成果

著作:

1.  谷同祥,徐小文,刘兴平,安恒斌,杭旭登编著,迭代方法和预处理技术(下册),北京:科学出版社,信息与计算科学丛书(76)2015.11.

2.  谷同祥,安恒斌,刘兴平,徐小文编著,迭代方法和预处理技术(上册),北京:科学出版社,信息与计算科学丛书(75)2015.11.

3.  蹇人宜安恒斌,解析函数空间上的算子理论导引,科学出版社,2007.

论文:

1.       Hengbin An, Xiaowei Jia, Homer F. Walker, Anderson acceleration and application to the three-temperature energy equations, Journal of Computational Physics, DOI: 10.1016/j.jcp.2017.06.031(2017).

2.       Xiaowen Xu, Zeyao Mo, Algebraic interface based coarsening AMG preconditioner for multi-scale sparse matrices with applications to radiation hydrodynamics computation, Numer Linear Algebra Appl, doi: 10.1002/nla.2078 (2017)

3.       Xiaoqiang Yue, Xiaowen Xu, Shi Shu, JASMIN-based Two-dimensional Adaptive Combined Preconditioner for Radiation Diffusion Equations in ICFEast Asian Journal on Applied Mathematics, doi: 10.4208/eajam (2017).

4.       Xingyu Gao, Jun Fang, and Han Wang*. Kaiser-Bessel Basis for the Particle-Mesh Interpolation. Physical Review E, 95, 063303 (2017).

5.       Xingyu Gao, Zeyao Mo, Jun Fang, Haifeng Song and Han Wang*. Parallel 3-dim fast Fourier transforms with load balancing of the plane waves, Computer Physics Communications, 211, 54-60 (2017).

6.       Li-Tao Zhang, Tong-Xiang Gu*, Global Modulus-Based Synchronous Multisplitting Multi-Parameters TOR Methods for Linear Complementarity Problems, Mathematical and Computational Applications, 22(20): 1-11, 2017.

7.       Huawei Wang, Li Xiao, Zhiwei Ai, Yi Cao. A Visualization Pipeline for Computable Geometric Model Data, Proceedings of International Conference on CGVCVIP 2017, pp. 147-154, Lisbon, Portugal, July 2017.

8.       Xuefeng Liu, Chunguang You. Explicit bound for quadratic Lagrange interpolation constant on triangular finite elements, Applied Mathematics and Computation, https://doi.org/10.1016/j.amc.2017.08.020, 2017.

9.       刘旭,徐小文,张爱清,面向结构网格自适应并行计算的矩形区域求差集快速算法,计算物理,2017(5): 563-573.

10.   Yu Li, Xiaole Han, Hehu Xie, Chunguang You. Local and Parallel Finite Element Algorithm Based On Multilevel Discretization for Eigenvalue Problem, International Journal of Numerical Analysis & Modeling, 13(1): 73-89, 2016.

11.   Huawei Wang, Li Xiao, Yi Cao, Zhiwei Ai, Pingjun Xu. Visibility-Culling-Based Geometric Rendering of Large-Scale Particle Data. Proceedings of 2016 International Conference on Virtual Reality and Visualization, pp. 197-203, IEEE CPS, Hangzhou, China, Sept. 2016.

12.   Huawei Wang, Zhiwei Ai, Yi Cao, Li Xiao. A parallel preintegration volume rendering algorithm based on adaptive sampling. Journal of Visualization, 19(3): 437-446, Springer, Aug. 2016.

13.   Jun Fang, Xingyu Gao, Haifeng Song and Han Wang*. On the existence of the optimal order for wavefunction extrapolation in Born-Oppenheimer molecular dynamics, Journal of Chemical Physics, 144, 244103 (2016).

14.   Xingyu Gao, Jun Fang and Han Wang*, Sampling the isothermal-isobaric ensemble by Langevin dynamics, Journal of Chemical Physics 144, 124113 (2016).

15.   徐小文,莫则尧,安恒斌求解大规模稀疏线性代数方程组序列的自适应AMG预条件策略,中国科学:信息科学, 46(10): 1411-1420dio:10.1360/N112016-00074 (2016).

16.   Xian-Yu Zuo, Li-Tao Zhang, Tong-Xiang Gu, Feng-Bin Zheng, Ning Li, A parallel version of GPBi-CG method suitable for distributed parallel computing, Comp. Appl. Math., 35:579–593, 2016.

17.   Xian-yu Zuo, Ze-yao Mo, Tong-xiang Gu, Xiao-wen Xu, Ai-qing Zhang, Multi-core parallel robust structured multifrontal factorization method for large discretized PDEs, Journal of Computational and Applied Mathematics, 296: 36-46, 2016.

18.   Li-Tao Zhang , Xiao-Na Dong, Tong-Xiang Gu, Xian-Yu Zuo, Xing-Ping Liu, An improved generalized conjugate residual squared (IGCRS2) algorithm suitable for distributed parallel computing, Japan Journal of Industrial and Applied Mathematics, 32(1): 143-155, 2015.

19.   Li-Tao Zhang, Yu-Xia Zhang, Tong-Xiang Gu, Xing-Ping Liu, Liu-Wei Zhang, New convergence of modulus-based synchronous block multisplitting multi-parameter methods for linear complementarity problems, Computational and Applied Mathematics, 2015, 5 First online.

20.   Tongxiang Gu, Liu Xinggping, Zeyao Mo, Xiaowen Xu, Shengxin Zhu, On the memory wall and performance of symmetric sparse matrix multiplications in different data structures on shared memeory machines, IEEE UIC-ATC-ScalCom-CBDCom-IoP2015, 2015 IEEE 15th International Conference on Scalable Computing and Communication, pp1439-1444, 2015.

21.   Li-tao Zhang, Tong-Xiang Gu, Xing-Ping Liu, Overlapping restricted additive Schwarz method with damping factor for H-matrix linear complementarity problem, Applied Mathematics and Computation, Vol. 271: 1-10, 2015.

22.   刘旭, 莫则尧, 安恒斌,. 一种基于实测的自动负载建模算法[J]. 计算机科学, 2015, 42(1):63-66.

23.   MO ZeYao, ZHANG AiQing, LIU QingKai, CAO XiaoLin. Research on the components and practices for domain-specific parallel programming models for numerical simulation, Scientia Sinica Informationis, 45(3), 2015.

24.   莫则尧, 张爱清, 刘青凯, 曹小林. 数值模拟领域并行编程模型的要素与实例研究, 中国科学:信息科学, 2015(3):385-397, 2015.

25.   Huawei Wang, Zhiwei Ai, Yi Cao. Information-Entropy Based Load Balancing in Parallel Adaptive Volume Rendering, Proceedings of International Conference on CGVCVIP 2015, pp. 163-169, Las Palmas, Spain, July 2015.

26.   Tao Feng, Xijun Yu, Hengbin An, Qin Li, Rongpei Zhang, The preconditioned Jacobian-free Newton-Krylovmethods for nonequilibrium radiation diffusion equations, Journal of Computational and AppliedMathematics, 2014, 255(1)60-73.

27.   宋海峰*, 高兴誉, 邵建立, 王帅创. 材料大规模计算的需求与挑战, 中国计算机学会通讯, 2014, 10(1): 26-31.

28.   Cong Zheng, Shuo Gu, Tong-Xiang Gu*, Bing Yang, Xing-Ping Liu, BiELL: A bisection ELLPACK-based storage format for optimizing SpMV on GPUs, Journal of Parallel and Distributed Computing, 74: 2639–2647, 2014

29.   Sheng-Xin Zhu, Tong-xiang Gu, Xing-Ping Liu, Minimizing synchronizations in sparse iterative solvers for distributed supercomputers, Computers and Mathematics with Applications, 67(1): 199-209, 2014

30.   Ran Xu, Bin Liu*, 2014, A hybrid molecular dynamics atomic-scale finite element method for quasi-static atomistic simulations at finite temperature. Journal of Applied Mechanics, 81(2): 051005-7.

31.   Z Mo, A Zhang, Z Yang. A new parallel algorithm for vertex priorities of data flow acyclic digraphs, Journal of Supercomputing, 68(1):49-64, 2014.

32.   张爱清, 莫则尧, 杨章. 数据驱动并行计算的3层软件架构设计及应用, 计算机研究与发展, 51(11):2538-2546, 2014.

33.   张爱清, 莫则尧, 曹小林, 安恒斌,郭红. JASMIN框架中联邦并行计算及其在多物理耦合中的应用, 计算机工程与科学, 35(1):15-23, 2013.

34.   Jun Fang, Xingyu Gao, Aihui Zhou*. A symmetry-based decomposition approach to eigenvalue problems, Journal of Scientific Computing, 2013, 57: 638-669.

35.   徐小文,莫则尧,武林平,迭代方法中基于渐近规模的通信与计算比分析,计算机学报, 36(4): 782-7892013.

36.   Tao Feng, Hengbin An, Xijun Yu, Qin Li, Rongpei Zhang, On linearization and preconditioning forradiation diffusion coupled to material thermal conduction equations, Journal of ComputationalPhysics, 2013, 236:28-40.

37.   左风丽, 刘旭, 张宝印,. 基于JASMIN三维势场快速多极子算法的并行实现[J]. 计算物理, 2013, 30(1):140-147.

38.   Huawei Wang, Yi Cao, Li Xiao, Guoqing Wu. A Parallel Adaptive Volume Rendering Algorithm Based on Information Entropy. Proc. of ICVRV ’2013, pp. 127-131, IEEE Computer Society, Xi’an, China, 2013.

39.   Ran Xu, Bin Liu*, Yuan Dong, 2013, Scalable hierarchical parallel algorithm for the solution of super large-scale sparse linear equations. Journal of Applied Mechanic, 80(2): 020901-8.

40.   Ran Xu, Bin Liu*, Xiaoqiao He, Dechang Li, 2012, Kinetic Energy-Based Temperature Computation in Non-Equilibrium Molecular Dynamics Simulation. Journal of Computational and Theoretical Nanoscience, 9(2012): 428-433.

41.   Huawei Wang, Li Xiao, Yi Cao. A Parallel Adaptive Volume Rendering Algorithm with Static Load Balancing, Proc. of CGVCVIP Conference ’2012, pp. 137-141, Lisbon, Portugal, July 2012.

42.   刘旭, 张爱清, 肖丽,. 面向结构网格并行应用的一类快速通信算法[J]. 计算物理, 2012, 29(1):58-64.

43.   Jun Fang, Xingyu Gao*, Aihui Zhou. A Kohn-Sham equation solver based on hexahedral finite elements, Journal of Computational Physics, 2012, 231: 3166-3180.

44.   安恒斌,莫则尧,JFNK方法迭代过程与物理约束,计算物理,2012, 255(1): 130-136.

45.   徐小文,莫则尧,刘青凯,安恒斌自适应结构网格上扩散方程隐式时间积分算法及应用,计算物理,29(5): 684-692, 2012.

46.   周志阳,徐小文,舒适,冯春生,莫则尧,二维三温辐射扩散方程两层预条件子的自适应求解,计算物理,29(4):475-483,2012.

47.   Weiyin Ma and Huawei Wang. Interpolating an Arbitrary Number of Joint B-Spline Curves by Loop Surfaces, Computers and Graphics, 36(5): 321-328, 2012.

48.   Huawei Wang, Li Xiao, Yi Cao. An Adaptive Sampling Based Parallel Volume Rendering Algorithm. Proc. of ICVRV ’2011, pp. 158-163, IEEE Computer Society, Beijing, China, 2011.

49.   Hengbin An, Ju Wen and Tao Feng, On finite difference approximation of a matrix-vector product in the Jacobian-free Newton-Krylov method, J. Comput. Appl. Math., 2011, 236: 1399-1409.

50.Zeyao Mo, Aiqing Zhang, Xiaolin Cao, Qingkai Liu, Xiaowen Xu, Hengbin An, Wenbing Pei, Shaoping Zhu, JASMIN: a parallel software infrastructure for scientific computing, Front. Comput. Sci. China, 4(4):480-488, 2010.

51.   Hengbin An, Zeyao Mo, Xiaowen Xu, Xu Liu, On choosing a nonlinear initial iterate for solving the 2-D 3-T heat conduction equations, J. Comput. Phys., 2009, 228: 3268-3287

52.   徐小文,莫则尧,安恒斌求解二维三温辐射扩散方程组的一种代数两层网格迭代方法,计算物理,26(1): 1-82009.

53.   Huawei Wang and Weiyin Ma. Biorthogonal wavelets based on interpolatory subdivision, Computer Graphics Forum, Vol. 28, No. 6, pp. 1572-1585, Sept. 2009.

54.   Huawei Wang and Kai Tang. Biorthogonal Wavelet Construction for Hybrid Quad/Triangle Meshes, The Visual Computer, 25(4): 349-366, 2009.

55.   Ran Xu, Bin Liu*, 2009, Investigation on the applicability of various stress definitions in atomistic simulation. Acta Mechanica Solida Sinica 22(6): 644-649.

56.   刘旭, 莫则尧, 曹小林. 基于内存约束的一维负载平衡方法及其应用[J]. 计算物理, 2009, 26(2):184-190.

57.   刘旭, 莫则尧. 多层次图排序算法及其在图剖分中的应用[J]. 数值计算与计算机应用, 2008, 29(3):226-240.

58.   Hengbin An, Zhong-Zhi Bai, A globally convergent Newton-GMRES method for large sparse systems of nonlinear equations, Appl. Numer. Math., 2007, 57(3): 235-252.

59.   Hengbin An, Zeyao Mo, Xingping Liu, A Choice of forcing terms in inexact Newton method, J. Comput. Appl. Math., 2007, 200: 47-60.

60.   Zeyao Mo, Xiaowen Xu, Relaxed RS0 or CLJP coarsening strategy for parallel AMG methods, Parallel Computing, 33(3):174-185, 2007.

61.   徐小文,莫则尧,并行代数多重网格算法可扩展性能分析,计算物理,24(4): 387-3942007.

62.   徐小文,莫则尧,一种新的并行代数多重网格粗化算法,计算数学,27(3): 325-3362005.

63.   Hengbin An, On convergence of the Additive Schwarz Preconditioned Inexact Newton method, SIAM J. Numer. Anal., 2005, 43(5): 1850-1871.