邓稼先创新研究中心
超大规模并行算法团队介绍
1.  主要研究方向(包括研究内容)
本团队面向武器物理、激光聚变、材料科学、重大装备工程力学等重大应用领域对超大规模计算的需求,针对实际应用数值模拟的多物理、多介质、多尺度、强非线性、强间断等复杂应用特征和计算机多级嵌套海量并行、异构众核协同计算的体系结构特征和发展趋势,研究适应千万亿次量级以上的超大规模并行算法及性能优化技术,包括高可扩展数值和非数值并行算法、模式驱动的浮点性能优化方法、海量数据可视分析算法、浮点字长理论与方法等,突破实际应用数值模拟在当前和未来超级计算机上的并行可扩展瓶颈,形成面向超大规模高效能计算的并行计算研究体系。
团队主要研究方向包括:
1应用驱动的数值并行算法。针对实际数值模拟应用中的数值计算效率问题,面向大规模并行计算,设计应用特征驱动的快速数值并行算法,包括:结构和非结构网格并行自适应算法、稀疏线性或非线性代数方程组并行求解算法、稀疏矩阵特征值算法、并行多重网格与区域分解算法、第一原理计算并行算法、并行快速多极子算法、三维并行FFT算法等。
2应用驱动的非数值并行算法。面向大规模实际数值模拟应用中并行可扩展等非数值计算问题,设计应用特征驱动的高可扩展非数值并行算法,包括:网格剖分与动态负载平衡算法、数据通信算法、稀疏矩阵与图计算组合算法、输运扫描并行算法、自适应网格管理算法等。
3计算模式驱动的性能优化。针对重大数值模拟应用中的批量应用软件,面向国产高性能计算机体系结构,凝练影响浮点性能的共性计算模式,如Stencil、扫描计算、稀疏矩阵操作等;基于实际应用表现的共性计算模式的特征,研究匹配国产高性能计算机体系结构的共性性能优化方法;研发相应的性能优化工具和软件模块。
4)浮点字长匹配性理论与优化方法。围绕超大规模数值计算应用的计算规模、并行模式和应用特征,开展面向大规模并行的浮点舍入误差分析模型,面向应用特征的浮点舍入误差分析,综合精度和性能的均衡优化方法等。
4)物理特征驱动的数据分析与可视化算法。面向实际应用中海量模拟数据的可视分析瓶颈问题,研究物理特征驱动的高效可视分析算法,包括:特征抽取与数据约减算法、模式驱动的高表现可视分析算法、多物理耦合可视化算法、原位可视分析算法等。
5)高效能共性算法库研制。基于个性与共性分离原则,凝练算法的基本运算与计算模式,集成算法研究成果,形成一批适应亿亿次至百亿亿次量级计算的高效能基础软件包及共性算法库。
2、团队成员
 
团队首席:徐小文,研究员,博士,1978年生。
     2002年本科毕业于湘潭大学数学系,2007年毕业于中国工程物理研究院获计算数学专业博士学位,同年进入北京应用物理与计算数学研究所高性能计算中心工作,主要从事大规模数值模拟应用中的并行算法研究及并行软件研发,研究兴趣包括多重网格算法、并行预条件迭代方法、数值代数软件及应用等。近年来,承担国家自然科学基金2项、科技部重点研发计划高性能计算专项课题1项、部委级课题多项,获军队科技进步一等奖2次、国家发明专利2项,合作出版著作1部,发表学术论文20多篇。
     现担任北京应用物理与计算数学研究所高性能计算中心主任、中物院高性能数值模拟软件中心编程框架团队首席专家、国防基础科研科学挑战计划百亿亿次高效能实现方向首席专家。在本团队中,主要负责团队工作组织与团队建设,具体承担并行预条件迭代方法等快速算法方面的研究工作。
 
团队成员
1)安恒斌,研究员,博士,1974年生。2004年获中科院计算数学所理学博士学位,2006年从北京应用物理与计算数学研究所博士后出站,2006年至今在高性能计算中心工作。主要从事并行数值算法研究及解法器库研制,发表与团队研究方向相关的学术论文20多篇,合作出版著作2部。主持国家自然科学基金项目3项,国家863计划项目1项,国家重点研发计划全球变化及应对课题1项,曾获首届应用数值代数奖,中国博士后科学基金一等资助一次,军队科技进步一等奖一次(排名7)。在本团队中负责非线性代数方程组的迭代方法研究及解法器研制。
2)高兴誉,副研究员,博士,1981年生。2009年获中科院计算数学所理学博士学位。2009年至今在高性能计算中心工作,主要从事非线性特征值问题算法研究及第一性原理并行软件研制,发表与团队研究方向相关的学术论文10多篇。20112013年,两次荣获全国高性能计算学术年会优秀论文奖;2013年和2015年,两次获得计算物理重点实验室创新奖。在本团队中负责基于多重散射理论的第一性原理并行算法研究和解法器研制。
3)谷同祥,研究员,博士,1964年生2001年获中物院研究生部理学博士学位,2003年从中科院软件所博士后出站。2003年至今在计算物理实验室工作,长期从事大型稀疏代数方程组的并行迭代算法及预条件技术的研究与软件开发工作,发表与团队研究方向相关的学术论文90多篇,出版专著3部,教材1本。现任北京计算数学学会常务理事。在本团队中负责稀疏线性代数方程组的并行迭代方法、预条件技术及浮点字长匹配性理论与优化体系研究。
4)刘旭,副研究员,博士,1981年生。2008年获中物院研究生部理学博士学位。2008年至今在高性能计算中心工作,长期从事负载平衡领域研究和负载平衡工具箱的研发。近年来,在学术刊物发表过十几篇学术论文,获得军队科技进步一等奖1次和国家发明专利1项。在本团队中负责负载平衡算法研究。
5王华维,副研究员,博士,1976年生。2004年获清华大学计算机科学与技术系工学博士学位。2004年至2009年先后于清华大学、香港科技大学和香港城市大学从事博士后研究。2009年至今在北京应用物理与计算数学研究所高性能计算中心工作,主要从事科学计算可视化和计算机图形学方面的研究,发表学术论文30多篇。曾主持中国博士后科学基金、院基金和实验室基金等课题,获中物院科技创新奖二等奖1项(排名4)。在本团队中负责PB量级数据场的可视分析算法研究及与TeraVAP对接。
6)徐然,副研究员,博士,1984年。2012年在清华大学航天航空学院获得工学博士学位,后进入清华大学动力工程与工程热物理博士后流动站工作,2014年加入中物院高性能数值模拟软件中心领域编程框架团队。研究方向包括PDE结构和非结构网格离散并行算法及实现、线性代数问题快速算法、油藏模拟问题、地震勘探的反问题和纳米/生物材料优化等。目前共发表论文十余篇,主持或作为主要参与人申请获批国家自然科学基金等课题十余项。在本团队中负责特征值问题迭代算法研究与解法器开发。
7)杨章,副研究员,博士,1984年生。2011年获中科院数学与系统科学研究院计算数学博士学位。2011年至今在北京应用物理与计算数学研究所高性能计算中心工作,主要从事高性能计算研究和并行编程框架开发。获军队科技进步一等奖1项,发表与团队方向相关的学术论文4篇,获高性能计算相关专利授权3项,并获得计算物理实验室应用基础创新奖1项。在本团队中负责数据通信算法及浮点性能优化方法研究。
8)游春光,助理研究员,博士,1991年生。2017年获中科院数学与系统科学研究院计算数学博士学位。2017年加入中物院高性能数值模拟软件中心领域编程框架团队。在本团队中负责大规模稀疏矩阵特征值并行算法研究。
9)张爱清,研究员,博士,1976年生。2001年毕业于浙江大学数学系获硕士学位,同年进入北京应用物理与计算数学研究所高性能计算中心工作,2009年于中国工程物理研究院研究生部获博士学位,长期从事高性能应用软件编程框架研制、高性能应用软件研发和并行算法基础研究工作,获军队科技进步一等奖3项,二等奖1项,国家发明专利3项,发表项目相关学术论文10多篇。在本团队中负责浮点性能优化方法研究。
3. 代表性成果
著作:
1.   谷同祥,安恒斌,刘兴平,徐小文编著,迭代方法和预处理技术(上册),北京:科学出版社,信息与计算科学丛书(75),2015.11.
2.   谷同祥,徐小文,刘兴平,安恒斌,杭旭登编著,迭代方法和预处理技术(下册),北京:科学出版社,信息与计算科学丛书(76),2015.11.
论文
1.        Xiaoqiang Yue, Xiaowen Xu, Shi Shu, JASMIN-based Two-dimensional Adaptive Combined Preconditioner for Radiation Diffusion Equations in Inertial Fusion Researc,East Asian Journal on Applied Mathematics, doi: 10.4208/eajam, 2017.
6.        周志阳,徐小文,舒适,冯春生,莫则尧,二维三温辐射扩散方程两层预条件子的自适应求解,计算物理,29(4):475-483,2012.
11.    Hengbin An, Xiaowei Jia, Homer F. Walker, Anderson acceleration and application to the three-temperature energy equations, Journal of Computational Physics, DOI: 10.1016/j.jcp.2017.06.031, 2017.
12.    Tao Feng, Xijun Yu, Hengbin An, Qin Li, Rongpei Zhang, The preconditioned Jacobian-free Newton-Krylov methods for nonequilibrium radiation diffusion equations, Journal of Computational and Applied Mathematics, 2014, 255(1):60-73.
13.    Tao Feng, Hengbin An, Xijun Yu, Qin Li, Rongpei Zhang, On linearization and preconditioning for radiation diffusion coupled to material thermal conduction equations, Journal of Computational Physics, 2013, 236:28-40.
14.    安恒斌,莫则尧,JFNK方法迭代过程与物理约束,计算物理,2012, 255(1): 130-136.
15.    Hengbin An, Ju Wen and Tao Feng, On finite difference approximation of a matrix-vector product in the Jacobian-free Newton-Krylov method, J. Comput. Appl. Math., 2011, 236: 1399-1409.
16.    Hengbin An, Zeyao Mo, Xiaowen Xu, Xu Liu, On choosing a nonlinear initial iterate for solving the 2-D 3-T heat conduction equations, J. Comput. Phys., 2009, 228: 3268-3287
17.    Hengbin An, Zhong-Zhi Bai, A globally convergent Newton-GMRES method for large sparse systems of nonlinear equations, Appl. Numer. Math., 2007, 57(3): 235-252.
18.    Hengbin An, Zeyao Mo, Xingping Liu, A Choice of forcing terms in inexact Newton method, J. Comput. Appl. Math., 2007, 200: 47-60.
19.    Hengbin An, On convergence of the Additive Schwarz Preconditioned Inexact Newton method, SIAM J. Numer. Anal., 2005, 43(5): 1850-1871.
20.    Xingyu Gao, Jun Fang, and Han Wang*. Kaiser-Bessel Basis for the Particle-Mesh Interpolation. Physical Review E, 95, 063303 (2017).
21.    Xingyu Gao, Zeyao Mo, Jun Fang, Haifeng Song and Han Wang*. Parallel 3-dim fast Fourier transforms with load balancing of the plane waves, Computer Physics Communications, 211, 54-60 (2017).
22.    Jun Fang, Xingyu Gao, Haifeng Song and Han Wang*. On the existence of the optimal order for wavefunction extrapolation in Born-Oppenheimer molecular dynamics, Journal of Chemical Physics, 144, 244103 (2016).
23.    Xingyu Gao, Jun Fang and Han Wang*, Sampling the isothermal-isobaric ensemble by Langevin dynamics, Journal of Chemical Physics 144, 124113 (2016).
24.    宋海峰*, 高兴誉, 邵建立, 王帅创. 材料大规模计算的需求与挑战, 中国计算机学会通讯, 2014, 10(1): 26-31.
25.    Jun Fang, Xingyu Gao, Aihui Zhou*. A symmetry-based decomposition approach to eigenvalue problems, Journal of Scientific Computing, 2013, 57: 638-669.
26.    Jun Fang, Xingyu Gao*, Aihui Zhou. A Kohn-Sham equation solver based on hexahedral finite elements, Journal of Computational Physics, 2012, 231: 3166-3180.
27.    Li-Tao Zhang, Tong-Xiang Gu*, Global Modulus-Based Synchronous Multisplitting Multi-Parameters TOR Methods for Linear Complementarity Problems, Mathematical and Computational Applications, 22(20): 1-11, 2017.
28.    Xian-Yu Zuo, Li-Tao Zhang, Tong-Xiang Gu, Feng-Bin Zheng, Ning Li, A parallel version of GPBi-CG method suitable for distributed parallel computing, Comp. Appl. Math., 35:579–593, 2016.
29.    Xian-yu Zuo, Ze-yao Mo, Tong-xiang Gu, Xiao-wen Xu, Ai-qing Zhang, Multi-core parallel robust structured multifrontal factorization method for large discretized PDEs, Journal of Computational and Applied Mathematics, 296: 36-46, 2016.
30.    Tongxiang Gu, Liu Xinggping, Zeyao Mo, Xiaowen Xu, Shengxin Zhu, On the memory wall and performance of symmetric sparse matrix multiplications in different data structures on shared memeory machines, IEEE UIC-ATC-ScalCom-CBDCom-IoP2015, 2015 IEEE 15th International Conference on Scalable Computing and Communication, pp1439-1444, 2015.
31.    Li-tao Zhang, Tong-Xiang Gu, Xing-Ping Liu, Overlapping restricted additive Schwarz method with damping factor for H-matrix linear complementarity problem, Applied Mathematics and Computation, Vol. 271: 1-10, 2015.
33.    Li-Tao Zhang , Xiao-Na Dong, Tong-Xiang Gu, Xian-Yu Zuo, Xing-Ping Liu, An improved generalized conjugate residual squared (IGCRS2) algorithm suitable for distributed parallel computing, Japan Journal of Industrial and Applied Mathematics, 32(1): 143-155, 2015.
34.    Li-Tao Zhang, Yu-Xia Zhang, Tong-Xiang Gu, Xing-Ping Liu, Liu-Wei Zhang, New convergence of modulus-based synchronous block multisplitting multi-parameter methods for linear complementarity problems, Computational and Applied Mathematics, 2015, 5 First online.
35.    Cong Zheng, Shuo Gu, Tong-Xiang Gu*, Bing Yang, Xing-Ping Liu, BiELL: A bisection ELLPACK-based storage format for optimizing SpMV on GPUs, Journal of Parallel and Distributed Computing, 74: 2639–2647, 2014
36.    Sheng-Xin Zhu, Tong-xiang Gu, Xing-Ping Liu, Minimizing synchronizations in sparse iterative solvers for distributed supercomputers, Computers and Mathematics with Applications, 67(1): 199-209, 2014
37.    刘旭, 莫则尧, 安恒斌,等. 一种基于实测的自动负载建模算法[J]. 计算机科学, 2015, 42(1):63-66.
38.    左风丽, 刘旭, 张宝印,等. 基于JASMIN三维势场快速多极子算法的并行实现[J]. 计算物理, 2013, 30(1):140-147.
39.    刘旭, 张爱清, 肖丽,等. 面向结构网格并行应用的一类快速通信算法[J]. 计算物理, 2012, 29(1):58-64.
40.    刘旭, 莫则尧, 曹小林. 基于内存约束的一维负载平衡方法及其应用[J]. 计算物理, 2009, 26(2):184-190.
41.    刘旭, 莫则尧. 多层次图排序算法及其在图剖分中的应用[J]. 数值计算与计算机应用, 2008, 29(3):226-240.
42.    Huawei Wang, Li Xiao, Zhiwei Ai, Yi Cao. A Visualization Pipeline for Computable Geometric Model Data, Proceedings of International Conference on CGVCVIP 2017, pp. 147-154, Lisbon, Portugal, July 2017.
43.    Huawei Wang, Li Xiao, Yi Cao, Zhiwei Ai, Pingjun Xu. Visibility-Culling-Based Geometric Rendering of Large-Scale Particle Data. Proceedings of 2016 International Conference on Virtual Reality and Visualization, pp. 197-203, IEEE CPS, Hangzhou, China, Sept. 2016.
44.    Huawei Wang, Zhiwei Ai, Yi Cao, Li Xiao. A parallel preintegration volume rendering algorithm based on adaptive sampling. Journal of Visualization, 19(3): 437-446, Springer, Aug. 2016.
45.    Huawei Wang, Zhiwei Ai, Yi Cao. Information-Entropy Based Load Balancing in Parallel Adaptive Volume Rendering, Proceedings of International Conference on CGVCVIP 2015, pp. 163-169, Las Palmas, Spain, July 2015.
46.    Huawei Wang, Yi Cao, Li Xiao, Guoqing Wu. A Parallel Adaptive Volume Rendering Algorithm Based on Information Entropy. Proc. of ICVRV ’2013, pp. 127-131, IEEE Computer Society, Xi’an, China, 2013.
47.    Huawei Wang, Li Xiao, Yi Cao. A Parallel Adaptive Volume Rendering Algorithm with Static Load Balancing, Proc. of CGVCVIP Conference ’2012, pp. 137-141, Lisbon, Portugal, July 2012.
48.    Weiyin Ma and Huawei Wang. Interpolating an Arbitrary Number of Joint B-Spline Curves by Loop Surfaces, Computers and Graphics, 36(5): 321-328, 2012.
49.    Huawei Wang, Li Xiao, Yi Cao. An Adaptive Sampling Based Parallel Volume Rendering Algorithm. Proc. of ICVRV ’2011, pp. 158-163, IEEE Computer Society, Beijing, China, 2011.
50.    Huawei Wang and Weiyin Ma. Biorthogonal wavelets based on interpolatory subdivision, Computer Graphics Forum, Vol. 28, No. 6, pp. 1572-1585, Sept. 2009.
51.    Huawei Wang and Kai Tang. Biorthogonal Wavelet Construction for Hybrid Quad/Triangle Meshes, The Visual Computer, 25(4): 349-366, 2009.
52.    Ran Xu, Bin Liu*, Yuan Dong, 2013, Scalable hierarchical parallel algorithm for the solution of super large-scale sparse linear equations. Journal of Applied Mechanic, 80(2): 020901-8.
53.    Ran Xu, Bin Liu*, 2014, A hybrid molecular dynamics atomic-scale finite element method for quasi-static atomistic simulations at finite temperature. Journal of Applied Mechanics, 81(2): 051005-7.
54.    Ran Xu, Yu Wang, Bin Liu*, Daining Fang, 2013, Mechanics Interpretation on the Bending Stiffness and Wrinkled Pattern of Graphene. Journal of Applied Mechanics, 80(4): 040910-5.
55.    Ran Xu, Bin Liu*, Xiaoqiao He, Dechang Li, 2012, Kinetic Energy-Based Temperature Computation in Non-Equilibrium Molecular Dynamics Simulation. Journal of Computational and Theoretical Nanoscience, 9(2012): 428-433.
56.    Ran Xu, Bin Liu*, 2009, Investigation on the applicability of various stress definitions in atomistic simulation. Acta Mechanica Solida Sinica 22(6): 644-649.
57.    Yihui Zhang, Ran Xu, Bin Liu, Daining Fang, An electromechanical atomic-scale finite element method for simulating evolutions of ferroelectric nanodomains. 2012, Journal of the Mechanics and Physics of Solids, 60(2012): 1383-1399.
58.    Xuefeng Liu, Chun’guang You. Explicit bound for quadratic Lagrange interpolation constant on triangular finite elements, Applied Mathematics and Computation, https://doi.org/10.1016/j.amc.2017.08.020, 2017.
59.    Yu Li, Xiaole Han, Hehu Xie, Chunguang You. Local and Parallel Finite Element Algorithm Based On Multilevel Discretization for Eigenvalue Problem, International Journal of Numerical Analysis & Modeling, 13(1): 73-89, 2016.
60.    MO ZeYao, ZHANG AiQing, LIU QingKai, CAO XiaoLin. Research on the components and practices for domain-specific parallel programming models for numerical simulation, Scientia Sinica Informationis, 45(3), 2015.
61.    莫则尧, 张爱清, 刘青凯, 曹小林. 数值模拟领域并行编程模型的要素与实例研究, 中国科学:信息科学, 2015(3):385-397, 2015.
62.    Z Mo, A Zhang, Z Yang. A new parallel algorithm for vertex priorities of data flow acyclic digraphs, Journal of Supercomputing, 68(1):49-64, 2014.
63.    张爱清, 莫则尧, 杨章. 数据驱动并行计算的3层软件架构设计及应用, 计算机研究与发展, 51(11):2538-2546, 2014.
64.    张爱清, 莫则尧, 曹小林, 安恒斌,郭红. JASMIN框架中联邦并行计算及其在多物理耦合中的应用, 计算机工程与科学, 35(1):15-23, 2013.
65.    MO Zeyao, A Zhang, X Cao, Q Liu, XU Xiaowen. JASMIN: a parallel software infrastructure for scientific computing, Front. Comput. Sci. China, 4(4):480-488, 2010.