前言:之前文章关于EPYC7742+intel2017+vasp,提到在make.include中加入-xHost以使其支持avx2指令集,现更正为-xcore-avx2,以得到稳定高性能的avx2编译支持。同时在makefile中加入-heap-arrays 64以解决vasp计算时stack size不足的报错(下篇文章介绍)。下图为vasp.5.4.4的make.include。具体编译过程参见公众号之前文章。
计算效率:作为对比,我们与庚子计算(学术之友公众号)公布的计算效率进行对比。相同计算文件、计算条件下,庚子计算用时35秒。按照公众号提供的编译方法,计算耗时28秒。具体过程请各位下载庚子计算测试文件,并在自己服务器上测试。如遇问题欢迎提问。庚子计算关于amd EPYC 7742计算效率文章请见https://mp.weixin.qq.com/s/WOEP0CB-ZOGPDpcwrPe9nw
注1:关于之前文章“AMD EPYC-7742(ZEN2)计算性能调优”提到的export I_MPI_PIN_DOMAIN=numa加速命令,改加速命令对于lammps与vasp是通用的。但是具体加速效果,需进行测试后确定。部分情况下该命令可能降低计算速度。
注2:intel MKL2020版本后,已不支持export MKL_DEBUG_CPU_TYPE=5命令来强制开机avx2的支持。目前建议zen2架构下使用intel 15-18。关于MKL2020以后版本如何使用MKL将在后期测试中公布。