首页
方案中心
单机超算
并行集群
数据存储
编译调优
运维培训
会议会务
产品中心
通用机架服务器
HPC计算服务器
数据储存服务器
GPU / AI服务器
刀锋节点服务器
国产信创服务器
成功案例
成功案例
新闻资讯
行业内外
技术前沿
技术支持
服务条款
保修政策
关于金石
金石简介
联系我们
合作伙伴
工作机会
当前位置:
首页
/
方案中心
/
编译调优
简介
Program compilation 学科软件安装,环境调优,软件编译,BIOS/系统优化
CentOS替代之路:Rocky Linux 9.1 安装简易教程
CentOS 7将于2024年6月30日停止支持,目前很多服务器还在用CentOS 7,后期继续使用会有一定的安全风险,是时候启动CentOS替代计划了。目前主流的替代方案主要有:Ubuntu、Rocky Linux和AlmaLinux,其中Rocky Linux、AlmaLinux都是RHEL的二进制兼容版本,而Ubuntu小编平常用于开发环境,服务器上用得较少。Rocky Linux和AlmaLinux本质上说差不多,至于为什么首选了Rocky Linux,大概是因为这个项目...
查看详情
EDEN: macromolecular Xray holographic electron density recons.
背景:eden是来自ucsc的一款从pdb文件获取电子密度图的插件,插件功能介绍可以访问他们官网。在帮客户编译eden时,我们发现eden的安装文档简单而且有错误,因此在此我们提供下正确的编译过程。官网:http://scottlab.ucsc.edu/eden/index.html使用:http://scottlab.ucsc.edu/eden/eden_quickstart.html文档:http://scottlab.ucsc.edu/eden/EdenUserManual.pdf环境:centos7.9,python2.7(eden图形界面), fftw2,gsl编译:安...
查看详情
EPYC-7742平台上vasp+intel2017编译勘误与更新
前言:之前文章关于EPYC7742+intel2017+vasp,提到在make.include中加入-xHost以使其支持avx2指令集,现更正为-xcore-avx2,以得到稳定高性能的avx2编译支持。同时在makefile中加入-heap-arrays 64以解决vasp计算时stack size不足的报错(下篇文章介绍)。下图为vasp.5.4.4的make.include。具体编译过程参见公众号之前文章。计算效率:作为对比,我们与庚子计算(学术之友公众号)公布的计算效率进行对比。相同计算文...
查看详情
cp2k-9.1(ssmp)+ubuntu18.04+gcc7.5+mkl-2022
背景:多数同学在入门计算时,无法获得个人的linux服务器,或者没有独立的linux系统作为入门学习。WSL (windows sub linux)系统基于更为底层的虚拟化,其计算性能优于虚拟机,略弱于纯linux物理机。是作为计算入门的可选系统。这里,我们探究了cp2k-9.1在ubuntu18.4(wsl)的安装过程,如果是ubuntu物理机编译方法也是适用的。备注:以前的文章说wsl无法识别双路cpu,结论是不严谨的,应该是wsl不能准确识别amd新架构的双路...
查看详情
ovito+python+PTM 相分数统计
背景:ovito图形界面下PTM使用简单,但是如果我们希望统计成千上万个轨迹文件的相分数,我们建议使用ovito提供的python接口进行计算并输出。python代码:#导入python模块from ovito.io import import_filefrom ovito.modifiers import PolyhedralTemplateMatchingModifierfrom ovito.data import DislocationNetworkimport time#读入lammps的轨迹文件,导入pipeline(ovito计算流), *通配符代表步长,从零开...
查看详情
LINUX内核网络性能优化
1. 前言本文将简单介绍Linux内核网络协议栈的流程,并总结常见的网络优化技术,使用尽量多的图片帮助理解原理,感谢阅读。2. Linux网络协议栈数据包在内核中使用sk_buff结构体来传递。网络套接字是用sock结构体来定义的,该结构体在各网络协议结构体的开头部分存放,例如tcp_sock。网络协议使用proto结构体挂载到网络套接字结构体上,例如tcp_prot、udp_prot等,该结构体中定义了一系列该网络协议需要的回调函数,包括connect、s...
查看详情
PBS/Torque + intel oneapi 跨节点并行问题
最近给客户调试机器遇到的问题,正好看到hpc群里有人提出同样问题,那么今天就在此阐述下该问题的原因及解决办法。问题描述:shell直接指定多节点节点运行mpirun -np ** -machinefile *****计算任务正常。但是使用PBS/Torque提交同样的计算任务时,出现如下报错。另外在使用以前的parallel studio环境时提交计算也正常,这种错误只发生在oneapi上。原因:如上图最后一行所述,"pbs的bootstrap(引导程序)无法成功在远...
查看详情
Ansys workbench 通过RSM远程提交Slurm作业
Ansys Remote Solve Manager(RSM)提供了配置和监视作业提交到HPC资源的核心框架。即:通过本地workbench直接提交作业到服务器slurm/pbs/lsf队列进行求解。搭建步骤:1. linux服务器端ansys workbench安装安装:下载ansys 2020 R2版本及以上安装包;安装;获取license (可参考https://www.bilibili.com/read/cv6398258)启动服务器端的RSM服务:root执行/opt/ansys2020/v202/RSM/Config/tools/linux/i...
查看详情
lammps中eam势在Xeon Platinum 8171M/RTX3060/RTX3080Ti计算速度对比
1. 硬件:8171m*2;RTX3060-12G;RTX3080Ti-12G2. 测试内容:lammps,eam势,hcp-Ti(原子数:54000/128000/432000/1024000), fix npt驰豫3. 环境oneAPI-2022.0.1, cuda-11.64. 测试结果PS:横坐标为核数,双路8171m共52核;纵坐标为每秒计算的步数,数值越大越快。5. 总结不论原子数的多少,GPU加速的最佳核数都是8-16核。在每一步的计算过程中原子的坐标和力数据都在CPU和GPU之...
查看详情
AMD EPYC-7742(ZEN2)计算性能调优
前言:ZEN2架构下EPYC-7742处理器,具有256M L3级缓存,8内存通道、支持DDR4-3200MHz内存,支持PICE4.0, 支持avx2指令集。在科学计算领域具有很强的计算性能。其计算性能已超越intel铂金8280。本文将逐步阐述centos7下针对7742的优化处理及VASP的编译举例:S1: 升级linux内核使其更好地支持7742uname -r #查看内核版本,若内核版本低于4.0则需要进行内核升级rpm --imp...
查看详情
共
1
页
10
条记录
15010805977
15010876190