科学计算 HPC 高性能计算 GPU服务器并行集群计算存储高校计算仿真大数据 AI人工智能深度学习 KingHPC服务器工作站 AMD EPYC

首页
方案中心
产品中心
成功案例
- 成功案例
新闻资讯
- 行业内外
- 技术前沿
技术支持
- 服务条款
- 保修政策
关于金石

当前位置：
首页
/
方案中心
/
编译调优

简介

Program compilation 学科软件安装，环境调优，软件编译，BIOS/系统优化

CentOS替代之路：Rocky Linux 9.1 安装简易教程

CentOS替代之路：Rocky Linux 9.1 安装简易教程

CentOS 7将于2024年6月30日停止支持，目前很多服务器还在用CentOS 7，后期继续使用会有一定的安全风险，是时候启动CentOS替代计划了。目前主流的替代方案主要有：Ubuntu、Rocky Linux和AlmaLinux，其中Rocky Linux、AlmaLinux都是RHEL的二进制兼容版本，而Ubuntu小编平常用于开发环境，服务器上用得较少。Rocky Linux和AlmaLinux本质上说差不多，至于为什么首选了Rocky Linux，大概是因为这个项目...

查看详情

EDEN: macromolecular Xray holographic electron density recons.

EDEN: macromolecular Xray holographic electron density recons.

背景：eden是来自ucsc的一款从pdb文件获取电子密度图的插件，插件功能介绍可以访问他们官网。在帮客户编译eden时，我们发现eden的安装文档简单而且有错误，因此在此我们提供下正确的编译过程。官网：http://scottlab.ucsc.edu/eden/index.html使用：http://scottlab.ucsc.edu/eden/eden_quickstart.html文档：http://scottlab.ucsc.edu/eden/EdenUserManual.pdf环境：centos7.9，python2.7(eden图形界面), fftw2，gsl编译：安...

查看详情

EPYC-7742平台上vasp+intel2017编译勘误与更新

EPYC-7742平台上vasp+intel2017编译勘误与更新

前言：之前文章关于EPYC7742+intel2017+vasp，提到在make.include中加入-xHost以使其支持avx2指令集，现更正为-xcore-avx2，以得到稳定高性能的avx2编译支持。同时在makefile中加入-heap-arrays 64以解决vasp计算时stack size不足的报错（下篇文章介绍）。下图为vasp.5.4.4的make.include。具体编译过程参见公众号之前文章。计算效率：作为对比，我们与庚子计算（学术之友公众号）公布的计算效率进行对比。相同计算文...

查看详情

cp2k-9.1(ssmp)+ubuntu18.04+gcc7.5+mkl-2022

cp2k-9.1(ssmp)+ubuntu18.04+gcc7.5+mkl-2022

背景：多数同学在入门计算时，无法获得个人的linux服务器，或者没有独立的linux系统作为入门学习。WSL (windows sub linux)系统基于更为底层的虚拟化，其计算性能优于虚拟机，略弱于纯linux物理机。是作为计算入门的可选系统。这里，我们探究了cp2k-9.1在ubuntu18.4(wsl)的安装过程，如果是ubuntu物理机编译方法也是适用的。备注：以前的文章说wsl无法识别双路cpu，结论是不严谨的，应该是wsl不能准确识别amd新架构的双路...

查看详情

ovito+python+PTM 相分数统计

ovito+python+PTM 相分数统计

背景：ovito图形界面下PTM使用简单，但是如果我们希望统计成千上万个轨迹文件的相分数，我们建议使用ovito提供的python接口进行计算并输出。python代码：#导入python模块from ovito.io import import_filefrom ovito.modifiers import PolyhedralTemplateMatchingModifierfrom ovito.data import DislocationNetworkimport time#读入lammps的轨迹文件，导入pipeline(ovito计算流), *通配符代表步长，从零开...

查看详情

LINUX内核网络性能优化

LINUX内核网络性能优化

1. 前言本文将简单介绍Linux内核网络协议栈的流程，并总结常见的网络优化技术，使用尽量多的图片帮助理解原理，感谢阅读。2. Linux网络协议栈数据包在内核中使用sk_buff结构体来传递。网络套接字是用sock结构体来定义的，该结构体在各网络协议结构体的开头部分存放，例如tcp_sock。网络协议使用proto结构体挂载到网络套接字结构体上，例如tcp_prot、udp_prot等，该结构体中定义了一系列该网络协议需要的回调函数，包括connect、s...

查看详情

PBS/Torque + intel oneapi 跨节点并行问题

PBS/Torque + intel oneapi 跨节点并行问题

最近给客户调试机器遇到的问题，正好看到hpc群里有人提出同样问题，那么今天就在此阐述下该问题的原因及解决办法。问题描述：shell直接指定多节点节点运行mpirun -np -machinefile ***计算任务正常。但是使用PBS/Torque提交同样的计算任务时，出现如下报错。另外在使用以前的parallel studio环境时提交计算也正常，这种错误只发生在oneapi上。原因：如上图最后一行所述，"pbs的bootstrap（引导程序）无法成功在远...

查看详情

Ansys workbench 通过RSM远程提交Slurm作业

Ansys workbench 通过RSM远程提交Slurm作业

Ansys Remote Solve Manager（RSM）提供了配置和监视作业提交到HPC资源的核心框架。即：通过本地workbench直接提交作业到服务器slurm/pbs/lsf队列进行求解。搭建步骤：1. linux服务器端ansys workbench安装安装：下载ansys 2020 R2版本及以上安装包；安装；获取license （可参考https://www.bilibili.com/read/cv6398258）启动服务器端的RSM服务：root执行/opt/ansys2020/v202/RSM/Config/tools/linux/i...

查看详情

lammps中eam势在Xeon Platinum 8171M/RTX3060/RTX3080Ti计算速度对比

lammps中eam势在Xeon Platinum 8171M/RTX3060/RTX3080Ti计算速度对比

1. 硬件：8171m*2；RTX3060-12G；RTX3080Ti-12G2. 测试内容：lammps，eam势，hcp-Ti（原子数：54000/128000/432000/1024000）, fix npt驰豫3. 环境oneAPI-2022.0.1, cuda-11.64. 测试结果PS：横坐标为核数，双路8171m共52核；纵坐标为每秒计算的步数，数值越大越快。5. 总结不论原子数的多少，GPU加速的最佳核数都是8-16核。在每一步的计算过程中原子的坐标和力数据都在CPU和GPU之...

查看详情

AMD EPYC-7742（ZEN2）计算性能调优

AMD EPYC-7742（ZEN2）计算性能调优

前言：ZEN2架构下EPYC-7742处理器，具有256M L3级缓存，8内存通道、支持DDR4-3200MHz内存，支持PICE4.0, 支持avx2指令集。在科学计算领域具有很强的计算性能。其计算性能已超越intel铂金8280。本文将逐步阐述centos7下针对7742的优化处理及VASP的编译举例：S1: 升级linux内核使其更好地支持7742uname -r #查看内核版本，若内核版本低于4.0则需要进行内核升级rpm --imp...

查看详情

共1页10条记录

方案中心

单机超算
并行集群
数据存储
编译调优
运维培训
会议会务

产品中心

通用机架服务器
HPC计算服务器
数据储存服务器
GPU / AI服务器
刀锋节点服务器
国产信创服务器

成功案例

成功案例

新闻资讯

行业内外
技术前沿

技术支持

服务条款
保修政策

关于金石

金石简介
联系我们
合作伙伴
工作机会

微信公众号

微信公众号

Copyright ©2020 金石计算机 All Rights Reserved 备案号：粤ICP备2020110476 网址：www.kinghpc.cn 地址：深圳市龙华区智慧云谷C栋310、315室

15010805977 15010876190