用新建集群模式如何使用GPU提交任务

一、 提交流程

  1. 登录 Fastone 平台控制台;

  2. 数据管理上传计算文件;

  3. 在首页,点击【提交作业】-点击【NAMD】应用-选择任务模式-选择机器配置,进行启用机器;

  4. 上传计算文件,设置资源参数;

二、单机模式

Step 1:首页选择【提交作业】,如图:

Step 2:配置集群登录节点资源配置,点击【开始计算】。

  • 选择slurm头节点的服务器,操作系统选择Ubuntu18.04镜像,点击【开始计算】

Step 3. 初始化环境

  • 初始化环境采用conda进行GPU运行环境的管理,需要新建namd3运行环境及下载cudatoolkit运行环境
  • 初始化之前,请先联系速石工作人员开通外网访问功能

3.1 使用module加载cuda

  • 使用【SSH】连接至SSH命令行界面。

在命令行界面输入以下命令,加载conda模块,如图:

# 加载conda模块
module load fastone/modulefiles/modulefiles/miniconda3/py39/23.1.0
# 查看conda版本,出现版本信息证明加载模块成功
conda --version

1
2
3
4
5

3.2 使用conda创建namd3运行环境

  • namd运行环境,只需要配置一次。
# 创建namd3运行环境
conda create -n namd3 python=3.9
#初始化conda配置
 conda init bash  && source ~/.bashrc
1
2
3
4

3.3 安装cudatoolkit

  • 配置好cuda环境和conda环境后,就可以使用GPU来做加速运算了,需要提前开通外网。
# 激活namd3
conda activate namd3
#安装cudatoolkit
conda install cudatoolkit=11.8.0 -c   https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/linux-64/
conda install cudatoolkit-dev -c conda-forge

1
2
3
4
5
6

Step 4:运行demo实例

  • 下载demo实例apoa1.tar.gz,并上传
    • apoa1.tar.gz
    • 选择【数据管理】中的【文件管理】,点击【上传】,选择【单/多文件上传】
  • 通过命令行解压压缩文件包
  • 加载conda,namd3运行文件,并提交slurm任务.
# 解压apoa1.tar.gz
tar xf apoa1.tar.gz
#跳转到apoa1目录
cd apoa1/
#加载conda环境
module load fastone/modulefiles/modulefiles/miniconda3/py39/23.1.0
#激活namd3环境
conda activate namd3
#加载namd环境
module load fastone/modulefiles/modulefiles/namd/3/0b4/gpu
#提交namd3任务
sbatch  -n 1 -p b1-g1-1  -c 10 --gpus=1 --wrap 'namd3 +p10 +devices   0 apoa1.namd'

1
2
3
4
5
6
7
8
9
10
11
12
13