用新建集群模式如何使用GPU提交任务
一、 提交流程
登录 Fastone 平台控制台;
数据管理上传计算文件;
在首页,点击【提交作业】-点击【NAMD】应用-选择任务模式-选择机器配置,进行启用机器;
上传计算文件,设置资源参数;
二、单机模式
Step 1:首页选择【提交作业】,如图:
Step 2:配置集群登录节点资源配置,点击【开始计算】。
- 选择slurm头节点的服务器,操作系统选择Ubuntu18.04镜像,点击【开始计算】
Step 3. 初始化环境
- 初始化环境采用conda进行GPU运行环境的管理,需要新建namd3运行环境及下载cudatoolkit运行环境
- 初始化之前,请先联系速石工作人员开通外网访问功能
3.1 使用module加载cuda
- 使用【SSH】连接至SSH命令行界面。
在命令行界面输入以下命令,加载conda模块,如图:
# 加载conda模块
module load fastone/modulefiles/modulefiles/miniconda3/py39/23.1.0
# 查看conda版本,出现版本信息证明加载模块成功
conda --version
1
2
3
4
5
2
3
4
5
3.2 使用conda创建namd3运行环境
- namd运行环境,只需要配置一次。
# 创建namd3运行环境
conda create -n namd3 python=3.9
#初始化conda配置
conda init bash && source ~/.bashrc
1
2
3
4
2
3
4
3.3 安装cudatoolkit
- 配置好cuda环境和conda环境后,就可以使用GPU来做加速运算了,需要提前开通外网。
# 激活namd3
conda activate namd3
#安装cudatoolkit
conda install cudatoolkit=11.8.0 -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/linux-64/
conda install cudatoolkit-dev -c conda-forge
1
2
3
4
5
6
2
3
4
5
6
Step 4:运行demo实例
- 下载demo实例apoa1.tar.gz,并上传
- apoa1.tar.gz
- 选择【数据管理】中的【文件管理】,点击【上传】,选择【单/多文件上传】
- 通过命令行解压压缩文件包
- 加载conda,namd3运行文件,并提交slurm任务.
# 解压apoa1.tar.gz
tar xf apoa1.tar.gz
#跳转到apoa1目录
cd apoa1/
#加载conda环境
module load fastone/modulefiles/modulefiles/miniconda3/py39/23.1.0
#激活namd3环境
conda activate namd3
#加载namd环境
module load fastone/modulefiles/modulefiles/namd/3/0b4/gpu
#提交namd3任务
sbatch -n 1 -p b1-g1-1 -c 10 --gpus=1 --wrap 'namd3 +p10 +devices 0 apoa1.namd'
1
2
3
4
5
6
7
8
9
10
11
12
13
2
3
4
5
6
7
8
9
10
11
12
13