ubuntu服务器常用指令

查看gpu使用情况

nvidia-smi

可以得到GPU占用情况和主要使用GPU的进程,如下图

在这里插入图片描述

可以看到进程1722405在跑训练
执行以下命令

ps -f -p 1722405

或者执行以下命令

ps u 1722405 

得到结果如下

在这里插入图片描述
其中
UID 表示用户ID
PID 表示进程号
PPID 表示父进程号
TIME 表示执行时间
CMD 表示执行命令

应用screen命令在后台运行程序,训练模型

1.首先确定系统是否安装了screen
在终端输入以下命令,如果不报错则已经安装

which screen

2.创建screen窗口
输入以下命令创建一个screen窗口,其中test1是这个窗口的名字,可以自定义(注意S是大写)

screen -S test1

3.输入执行命令,进行训练

python Train.py

4.断网后恢复
只要你的云端服务器不关机,断网后或是自己主动关闭连接后你的模型都会继续训练。再次连上时可以通过以下命令查看运行情况。默认打开的是第一个窗口,可以通过screen -r test1打开指定窗口

screen -r


Ctrl+D  # 在当前screen下,输入Ctrl+D,删除该screen
Ctrl+A,Ctrl+D  # 在当前screen下,输入先后Ctrl+A,Ctrl+D,退出该screen

5.删除
如果要删除则输入以下命令,其中test1是你前面自己命名的窗口名

screen -s test1 -X quit

6.其他
可以通过一下命令来查看当前的各个窗口信息

screen -ls

结果如图所示,2712686这类数字的后面就是你的窗口名
在这里插入图片描述

根据进程号杀死进程

kill -9 PID