ubuntu服务器常用指令
查看gpu使用情况
nvidia-smi
可以得到GPU占用情况和主要使用GPU的进程,如下图
可以看到进程1722405在跑训练
执行以下命令
ps -f -p 1722405
或者执行以下命令
ps u 1722405
得到结果如下
其中
UID 表示用户ID
PID 表示进程号
PPID 表示父进程号
TIME 表示执行时间
CMD 表示执行命令
应用screen命令在后台运行程序,训练模型
1.首先确定系统是否安装了screen
在终端输入以下命令,如果不报错则已经安装
which screen
2.创建screen窗口
输入以下命令创建一个screen窗口,其中test1是这个窗口的名字,可以自定义(注意S是大写)
screen -S test1
3.输入执行命令,进行训练
python Train.py
4.断网后恢复
只要你的云端服务器不关机,断网后或是自己主动关闭连接后你的模型都会继续训练。再次连上时可以通过以下命令查看运行情况。默认打开的是第一个窗口,可以通过screen -r test1打开指定窗口
screen -r
Ctrl+D # 在当前screen下,输入Ctrl+D,删除该screen
Ctrl+A,Ctrl+D # 在当前screen下,输入先后Ctrl+A,Ctrl+D,退出该screen
5.删除
如果要删除则输入以下命令,其中test1是你前面自己命名的窗口名
screen -s test1 -X quit
6.其他
可以通过一下命令来查看当前的各个窗口信息
screen -ls
结果如图所示,2712686这类数字的后面就是你的窗口名
根据进程号杀死进程
kill -9 PID