読んでください

GCPのGPUでTensorflowを動かす

自分でGPUを買うお金はないのでGCPでサクッと機械学習をしたいなと思ったが、Linuxを初めて触ったのでかなり手こずった。備忘録として残す。

 

この記事の対象者: 初心者

VMインスタンスの作成

無料枠だとA2シリーズは許可がもらえず、N1シリーズでもV100は作れなかったのでNVIDIA Tesla P4を選択した。初めてGPUを使うときは割り当てを増やす申請をしなくてはならないが結構すぐに許可をくれる。

ブートディスクはLinux18.04の50GBにした。この辺は用途に合わせて上手に設定する。

 


f:id:manato1fg:20210915232244p:plain

VMインスタンスの設定画面

これでVMインスタンスの作成は完了。数分すると起動するようになる。

 

CLIの設定

cloud.google.com

このページを参考にCLIでいじれるようにする。ブラウザでもアクセスできるが、なかなか繋がりづらい時があって不便だったのでなるべくCLIを使おうと思った。

 

「リモート アクセス」のドロップダウンで「gcloud コマンドを表示」を押してコピペすれば一瞬でアクセスできる。

 

GPU周りの設定

qiita.com

こちらの記事を参考にしてGPU周りの設定をしていく。

うまく設定できていれば


f:id:manato1fg:20210915233329p:plain

結果

こんな風になると思う。

 

Docker周りの設定

www.tensorflow.org

ここを参考に設定していく。

まずはdockerイメージのダウンロード。

sudo docker pull tensorflow/tensorflow:latest-gpu

続いて起動。

sudo docker run --gpus all -it --rm tensorflow/tensorflow:latest-gpu

Google DriveCLIから使えるようにする

Google Driveだと爆速でファイルの管理ができる。
qiita.com
こちらを参考に設定。ただ、私の環境のせいか、curlコマンドがうまく動いてくれなかったのでブラウザでダウンロードしてからdockerイメージ内に送った。

sudo docker cp gdrive-linux-x64 <コンテナID>:/home/gdrive

あとは参考ページ通り。

まとめ

こんな感じでセットアップできる。
なお、デフォルトではvimが入っていないので

apt-get install vim

をして、インストール。
また、GCPを閉じて自分は他のことをしたいときはtmuxを使う。