GCPのGPUでTensorflowを動かす
自分でGPUを買うお金はないのでGCPでサクッと機械学習をしたいなと思ったが、Linuxを初めて触ったのでかなり手こずった。備忘録として残す。
この記事の対象者: 初心者
VMインスタンスの作成
無料枠だとA2シリーズは許可がもらえず、N1シリーズでもV100は作れなかったのでNVIDIA Tesla P4を選択した。初めてGPUを使うときは割り当てを増やす申請をしなくてはならないが結構すぐに許可をくれる。
ブートディスクはLinux18.04の50GBにした。この辺は用途に合わせて上手に設定する。
これでVMインスタンスの作成は完了。数分すると起動するようになる。
CLIの設定
このページを参考にCLIでいじれるようにする。ブラウザでもアクセスできるが、なかなか繋がりづらい時があって不便だったのでなるべくCLIを使おうと思った。
「リモート アクセス」のドロップダウンで「gcloud コマンドを表示」を押してコピペすれば一瞬でアクセスできる。
GPU周りの設定
こちらの記事を参考にしてGPU周りの設定をしていく。
うまく設定できていれば
こんな風になると思う。
Docker周りの設定
ここを参考に設定していく。
まずはdockerイメージのダウンロード。sudo docker pull tensorflow/tensorflow:latest-gpu
続いて起動。
sudo docker run --gpus all -it --rm tensorflow/tensorflow:latest-gpu
Google DriveをCLIから使えるようにする
Google Driveだと爆速でファイルの管理ができる。
qiita.com
こちらを参考に設定。ただ、私の環境のせいか、curlコマンドがうまく動いてくれなかったのでブラウザでダウンロードしてからdockerイメージ内に送った。
sudo docker cp gdrive-linux-x64 <コンテナID>:/home/gdrive
あとは参考ページ通り。