Dockerコンテナを起動してJupyterLabにアクセス

解説

NVIDIA社から、Jetsonに最適化されたDockerコンテナがいくつか提供されています。

NVIDIA社から提供されているDockerコンテナを実行してJupyterLabにアクセスする方法をまとめます。

NGC Catalog

NVIDIA社からは、AI/HPCに関するDockerコンテナが多数提供されています。
どのようなDockerコンテナが提供されているかは、「NGC Catalog」(※1)で確認できます。

※1 : NGP : NVIDIA GPU Cloud。GPU を搭載したオンプレミス、クラウド、エッジシステムで、AI、機械学習、HPC（ハイパフォーマンスコンピューティング）の開発をするためのサービスやソフトウェアやサポートを提供するポータルサイトです。

機械学習開発用のコンテナ

「NGC Catalog」にて提供されているDockerコンテナの中から、Jetsonに最適化された機械学習開発用のコンテナ「L4T ML」を実行することとします。

提供元ページは以下です。
NVIDIA L4T ML | NVIDIA NGC

※L4T : Linux for Tegra の略です。Jetson Linuxのことです。Jetson Linuxは、以前は、Linux for Tegraという名称でした。Tegraとは、NVIDIA社のSoCシリーズの名前です。Jetsonシリーズは、NVIDIAのTegraを搭載しています。
※ML : Machine learningの略です。機械学習のことです。

コンテナ「L4T ML」には、以下のソフトウェアが含まれています。（詳しくは、提供元ページ参照）

TensorFlow
PyTorch
torchvision
torchaudio
onnx
CuPy
numpy
numba
PyCUDA
OpenCV (with CUDA)
pandas
scipy
scikit-learn
JupyterLab

コンテナ起動コマンド

機械学習用のコンテナ「L4T ML」の起動コマンドは、提供元ページに記載があり、以下です。

sudo docker run -it --rm --runtime nvidia --network host nvcr.io/nvidia/l4t-ml:<tag>

コマンドオプション解説

-it: インタラクティブモードで実行します
--rm: コンテナを終了したらコンテナを削除します。（コンテナを終了してもコンテナを削除したくない場合は、このオプションは外します）
--runtime nvidia: l4t-base コンテナの実行中に NVIDIA コンテナランタイムを使用します。
--network host: コンテナが Jetson ホストのネットワークとポートを使用できるようにします。

コンテナタグの確認

コンテナ起動コマンドの「<tag>」については、実行する Jetson Orin Nano の環境に合わせたコンテナタグを指定する必要があります。

まず、「OSバージョンの確認」等を参考に、Jetson Linux とJetPackのバージョンを確認します。
この Jetson Orin Nano の、Jetson Linux のバージョンは、 35.3.1 で、JetPackのバージョンは、 5.1.1 でした。

続いて、環境に合わせたコンテナタグを、提供元ページ「NVIDIA L4T ML | NVIDIA NGC」から確認します。
2023年5月14日現在、Jetson Linux のバージョン 35.3.1 、JetPackのバージョン 5.1.1 の場合のコンテナタグは存在しないため、Jetson Linux のバージョン 35.2.1 、JetPackのバージョン 5.1 の場合のコンテナタグ「r35.2.1-py3」を使用します。

ホストのディレクトリをコンテナにマウント

「--rm」オプションにより「コンテナを終了したらコンテナが削除」されます。コンテナが削除されるということはコンテナのファイルシステムが削除されるということで、コンテナ起動中に行なったファイル操作は次回のコンテナ起動時に引き継がれません。
コンテナ起動中に行なったファイル操作が次回のコンテナ起動時にも引き継がれるように、「ホストのディレクトリを、コンテナにマウント」するようにします。「ホストのディレクトリ」内のファイルは、コンテナが削除されても、削除されません。

マウントするホストのディレクトリを用意します。
以下のコマンドを実行し、ディレクトリを作成します。今回はユーザーのホームディレクトリ下に「work」というフォルダを用意することとしました。

mkdir ~/work

ホストのディレクトリをコンテナにマウントしてコンテナを起動するコマンドの書式は以下です。

sudo docker run --volume [マウントするホストのディレクトリの絶対パス]:[コンテナ内のマウント先の絶対パス] [イメージ名]

コンテナ起動スクリプトファイルの作成

コンテナの実行コマンドは文字数が多いので、何度も実行する際にタイピングするのが少し面倒です。短い文字数のタイピングで実行できるようにスクリプトファイル化します。

スクリプトファイルを編集する際のテキストエディタとして nano (nano – Text editor)　を使用することとします。
nanoをインストールしていない場合は、以下のコマンドを実行し、nanoをインストールします。

sudo apt install nano -y

以下のコマンドを実行し、スクリプトファイルを新規作成し、nanoで開きます。今回は「docker_ml_run.sh」というスクリプトファイルを作成することとしました。

nano docker_ml_run.sh

スクリプトファイルの内容を以下のようにします。「r35.2.1-py3」はコンテナタグであり、上記で確認した「実行する Jetson Orin Nano の環境に合わせたコンテナタグ」にします。ホストの「work」ディレクトリをコンテナの「/work」ディレクトリとしてマウントするオプションも記述します。

sudo docker run -it \ --rm \ --runtime nvidia \ --network host \ --volume ${HOME}/work:/work \ nvcr.io/nvidia/l4t-ml:r35.2.1-py3

「ctrl + o」を押下し、ファイルを上書き保存します。
「ctrl + x」を押下し、ファイルを閉じます。

以下のコマンドを実行し、スクリプトファイルに実行権限を付与します。

chmod +x docker_ml_run.sh

コンテナの起動

以下のコマンドを実行し、「L4T ML」コンテナを起動します。

./docker_ml_run.sh

初回のコンテナ起動は、コンテナイメージのダウンロードと解凍が行われるため、時間を要します。
２回目以降のコンテナ起動は、ほとんど時間を要しません。

コンテナが起動すると、Terminalでの表示が「root@ホスト名:/#」に変わり、コンテナ上での作業になります。

初回のコンテナ起動時のTerminal画面（コンテナイメージのダウンロードと解凍の結果としての「XXXX: Pull complete」が多数表示されています。）

２回目以降のコンテナ起動時のTerminal画面（コンテナイメージのダウンロードや解凍は行なわれず、「XXXX: Pull complete」はありません。）

Jupyterにアクセス

「L4T ML」コンテナを起動すると、以下のようなメッセージが表示され、JupyterLabサーバーも起動します。（IPアドレス部は、実行する Jetson Orin Nano の環境によって異なります）

allow 10 sec for JupyterLab to start @ http://XXX.XXX.XXX.XXX:8888 (password nvidia)

Jetson Orin Nano のデスクトップの「Chromium ウェブ・ブラウザ」アプリ、もしくは、同一ネットワーク上のPCのブラウザアプリ（ChromeやEdge）から、
http://[Jetson Orin Nano のIPアドレス]:8888
もしくは
http://[Jetson Orin Nano のホスト名]:8888
にアクセスします。

同一ネットワーク上のPCのChromeから「http://[Jetson Orin Nano のホスト名]:8888」にアクセスした際の画面

「JupyterLab」のログイン画面が表示されます。

ログインパスワードは、「nvidia」です。入力し、「Log in」ボタンをクリックします。

JupiterLabにログインできました。

ファイル操作は、ホストのディレクトリをマウントした「/work」ディレクトリ内で行なうようにします。「/work」ディレクトリ以外でのファイル操作は、次回コンテナ起動時に引き継がれません。

コンテナの終了

コンテナを終了するには、起動したコンテナ上にいるTerminalで「exit」と入力します。