【NNabla】Neural Network Librariesと学習済みモデルによる推論 -HDF5ファイル編-

こんにちは。

ディープラーニングお兄さんの”はやぶさ”@Cpp_Learningです。

前回、Sony製の深層学習フレームワーク “Neural Network Libraries（NNabla）” のPython APIを使って学習から推論までを実践するチュートリアル記事を書きました↓

Neural Network LibrariesによるDeep Learningチュートリアル

【NNabla】実践！Neural Network Librariesで学習から推論まで直観的にニューラルネットワークの実装ができるソニー製の深層学習フレームワーク”NNL”によるDeep Learning（ディープラーニング）入門チュートリアルを書きました。学習から推論まで行うPython APIを使ったソースコードも公開しています。勉強にお役立て下さい。...

↑記事の終盤で学習済みモデル”MyChain.h5”を保存しました。

今回は、この学習済みモデル”MyChain.h5”を使って推論を実践していきます。

Contents

1 学習済みモデルとは
- 1.1 ニューラルネットワークの保存形式 -構造と重み-
- 1.2 Neural Network Libraries（NNabla）と学習済みモデル
2 【実践】学習済みモデル(HDF5ファイル)による推論
3 学習済みモデル保存
4 はやぶさの技術ノート
5 まとめ
6 おまけ -組み込み深層学習-

学習済みモデルとは

深層学習の一連の流れを簡単に説明すると大体こんな感じです↓

【深層学習フロー】

データ収集
ニューラルネットワークの構造（アーキテクチャ）設計
学習によりニューラルネットワークの重み（パラメータ）を調整
学習済みのニューラルネットワークを使って推論

言葉の定義は書籍などにより異なりますが、”学習済みニューラルネットワーク”のことを”学習済みモデル”と呼ぶことが多いです。

深層学習では、”重み”の自動調整のことを”学習”と呼ぶ
“学習済みニューラルネットワーク”＝”学習済みモデル”と考えて良い

ニューラルネットワークの保存形式 -構造と重み-

深層学習フレームワークで実装したニューラルネットワークは以下の形式で保存します。

ファイル	内容
HDF5ファイル	ニューラルネットワークの構造（アーキテクチャ）
JSON / YAMLファイル	ニューラルネットワークの重み（パラメータ）
HDF5ファイル	ニューラルネットワークの構造と重み

ファイルについては使用するフレームワークに依存するため、あくまで一例ですが…

ここでは言いたいのは、ニューラルネットワークが構造/重み/構造と重みの3パターンで保存されるという点です。

チームメンバーが以下の言葉をどういう意図で使っているのかに注意しましょう

ニューラルネットワーク
モデル
学習済みニューラルネットワーク
学習済みモデル

Neural Network Libraries（NNabla）と学習済みモデル

“Neural Network Libraries”の場合、ニューラルネットワークは以下の形式で保存します。

ファイル	内容
net.nntxt	ニューラルネットワークの構造（アーキテクチャ）
parameters.h5	ニューラルネットワークの重み（パラメータ）
net_param.nnp	ニューラルネットワークの構造と重み

学習により自動調整されるのは”重み”なので、「学習済みモデル」または「学習済みニューラルネットワーク」といえば「学習済みの”重み”」または「構造と学習済みの”重み”」を保存したものと考えて問題ありません。

↑の記事で保存した学習済みモデルは”MyChain.h5”でした。

つまり、”重み”の情報のみが保存してあり、その重みを格納するニューラルネットワークの構造については「.nntx」を使うか、再度ソースコード上で定義する必要があります。

何を言っているのかよく分からない…

という人も、ソースコード見ればスッキリ理解できるかもしれないので、以降からはソースコードを交えて説明します。

【実践】学習済みモデル(HDF5ファイル)による推論

NNableのPython APIと学習済みモデル(HDF5ファイル)を使って推論を行います。

import

nnablaの各モジュールをimportします。推論では最適化アルゴリズム（Solvers）を使いません。

import nnabla as nn
import nnabla.functions as F
import nnabla.parametric_functions as PF
# import nnabla.solvers as S

import nnabla as nn

import nnabla.functions as F

import nnabla.parametric_functions as PF

# import nnabla.solvers as S

その他、今回使用する数値演算モジュールなどもimportします。

import numpy as np
import matplotlib.pyplot as plt

1 2	import numpy as np import matplotlib.pyplot as plt

NNabla用の変数定義

NNablaで学習および推論を行うために専用の変数を定義します。

batch_size = 1
x = nn.Variable((batch_size, 1))

1 2	batch_size = 1 x = nn.Variable((batch_size, 1))

ニューラルネットワーク設計

繰り返しますが、学習済みモデル”MyChain.h5”には”重み”の情報のみ保存してあります。

つまり、ニューラルネットワークの構造（アーキテクチャ）の情報は保存していないので、改めて”重み”を格納するためのニューラルネットワークを定義する必要があります。

def MyChain(x):    
    h1 = F.relu(PF.affine(x, 50, name = "l1"))
    h2 = F.relu(PF.affine(h1, 100, name = "l2"))
    y = PF.affine(h2, 1, name = "l3")
    return y

def MyChain(x):

h1 = F.relu(PF.affine(x, 50, name = "l1"))

h2 = F.relu(PF.affine(h1, 100, name = "l2"))

y = PF.affine(h2, 1, name = "l3")

return y

前回設計した”独自ニューラルネットワーク”を関数化しておいたので、関数”MyChain(x)”をコピペするだけでOKです。

繰り返し実装するコードは関数化しておくと移植性が向上するのでオススメ！

学習済みモデル（重み）を読込む

学習済みモデル”MyChain.h5”をロードします（”重み”を読込みます）。

nn.load_parameters("MyChain.h5")

1	nn.load_parameters("MyChain.h5")

たった1行で学習済みモデル（HDF5ファイル）の読込みができました。

推論から推論結果のグラフ化まで

以降からは、前回書いた「NNablaによる学習から推論まで」の記事で説明した推論フェーズのコードをコピペすればOKです。

# モデルの宣言
y = MyChain(x)

# 推論したいデータ(学習で使用していない未知のデータ)
xe = np.array([[0.5], [1.8], [2.3], [3.3], [4.5], [5.4], [6.3], [6.7], [7.4], [8.2]])

# 推論1(未知のデータ)
y_list = []
for i in xe:
    x.d = i
    y.forward()
    y_list.append(y.d.copy())

# 推論2(学習で使用したデータ)
yt_list = []
xt_list = []
for i in range(10):
    x.d = i
    y.forward()
    yt_list.append(y.d.copy())
    xt_list.append(i)

# 推論結果のグラフ描画
yt = np.reshape(y_list, [10, 1])   
yt_list = np.reshape(yt_list, [10, 1])
plt.plot(xt_list, yt_list)
plt.plot(xe, yt, "ro")
plt.title("comparison")
plt.xlabel("input")
plt.ylabel("output")
plt.grid(True)
plt.show()

# モデルの宣言

y = MyChain(x)

# 推論したいデータ(学習で使用していない未知のデータ)

xe = np.array([[0.5], [1.8], [2.3], [3.3], [4.5], [5.4], [6.3], [6.7], [7.4], [8.2]])

# 推論1(未知のデータ)

y_list = []

for i in xe:

x.d = i

y.forward()

y_list.append(y.d.copy())

# 推論2(学習で使用したデータ)

yt_list = []

xt_list = []

for i in range(10):

x.d = i

y.forward()

yt_list.append(y.d.copy())

xt_list.append(i)

# 推論結果のグラフ描画

yt = np.reshape(y_list, [10, 1])

yt_list = np.reshape(yt_list, [10, 1])

plt.plot(xt_list, yt_list)

plt.plot(xe, yt, "ro")

plt.title("comparison")

plt.xlabel("input")

plt.ylabel("output")

plt.grid(True)

plt.show()

NNablaと学習済みモデルで推論 青線が学習で使用したデータ（x=0~9の整数）の推論結果、赤プロットが未知のデータ（x=0～9の少数）に対する推論結果です。

前回「NNablaによる学習から推論まで」の記事で描いた推論結果のグラフと比較してみます。

赤プロットの推論結果は完全に一致しています。つまり、前回と同じ学習済みモデルで推論できた！ということです。

(こちらの青線は推論結果ではなく実験データなので、僅かに不一致ですね)

学習済みモデル保存

学習済みモデル”MyChain.h5”は”重み”のみを保存していました。

ファイル	内容
net.nntxt	ニューラルネットワークの構造（アーキテクチャ）
parameters.h5	ニューラルネットワークの重み（パラメータ）
MyChain.nnp	ニューラルネットワークの構造と重み

今回は、ニューラルネットワークの構造と重みを”MyChain.nnp”で保存します。

import nnabla.utils.save

# Save NNP file (used in C++ inference later.).
contents = {
    'networks': [
        {'name': 'MyChain',
         'batch_size': batch_size,
         'outputs': {'y': y},
         'names': {'x': x}}],
    'executors': [
        {'name': 'runtime',
         'network': 'MyChain',
         'data': ['x'],
         'output': ['y']}]}
nnabla.utils.save.save('MyChain.nnp', contents)