この記事について
情報量基準などのモデル選択基準について得た断片的な知識をまとめたい。自分の力では一生断片的な知識としかならないだろうが、ブログに残しておくことで少しでも自分の中で体系化できたらいな。
随時更新予定?
情報量基準は、候補モデルが将来得られるデータをどの程度精度よく予測できるかを評価したもの。
1. カルバック・ライブラー情報量基準
1.1. 定義
1.2. 性質
KL情報量基準は以下のような性質を持つ。これらの性質は2つのデータ生成分布の差としてイメージしやすいと思う。
- 非負性
- 完備性
カルバック・ライブラー情報量基準は予測モデル
2. AIC(赤池情報量基準)
2.1. 平均対数尤度
カルバック・ライブラー情報量基準は以下の通り対数尤度の期待値の差としても表現できる。
特に母数が所与のもとでは、 $$
第2項は対数尤度
情報量の算出理由が候補モデル間の比較である場合、第1項は共通であるから、第2項の平均対数尤度のみで比較すればよいことが分かる。
しかしこれも真のデータ生成分布が未知の場合は評価不能。そこで、将来得られるデータに対する予測の良さの観点から平均対数尤度を比較するため、平均対数尤度について確率変数
これを期待平均対数尤度とよぶ。
2.2. AICの定義・導出
AIC(赤池情報量基準)は前節の期待平均対数尤度を近似することから導出されるものである。
以下で定義される最大対数尤度
を用いて、期待平均対数尤度を
と近似する。さらに母数の数についてバイアス補正し、
AICの値が小さい程よいモデルであるとみなす。
2.3. AICの適用制限
AICは、以下の条件が満たされる場合のみに適用可能。らしい。
となる母数が存在する- 尤度関数(事後分布)が正規分布で近似可能
そのため、多くのベイジアンモデルでは、事後分布が正規分布で近似できないため、AICを用いることが出来ない。代わりに交差検証法やWAICを用いる。
3. 交差検証法
3.1. 交差検証法
モデル評価のもう一つの方法に交差検証法がある。交差検証法も将来得られるデータ
の推定量を検証する。
3.2. LOOCV(1個抜き交差検証法)
LOOCV(1個抜き交差検証法)では、テストデータとして
3.3. MCMC標本を用いたLOOCVの推定
まずは一般の交差検証法について、MCMC標本を用いた推定方法を考える。
を評価できる。これは1組のトレーニングデータ・テストデータを用いてテストデータ
これをMCMC標本を用いて近似する場合には、
とすればよい。ここで
LOOCVのときも同様にして、
を
あとはすべての
4. WAIC
WAIC(Widely Applicable Information Criterion)は、2010年に東京工業大学の渡辺先生が考案した情報量基準。
LOOCVと同様に、将来得られるデータに対する平均対数尤度(
まず、将来得られる1つのデータ
これを
ただし、
以上を踏まえ、また式の形をAICに合わせることで、WAICは下記の通り定義される。
WAICは、事後分布が正規分布で近似できないような多くのベイジアンモデルにおいても適用可能な情報量基準量である。