今回はベイジアン仮説検定とSavage-Dickey法について取り上げます。
ベイジアン仮説検定は、従来の頻度論に基づく考え型とは異なるベイズの考え方を用いた仮説検定です。一般的な仮説検定には無いメリットを持っており、近年注目されています。
Savage-Dickey法は、以前の記事で紹介したベイズファクターを簡単に求めるための手法の一つです。この手法が適用できる場面は、比較対象となる2つのモデルがネストされた関係にある場合(後述)に限られるのですが、これは多くの一般的な仮説検定の枠組みへ応用できる条件であることから、ベイジアン仮説検定のための重要な手法とされています。
参考記事を以下に列挙します。
- Bayesian hypothesis testing for psychologists: A tutorial on the Savage–Dickey method
- Using MCMC chain outputs to efficiently estimate Bayes factors
- ベイズファクターによる心理学的仮説・モデルの評価
ベイジアン仮説検定
ベイジアン仮説検定は、文字通りベイズの考え方を用いた仮説検定です。そしてこれは以前の記事で紹介したベイズファクターを用いた検定になります。
周辺分布
ところで、従来の仮説検定では帰無仮説と対立仮設を設定することから始まりますが、ベイズファクターを用いた仮説検定では帰無仮説と対立仮設の設定はどうすればよいのかナ?
帰無仮説と対立仮説
ここで仮説検定の手順について整理します。
帰無仮説には、例えば平均値の差の検定の場合、2組の母集団における量の平均
このように、二つの仮説に共通するパラメータ(平均値の差の検定の例ではパラメータの個数1で
ベイズファクターを用いてこのような2つの仮説の比較を行う場合を、以下のように整理することができます。
また、このように
以下では帰無仮説と対立仮説の一般的な記法
ベイズファクターの特長
上のようにベイズファクターを用いて帰無仮説と対立仮説の比較をするメリットを列挙していきます。
・基本的な量である
以前の記事で見たように、ベイズファクターは自由エネルギーや周辺尤度から計算される、モデルの説明力の指標となる基本的な量です。この指標を用いて簡潔に仮説の比較を行うことが可能となります。
またこの特徴から(周辺尤度がcoherenceな量であるため)、以下のように3モデル以上の比較も可能です。
・モデル同士の平等な比較を行う
ベイズファクターは2つのモデルの周辺尤度の比であることから、2つの仮説を対等に比較することができます。これはつまり、帰無仮説に対応するモデルを支持する根拠も、それに反する根拠もまったく同じように得られるということであり、帰無仮説を支持するという結論を導くことも可能である、ということです。
これに対し、従来の仮説検定では帰無仮説が正と仮定したうえでの背理法に基づく対立仮説の採択しかできない為、結論は、「帰無仮説を棄却し、対立仮説を採択する」もしくは「帰無仮説を棄却できないが採択もしない」の2択となります。このような仮説の非対称性は、頻度論に基づく仮説検定に対する批判の1つとなっています。
・結果が解釈しやすい
ベイズファクターによる仮説検定で得られる結果は「
・逐次更新が可能
従来の仮説検定は、事前にサンプリング計画を設定し、予定した数のデータが蓄積して初めて実施する必要があります。検定の結果、仮に有意な結果が得られず、さらにデータを追加して再度検定を実施しようとすると、第1種の過誤を犯す確率が本来の確率よりも大きくなってしまいます。 これに対し、ベイズ統計は事前データから事後データへの更新が理論的に可能ですので、ベイズファクターについて定めた閾値に達するまでデータを逐一追加していき、閾値に達した時点でデータの収集をストップすることが問題なく可能となります。
・複数のモデルの組み合わせに利用できる
ベイズファクターを2つのモデルの重みづけ係数として利用し、回帰係数を算出することも可能です。
・オッカムの剃刀効果をもつ
つまり、同程度の説明力をもつモデルがあるとすれば、ベイズファクターはよりシンプルなモデルを選択する、ということです。この性質は以前の記事での実験で確認したものになります。
この理由は、周辺分布
ベイズファクターの課題
ベイズファクターを用いたモデル比較には課題もあります。以下、課題を列挙します。
・着目するパラメータの事前分布の設定の影響を受けやすい
これは、周辺分布
これに対する解決策として、客観ベイズの研究により導かれた既定事前分布を用いる、というものがあります。既定事前分布は、研究者の間で合意のとれた、典型的な応用場面で汎用的に用いることのできる事前分布です。これについてはまた別の記事取り上げたいです…。
・計算が困難な場合が多い
ベイズファクターは、定義に従うならば以下のように計算しなければなりません。
ここで、
以前の記事での実験では、事前分布に尤度関数と共役な関係にある共役事前分布を用いたため、上記の計算が可能だったのですが、多くの場面でこの計算は解析的には困難です。
これに対する解決策として、以降ではSavage-Dickey法について説明していきます。
Savage-Dickey法
Savage-Dickey法の概要を以下に示します。
Savage-Dickey法の利点は、
また、仮説検定の対象となるパラメータ
上記証明において仮定した
上記証明では両モデルに共通するパラメータを、我々の関心対象である
おわりに
前回に引き続き、今回もベイズファクターにまつわる内容を書きました。
前回の記事では、ベイズファクターについて一からその正体を見ていきました。今回はその続編的な内容で、ベイズファクターが仮説検定に利用可能であること、また仮説検定にベイズファクターを用いることの利点や課題、さらに簡便なベイズファクターの計算手法であるSavage-Dickey法について書きました。
これでベイジアン仮説検定を実践するための準備が整ったので、次回以降では実際にベイジアン仮説検定をやっていきたいと思います。
