今回は、ベイズファクターを使った相関の検定について理論を整理します。 ベイズファクターとはなんぞや?という方はこちらを参照のこと。
参考文献は こちら です。
相関係数について おさらい
確率変数$X$、$Y$はそれぞれ平均$\mu_X$、$\mu_Y$、標準偏差$\sigma_X$、$\sigma_Y$をパラメータにもつ確率分布に従うとします。
このとき、確率変数$X$、$Y$の相関係数$\rho$は下記のとおり定義されます。
$$ \rho = \cfrac{\mathrm{Cov}\left( XY \right)}{\sqrt{\mathrm{Var}\left(X\right)}\sqrt{\mathrm{Var}\left(Y\right)}} = \cfrac{\mathrm{E}\left(XY\right) - \mu_X \mu_Y}{\sigma_X \sigma_Y} \tag{1} $$
$(1)$式より、相関係数$\rho$は$X$、$Y$に対する線形変換の影響を受けないことが確認できます。
この性質により、平均値の差の検定や線形回帰のときとは異なり、モデル設計において$\rho$を他の平均・分散・共分散等のパラメータから独立させるための再パラメータ化の必要が無いことが、今回のトピックのひとつの特徴です。
相関を考慮した2変量発生過程のモデル化
では、相関を考慮して2変数の発生過程をモデル化します。
ここでは参考文献どおりに2変数の正規性を仮定したモデルのみを取り上げますが、ガンマ分布等他の分布でも同様に相関係数を組み込んだ2変量化で対応できそうですネ。誰かやってみてください。
事前分布
周辺尤度、ベイズファクターはモデルの事前分布の影響を強く受けるので、例によって理想的な性質をもつ事前分布の取り方を紹介します。
ここで紹介する事前分布は、Predictive matching(予測的整合性)、つまり、検定したいパラメータを計算することができないサンプルサイズのときに、ベイズファクターが1になること、及び、Information consistency(情報の一貫性)、つまり、検定したいパラメータが計算される最小サイズ$n_{min}$以上で極端な値が得られた状況で、ベイズファクターが0または$\infty$のうち正しい値に振れること、これらを条件として設定されたものになります。
$\kappa$のとりかたによっては、上記の理想的な性質をみたさなくなってしまいます。例えば、$\kappa = 1$の場合、$n=3$で平面的に直線状に位置するデータが得られたときのベイズファクターは$2$となり、2つめの条件であるInformation consistencyを満たさなくなってしまいます。
その他のパラメータ$\mu_X$、$\mu_Y$、$\sigma_X$、$\sigma_Y$は比較するモデルに共通して存在するパラメータなので、それらの事前分布の設定が$\rho$に対する周辺尤度の値にほとんど影響しませんが、平均値の差の検定のときと同様に、Jeffreysの事前分布を設定します。
平均パラメータ$\mu_X$、$\mu_Y$、分散パラメータ$\sigma_X^2$、$\sigma_Y^2$の事前分布$\pi(\mu_X)$、$\pi(\mu_Y)$、$\pi(\sigma_X^2)$、$\pi(\sigma_Y^2)$はJeffreysの事前分布を適用する。
$$ \pi(\mu_X) \propto 1 \tag{4} $$
$$ \pi(\mu_Y) \propto 1 \tag{5} $$
$$ \pi(\sigma_X^2) \propto \cfrac{1}{\sigma_X^2} \tag{6} $$
$$ \pi(\sigma_Y^2) \propto \cfrac{1}{\sigma_Y^2} \tag{7} $$
まとめ
本記事では以下の内容について整理しました。
-
相関係数のおさらいと性質の確認
-
相関係数を考慮した2変量のモデル化
-
相関パラメータの事前分布は拡張対称ベータ分布
実践編はこちらです。複数の方法を使ってベイズファクターを実際に計算してみたいと思います。