ベイズファクターを用いた仮説検定~相関の検定~

今回は、ベイズファクターを使った相関の検定について理論を整理します。 ベイズファクターとはなんぞや?という方はこちらを参照のこと。

参考文献は こちら です。

相関係数について おさらい

確率変数XYはそれぞれ平均μXμY、標準偏差σXσYをパラメータにもつ確率分布に従うとします。

このとき、確率変数XYの相関係数ρは下記のとおり定義されます。

(1)ρ=Cov(XY)Var(X)Var(Y)=E(XY)μXμYσXσY

(1)式より、相関係数ρXYに対する線形変換の影響を受けないことが確認できます。

この性質により、平均値の差の検定線形回帰のときとは異なり、モデル設計においてρを他の平均・分散・共分散等のパラメータから独立させるための再パラメータ化の必要が無いことが、今回のトピックのひとつの特徴です。

相関を考慮した2変量発生過程のモデル化

では、相関を考慮して2変数の発生過程をモデル化します。

◆相関を考慮した2変量発生過程モデル

確率変数Xn=(X1,,Xn)Yn=(Y1,,Yn)について、XiYi(i=1,2,,n)の同時確率分布が独立同分布の2変量正規分布であると仮定する。

(2)p(Xn,Yn)=i=1nNormal(Xi,Yi|μ,Σ)

ここで、μ=(μX,μY)TΣ=(σX2ρσXσYρσXσYσY2)である。

ここでは参考文献どおりに2変数の正規性を仮定したモデルのみを取り上げますが、ガンマ分布等他の分布でも同様に相関係数を組み込んだ2変量化で対応できそうですネ。誰かやってみてください。

事前分布

周辺尤度、ベイズファクターはモデルの事前分布の影響を強く受けるので、例によって理想的な性質をもつ事前分布の取り方を紹介します。

ここで紹介する事前分布は、Predictive matching(予測的整合性)、つまり、検定したいパラメータを計算することができないサンプルサイズのときに、ベイズファクターが1になること、及び、Information consistency(情報の一貫性)、つまり、検定したいパラメータが計算される最小サイズnmin以上で極端な値が得られた状況で、ベイズファクターが0またはのうち正しい値に振れること、これらを条件として設定されたものになります。

κのとりかたによっては、上記の理想的な性質をみたさなくなってしまいます。例えば、κ=1の場合、n=3で平面的に直線状に位置するデータが得られたときのベイズファクターは2となり、2つめの条件であるInformation consistencyを満たさなくなってしまいます。

◆Jeffreysの理論に則った相関パラメータの事前分布

Jeffreysの理論に従い、相関パラメータρの事前分布π(ρ)を、伸長した対称ベータ分布(stretched symmetric beta function)とする。

(3)π(ρ|κ)=2κ2κB(1κ,1κ)(1ρ2)1κκ

ここで、κ2以上の値をとるとき、理想的な性質をもつ事前分布となる。

伸長した対称ベータ分布の導出 (第1種)ベータ分布の確率密度は下記である。 f(x|α,β)=xα1(1x)β1B(α,β) ベータ分布に従う確率変数Xについて考える。 Xk次の積率μX,kは、 μX,k=E[Xk]=01xα1(1x)β1B(α,β)xkdx=01xα+k1(1x)β1B(α,β)dx=01xα1(1x)β1B(αk,β)dx    (α+k1=α1)=i=1k(αi)i=1k(α+βi)01xα1(1x)β1B(α,β)dx=i=1k(α+ki)i=1k(α+β+ki)(α=α+k)
memo

定理B(α+1,β)=αα+βB(α,β)より、 B(αk,β)=i=1k(α+βi)i=1k(αi)B(α,β)

よって、Xの平均μX、分散σXはそれぞれ μX=μX,1=E[X]=αα+β σX=μX,2=E[(XμX)2]=μX,2μX2=αβ(α+β)2(α+β+1) だから、ベータ分布の歪度γX,1は、 γX,1=αX,3=E[(XμXσX)3]=μX,33μXμX,2+2μX3σX3=()=2(βα)α+β+1(α+β+2)αβ よって、α=βのとき歪度0となるため、Xの分布は左右対称(対称ベータ分布)となる。 またα=β=1κの対称ベータ分布を台[1,1]に変換しなおした拡張分布への変換には、下記定理を用いる。
確率変数の変換公式

確率密度fXの確率変数Xに一対一の写像ϕX=ϕ(Y)と対応付けされる確率変数Yの確率密度gYは、

gY(y)=fX(ϕ(y))||Jϕ||

ここで、|Jϕ|はヤコビアンであり||Jϕ||はヤコビアンの絶対値である。

|Jϕ|=dxdy

いま、α=β=1κをパラメータにもつ対称ベータ分布に従う確率変数Xについて、ϕ:X=Y+12とすると、 |Jϕ|=dxdy=12 だから、 gY(y)=12B(1κ,1κ)(y+12)1κ1(1y+12)1κ1=2κ2κB(1κ,1κ)(1y2)1κκ ここで、確率変数Yの定義域は1y1であり、相関係数の定義域と一致する。よって上式においてyρに置き換えてやれば(3)式となる。

その他のパラメータμXμYσXσYは比較するモデルに共通して存在するパラメータなので、それらの事前分布の設定がρに対する周辺尤度の値にほとんど影響しませんが、平均値の差の検定のときと同様に、Jeffreysの事前分布を設定します。

◆平均パラメータ、分散パラメータの事前分布

平均パラメータμXμY、分散パラメータσX2σY2の事前分布π(μX)π(μY)π(σX2)π(σY2)はJeffreysの事前分布を適用する。

(4)π(μX)1

(5)π(μY)1

(6)π(σX2)1σX2

(7)π(σY2)1σY2

まとめ

本記事では以下の内容について整理しました。

  • 相関係数のおさらいと性質の確認

  • 相関係数を考慮した2変量のモデル化

  • 相関パラメータの事前分布は拡張対称ベータ分布

実践編はこちらです。複数の方法を使ってベイズファクターを実際に計算してみたいと思います。

コメントを書く


※ コメントは承認されると表示されます

承認されたコメント一覧