参考文献は以下の通り。ベイズファクターを使って平均値の差の検定が英語なら文献が多い。
- Byesian hypothesis testing for psychologists: A tutorial on the Savage-Dickey method
- Using MCMC chain outputs to efficiently estimate Bayes factors
- Bayesian t tests for accepting and rejecting the null hypothesis
effect size の導入
ここでは、対応のある場合、対応のない場合に分けて検定の対象となるパラメータ
対応のある場合
同じ対象に対し、2つの異なる状態で観測された値をそれぞれ確率変数
まずは、簡単に確率変数
これでようやくスケールが単位あたりに調整されたeffect size
対応のない場合
グループ1、グループ2に所属する対象からの観測値をそれぞれ確率変数
まずは、
この場合もやはり同様に、2つの分布の平均値の差
とおいてやれば、ようやくスケールが単位あたりに調整されたeffect size
仮説の設定
以降では説明の簡略化のため、両側検定の場合の仮説を前提にします。
事前分布の設定
さて、ベイズの枠組みではすべての母数に事前分布を設定してやる必要があります。この事前分布の役割は、分析者が前もって知りうる情報を反映させるものである…と思っていませんか?
この考え方は主観ベイズ(subjective Bayes)と呼ばれており、間違ってはいません。しかし今回の目的は検定です。それもベイズファクターを用いた検定であり、事前分布の設定が検定結果に大きく左右されることからも、なるべく事前分布に主観を与えたくありません。このような態度を、客観ベイズ(objective Bayes)と呼び、ベイズファクターを用いた仮説検定の場合は客観ベイズの立場で事を考えることが重要になってきます(Rouder et al.(2009))。
古今東西、客観ベイズの分野(それもなぜか心理学研究分野)では、研究者の間で合意のとれた検定のための汎用性のある事前分布の設定方法が盛んに研究されてきました。平均値の差の検定のための汎用的な事前分布もいくつか開発されています。ここでは天下り的に、JZSの事前分布(JZS proir)と単位情報事前分布(unit information proir)について整理します。
コーシー分布は下記式で定義される。
JZSの事前分布と単位情報事前分布の唯一の違いはeffect size
標準正規分布と標準コーシー分布を比較した図が以下です。

図からも、標準コーシー分布は標準正規分布と比較し裾が重く、0から外れた値もとりやすい分布になっていることから、
また、両設定に共通のパラメータ
ちなみに、
ベイズファクターの解法
前節でモデルの設定を整理したので、本節ではベイズファクターの求め方を整理します。
解析的に求める
先に説明したJZSの事前分布と単位情報事前分布は解析的に計算することが可能です。ここでは導出や計算式までは深堀りしません。あまり面白くないので…。式を確認したい場合は参考文献を参照のこと。この文献の著者らはJZSの事前分布や単位情報事前分布の解析解を求めることができるWebページやRパッケージを開発しているので、実践編で解析解を求める際はこのあたりを活用させてもらいます。
MCMC法で近似的に求める
本記事と実践編の本題はこちらです。これにはネストされたモデル同士の比較で有効なSavage-Dickey法を使ってベイズファクターを計算します。Savage-Dickey法の概要を以下に示します。詳細は以前の記事を参照のこと。
事前分布
これが求めたいベイズファクターになります。
あとは
の事後分布の求め方
条件の無い周辺事後分布を使う
こちらは全パラメータの同時分布から
条件付き周辺事後分布を使う
こちらは
これでベイズファクターを使って平均値の差の検定をする準備が整いました。実践編は実践編で!
Appendix
Jaffrayの事前分布
この定義に沿って正規分布の平均・分散に対するJeffreysの事前分布を導出する。