本記事では確率論の勉強ということで、期待値など確率変数の特徴を表す量について定義し、それらにまつわる便利なアイテム(関数)群を整理しようと思います。
本記事の内容をマスターすれば、確率分布の各特徴を表す量について明るくなったり、確率分布が関係する計算に少し強くなったりできます。
本記事の構成は以下の通りです。
期待値と積率
期待値
まず、確率変数$X$の期待値について定義します。 以下、慣例に従い確率変数は大文字(例:$X$)、確率変数からの実現値は同じアルファベットの小文字(例:$x$)で、$A$という事象が起こる確率を$P(A)$で表します。
感覚的には$(1)$式$(2)$式ともに$X$がとりうる値についてその値をとる確率で重みづけしたものが期待値になります。通常の平均と同じ考えかたですね。
積率
積率(moment)は、期待値にまつわる重要な概念です。
上の定義だけでは積率をわざわざ定義する意味が分からないと思いますが、のちのち紹介するように分散や歪度、尖度の計算に2次、3次、4次の積率が利用されます。
試しにガンマ分布の積率を導出し、ガンマ分布に従う確率変数の期待値を求めてみましょう。
ガンマ分布の確率密度は下記式で与えられる。ここで、$x ∈ \mathbb{R}^+, \alpha∈ \mathbb{R}^+, \beta ∈ \mathbb{R}^+$である。 $$ \mathrm{Gamma}(x | \alpha, \beta) = \cfrac{\beta^{\alpha}}{\Gamma(\alpha)}x^{\alpha -1} e^{-\beta x} $$ $\Gamma(z)$はガンマ関数といい、下記で定義される。 $$ \Gamma (z)= \int_0^{\infty}t^{z-1}e^{-t}dt ~~~ (z > 0) $$
分散と中心積率
分散
次に確率変数の分散について定義します。
確率変数の平均も分散も、通常のデータに対する平均と分散と同じ考え方で定義されています。
中心積率
積率に関連した概念として、中心積率について定義します。
このように、確率変数の分散は中心積率を用いて計算することができます。
試しに、ガンマ分布の分散を求めてみましょう。
さらに、分散の非負平方根は標準偏差と呼びます。
標準化積率と歪度・尖度
標準化積率
平均$\mu_X$、標準偏差$\sigma_X$である確率変数$X$に対する標準化は
$$ Z = \cfrac{X - \mu_X}{\sigma_X} \tag{8} $$
となりますが、これに関連して標準化積率が定義されます。
歪度と尖度
確率分布の形状を把握するための量に歪度と尖度があり、これらは上記の標準化積率を用いて定義されます。
歪度は確率分布の対称性・非対称性の指標となります。
歪度が$\gamma_{X,1} = 0$となるとき、その確率変数の確率分布は左右対称であるといえます。
一方、歪度$\gamma_{X,1}> 0$となるとき、$X$は平均以上の値をとることが多いことから、分布の形状は平均より正の方向に長い右歪分布となります。
逆に歪度$\gamma_{X,1}< 0$のとき、分布の形状は平均より負の方向に長い左歪分布となります。
尖度は確率分布の密集度を示します。尖度が大きいと、$\sigma_X$が小さくなるため、分布は中心付近に密集するとともに、$X - \mu_X$が大きくなるため、分布の裾が重い分布となります。
例として、ガンマ分布の歪度と尖度を求めてみましょう。
積率母関数
次に積率母関数を定義します。積率母関数は、積率を生成する関数であることからこのような名前がついています。
例として、積率母関数を使ってガンマ分布の平均と分散を求めてみましょう。
積率が簡単に求められない場合でも、積率母関数を使えば比較的簡単に積率を求められることがあります。
キュミュラント母関数
キュミュラント母関数も、積率や平均・分散・歪度・尖度の計算に使える便利な関数なのですが、核となる部分の証明に手も足も出なかったので、ちゃんと理解出来たらupしたいと思います。