本記事では確率論の勉強ということで、期待値など確率変数の特徴を表す量について定義し、それらにまつわる便利なアイテム（関数）群を整理しようと思います。
本記事の内容をマスターすれば、確率分布の各特徴を表す量について明るくなったり、確率分布が関係する計算に少し強くなったりできます。

本記事の構成は以下の通りです。

期待値と積率

期待値

まず、確率変数 $X$ の期待値について定義します。以下、慣例に従い確率変数は大文字（例： $X$ ）、確率変数からの実現値は同じアルファベットの小文字（例： $x$ ）で、 $A$ という事象が起こる確率を $P (A)$ で表します。

◆確率変数の期待値

離散型の確率変数 $X$ が確率質量関数 $p_{X} (x_{k})$ $(k = 1, 2, \dots)$ をもつとき、 $X$ の期待値は下記で定義される。

$\begin{matrix} (1) & E [X] = \sum_{k = 1}^{\infty} x_{k} P (X = x_{k}) = \sum_{k = 1}^{\infty} x_{k} p_{X} (x_{k}) \end{matrix}$ 連続型の確率変数 $X$ が確率密度関数 $f_{X} (x)$ をもつとき、 $X$ の期待値は下記で定義される。

$\begin{matrix} (2) & E [X] = \int_{- \infty}^{\infty} x f_{X} (x) d x \end{matrix}$

感覚的には $(1)$ 式 $(2)$ 式ともに $X$ がとりうる値についてその値をとる確率で重みづけしたものが期待値になります。通常の平均と同じ考えかたですね。

積率

積率（moment）は、期待値にまつわる重要な概念です。

◆積率 確率変数

X

及び自然数

k

について、

X^{k}

の期待値

\begin{matrix} (3) & μ_{X, k}^{^{'}} = E [X^{k}] \end{matrix}

を確率変数

X

の

k

次の積率（moment）という。特に

X

の1次の積率は平均(

E [X]

)である。

上の定義だけでは積率をわざわざ定義する意味が分からないと思いますが、のちのち紹介するように分散や歪度、尖度の計算に2次、3次、4次の積率が利用されます。

試しにガンマ分布の積率を導出し、ガンマ分布に従う確率変数の期待値を求めてみましょう。

memo

ガンマ分布の確率密度は下記式で与えられる。ここで、 $x \in R^{+}, α \in R^{+}, β \in R^{+}$ である。 $Gamma (x | α, β) = \frac{β^{α}}{Γ (α)} x^{α - 1} e^{- β x}$ $Γ (z)$ はガンマ関数といい、下記で定義される。 $Γ (z) = \int_{0}^{\infty} t^{z - 1} e^{- t} d t (z > 0)$

◆ガンマ分布の積率・期待値 ガンマ分布を確率密度にもつ確率変数

X

について、

\begin{aligned} μ_{X, k}^{^{'}} & = E [X^{k}] \\ = \int_{0}^{\infty} \frac{β^{α}}{Γ (α)} x^{α - 1} e^{- β x} x^{k} d x \\ = \frac{β^{α}}{Γ (α)} \int_{0}^{\infty} x^{α + k - 1} e^{- β x} d x \\ = \frac{β^{α}}{Γ (α)} \int_{0}^{\infty} {(\frac{y}{β})}^{k + α - 1} e^{- y} \frac{1}{β} d y (y = β x と お い た 置 換 積 分) \\ = \frac{β^{α}}{Γ (α)} \frac{1}{β^{k + α}} \int_{0}^{\infty} y^{k + α - 1} e^{- y} d y \\ = \frac{β^{α}}{Γ (α)} \frac{Γ (k + α)}{β^{k + α}} \\ = β^{- k} \prod_{i = 1}^{k - 1} (α + i - 1) (Γ (s + 1) = s Γ (s) を 利 用) \end{aligned}

よって、

μ_{X, 1}^{^{'}} = E (X) = \frac{α}{β}

分散と中心積率

分散

次に確率変数の分散について定義します。

◆分散 確率変数

X

の分散は下記で定義される。ここで

X

の平均を

μ_{X}

とする。

\begin{matrix} (4) & V [X] = E [(X - μ_{X})^{2}] \end{matrix}

確率変数の平均も分散も、通常のデータに対する平均と分散と同じ考え方で定義されています。

中心積率

積率に関連した概念として、中心積率について定義します。

◆中心積率 確率変数

X

とその平均

μ_{X}

及び自然数

k

について、

(X - μ_{X})^{k}

の期待値を確率変数

X

の

k

次の中心積率（central moment）といい、

μ_{X, k}

であらわす。特に2次の中心積率は分散である。

\begin{matrix} (5) & μ_{X, k} = E [(X - μ_{X})^{k}] \end{matrix}

\begin{matrix} (6) & μ_{X, 2} = E [(X - μ_{X})^{2}] = V [X] \end{matrix}

このように、確率変数の分散は中心積率を用いて計算することができます。

試しに、ガンマ分布の分散を求めてみましょう。

◆ガンマ分布の分散

(5)

式を変形して、

\begin{aligned} V [X] & = E [(X - μ_{X})^{2}] \\ = E [X^{2}] - 2 E [X] μ_{X} + μ_{X}^{2} \\ = μ_{X, 2}^{^{'}} - μ_{X, 1}^{^{'} 2} \end{aligned}

よって、ガンマ分布を確率密度に持つ確率変数

X

の分散は、

\begin{aligned} V [X] & = μ_{X, 2}^{^{'}} - μ_{X, 1}^{^{'} 2} \\ = β^{- 2} α (α + 1) - (β^{- 1} α)^{2} \\ = \frac{α}{β^{2}} \end{aligned}

さらに、分散の非負平方根は標準偏差と呼びます。

◆標準偏差 標準偏差

σ_{X}

は下記式で定義される。

\begin{matrix} (7) & σ_{X} = \sqrt{μ_{X, 2}} \end{matrix}

標準化積率と歪度・尖度

標準化積率

平均 $μ_{X}$ 、標準偏差 $σ_{X}$ である確率変数 $X$ に対する標準化は

$\begin{matrix} (8) & Z = \frac{X - μ_{X}}{σ_{X}} \end{matrix}$

となりますが、これに関連して標準化積率が定義されます。

◆標準化積率

平均 $μ_{X}$ 、標準偏差 $σ_{X}$ である確率変数 $X$ および自然数 $k$ に対して、 ${(\frac{X - μ_{X}}{σ_{X}})}^{k}$ の期待値を標準化積率と呼び、 $α_{X, k}$ であらわす。

$\begin{matrix} (9) & α_{X, k} = E [{(\frac{X - μ_{X}}{σ_{X}})}^{k}] \end{matrix}$

歪度と尖度

確率分布の形状を把握するための量に歪度と尖度があり、これらは上記の標準化積率を用いて定義されます。

◆歪度と尖度 3次の標準化積率を歪度とよび確率変数

X

の歪度を

γ_{X, 1}

とあらわす。

\begin{matrix} (10) & γ_{X, 1} = α_{X, 3} = E [{(\frac{X - μ_{X}}{σ_{X}})}^{3}] \end{matrix}

4次の標準化積率を歪度とよび確率変数

X

の尖度を

γ_{X, 2}

とあらわす。

\begin{matrix} (11) & γ_{X, 2} = α_{X, 4} = E [{(\frac{X - μ_{X}}{σ_{X}})}^{4}] \end{matrix}

歪度は確率分布の対称性・非対称性の指標となります。
歪度が $γ_{X, 1} = 0$ となるとき、その確率変数の確率分布は左右対称であるといえます。
一方、歪度 $γ_{X, 1} > 0$ となるとき、 $X$ は平均以上の値をとることが多いことから、分布の形状は平均より正の方向に長い右歪分布となります。
逆に歪度 $γ_{X, 1} < 0$ のとき、分布の形状は平均より負の方向に長い左歪分布となります。

尖度は確率分布の密集度を示します。尖度が大きいと、 $σ_{X}$ が小さくなるため、分布は中心付近に密集するとともに、 $X - μ_{X}$ が大きくなるため、分布の裾が重い分布となります。

例として、ガンマ分布の歪度と尖度を求めてみましょう。

◆ガンマ分布の歪度・尖度 ガンマ分布を確率密度にもつ確率変数

X

について、

\begin{aligned} γ_{X, 1} & = α_{X, 4} = E [{(\frac{X - μ_{X}}{σ_{X}})}^{4}] \\ = \frac{μ_{X, 3}^{^{'}} - 3 μ_{X, 2}^{^{'}} μ_{X, 1}^{^{'}} + 2 μ_{X, 1}^{^{'} 3}}{σ_{X}^{3}} \\ = (\frac{α (α + 1) (α + 2)}{β^{3}} - 3 \frac{α (α + 1)}{β^{2}} \frac{α}{β} + 2 \frac{α^{3}}{β^{3}}) \frac{β^{3}}{α \sqrt{α}} \\ = \frac{2}{\sqrt{α}} \end{aligned}

\begin{aligned} γ_{X, 2} & = α_{X, 4} = E [{(\frac{X - μ_{X}}{σ_{X}})}^{4}] \\ = \frac{μ_{X, 4}^{^{'}} - 4 μ_{X, 3}^{^{'}} μ_{X, 1}^{^{'}} + 6 μ_{X, 2}^{^{'}} μ_{X, 1}^{^{'} 2} - 3 μ_{X, 1}^{^{'} 4}}{σ_{X}^{4}} \\ = \frac{3 (α + 2)}{α} \end{aligned}

積率母関数

次に積率母関数を定義します。積率母関数は、積率を生成する関数であることからこのような名前がついています。

◆積率母関数

確率変数 $X$ 及び実数 $t$ に対して、 $e^{t X}$ の期待値を積率母関数といい、 $M_{X} (t)$ であらわす。

$\begin{matrix} (12) & M_{X} (t) = E [e^{t X}] \end{matrix}$

積率と積率母関数には以下の関係がある。

$\begin{matrix} (13) & μ_{X, k}^{^{'}} = M_{X}^{(k)} (0) = {\frac{d^{k}}{d t^{k}} M_{X} (t) |}_{t = 0} \end{matrix}$

◆証明～積率と積率母関数の関係～ 確率変数

X

についての積率母関数

M_{X} (t)

をマクローリン展開すると、

\begin{aligned} M_{X} (t) & = E [1 + t X + \frac{t^{2} X^{2}}{2!} + \dots + \frac{t^{n} X^{n}}{n!}] \\ = 1 + t E [X] + \frac{t^{2}}{2!} E [X] + \dots + \frac{t^{n}}{n!} E [X^{n}] \end{aligned}

上記結果から、

M_{X} (t)

を

t

で微分し

t = 0

とすると、

M_{X}^{^{'}} (0) = E [X] = μ_{X, 1}^{^{'}}

M_{X}^{^{″}} (0) = E [X^{2}] = μ_{X, 2}^{^{'}}

⋮

M_{X}^{(k)} (0) = E [X^{k}] = μ_{X, k}^{^{'}}

よって、

(12)

式が成り立つ。

例として、積率母関数を使ってガンマ分布の平均と分散を求めてみましょう。

◆ガンマ分布の積率母関数と平均・分散 ガンマ分布を確率密度にもつ確率変数

X

に対して、積率母関数は、

\begin{aligned} M_{X} (t) & = E [e^{t X}] \\ = \int_{0}^{\infty} e^{t x} \frac{β^{α} x^{α - 1} e^{- β x}}{Γ (α)} d x \\ = β^{α} (β - t)^{- α} \int_{0}^{\infty} \frac{(β - t)^{α} x^{α - 1} e^{- (β - t) x}}{Γ (α)} d x \\ = β^{α} (β - t)^{- α} \int_{0}^{\infty} f_{Γ (α, β - t)} (x) d x (t < β) \\ = {(1 - \frac{t}{β})}^{- α} (t < β) \end{aligned}

よって、

\begin{aligned} E [X] & = μ_{X, 1}^{^{'}} = {\frac{d}{d t} M_{X} (t) |}_{t = 0} \\ = {- α {(1 - \frac{t}{β})}^{- (α + 1)} - \frac{1}{β} |}_{t = 0} \\ = \frac{α}{β} \end{aligned}

\begin{aligned} V [X] & = μ_{X, 2}^{^{'}} - μ_{X, 1}^{^{'} 2} \\ = {\frac{d^{2}}{d t^{2}} M_{X} (t) |}_{t = 0} - {({\frac{d}{d t} M_{X} (t) |}_{t = 0})}^{2} \\ = {\frac{α}{β} (- (α + 1)) {(1 - \frac{t}{β})}^{- (α + 2)} (- \frac{1}{β}) |}_{t = 0} - \frac{α - 2}{β^{2}} \\ = \frac{α (α + 1)}{β^{2}} - \frac{α^{2}}{β^{2}} \\ = \frac{α}{β^{2}} \end{aligned}

積率が簡単に求められない場合でも、積率母関数を使えば比較的簡単に積率を求められることがあります。

キュミュラント母関数

キュミュラント母関数も、積率や平均・分散・歪度・尖度の計算に使える便利な関数なのですが、核となる部分の証明に手も足も出なかったので、ちゃんと理解出来たらupしたいと思います。

2021.01.31 00:00

積率と母関数

期待値と積率

期待値

積率

分散と中心積率

分散

中心積率

標準化積率と歪度・尖度

標準化積率

歪度と尖度

積率母関数

キュミュラント母関数