積率と母関数

本記事では確率論の勉強ということで、期待値など確率変数の特徴を表す量について定義し、それらにまつわる便利なアイテム(関数)群を整理しようと思います。
本記事の内容をマスターすれば、確率分布の各特徴を表す量について明るくなったり、確率分布が関係する計算に少し強くなったりできます。

本記事の構成は以下の通りです。

期待値と積率

期待値

まず、確率変数X期待値について定義します。 以下、慣例に従い確率変数は大文字(例:X)、確率変数からの実現値は同じアルファベットの小文字(例:x)で、Aという事象が起こる確率をP(A)で表します。

◆確率変数の期待値

離散型の確率変数Xが確率質量関数pX(xk)(k=1,2,)をもつとき、Xの期待値は下記で定義される。

(1)E[X]=k=1xkP(X=xk)=k=1xkpX(xk) 連続型の確率変数Xが確率密度関数fX(x)をもつとき、Xの期待値は下記で定義される。

(2)E[X]=xfX(x)dx

感覚的には(1)(2)式ともにXがとりうる値についてその値をとる確率で重みづけしたものが期待値になります。通常の平均と同じ考えかたですね。

積率

積率(moment)は、期待値にまつわる重要な概念です。

◆積率 確率変数X及び自然数kについて、 Xkの期待値 (3)μX,k=E[Xk] を確率変数Xk次の積率(moment)という。 特にXの1次の積率は平均(E[X])である。

上の定義だけでは積率をわざわざ定義する意味が分からないと思いますが、のちのち紹介するように分散や歪度、尖度の計算に2次、3次、4次の積率が利用されます。

試しにガンマ分布の積率を導出し、ガンマ分布に従う確率変数の期待値を求めてみましょう。

memo

ガンマ分布の確率密度は下記式で与えられる。ここで、xR+,αR+,βR+である。 Gamma(x|α,β)=βαΓ(α)xα1eβx Γ(z)はガンマ関数といい、下記で定義される。 Γ(z)=0tz1etdt   (z>0)

◆ガンマ分布の積率・期待値 ガンマ分布を確率密度にもつ確率変数Xについて、 μX,k=E[Xk]=0βαΓ(α)xα1eβxxkdx=βαΓ(α)0xα+k1eβxdx=βαΓ(α)0(yβ)k+α1ey1βdy   (y=βx)=βαΓ(α)1βk+α0yk+α1eydy=βαΓ(α)Γ(k+α)βk+α=βki=1k1(α+i1)   (Γ(s+1)=sΓ(s)) よって、 μX,1=E(X)=αβ

分散と中心積率

分散

次に確率変数の分散について定義します。

◆分散 確率変数Xの分散は下記で定義される。ここでXの平均をμXとする。 (4)V[X]=E[(XμX)2]

確率変数の平均も分散も、通常のデータに対する平均と分散と同じ考え方で定義されています。

中心積率

積率に関連した概念として、中心積率について定義します。

◆中心積率 確率変数Xとその平均μX及び自然数kについて、(XμX)kの期待値を確率変数Xk次の中心積率(central moment)といい、μX,kであらわす。特に2次の中心積率は分散である。 (5)μX,k=E[(XμX)k] (6)μX,2=E[(XμX)2]=V[X]

このように、確率変数の分散は中心積率を用いて計算することができます。

試しに、ガンマ分布の分散を求めてみましょう。

◆ガンマ分布の分散 (5)式を変形して、 V[X]=E[(XμX)2]=E[X2]2E[X]μX+μX2=μX,2μX,12 よって、ガンマ分布を確率密度に持つ確率変数Xの分散は、 V[X]=μX,2μX,12=β2α(α+1)(β1α)2=αβ2

さらに、分散の非負平方根は標準偏差と呼びます。

◆標準偏差 標準偏差σXは下記式で定義される。 (7)σX=μX,2

標準化積率と歪度・尖度

標準化積率

平均μX、標準偏差σXである確率変数Xに対する標準化は

(8)Z=XμXσX

となりますが、これに関連して標準化積率が定義されます。

◆標準化積率

平均μX、標準偏差σXである確率変数Xおよび自然数kに対して、(XμXσX)kの期待値を標準化積率と呼び、αX,kであらわす。

(9)αX,k=E[(XμXσX)k]

歪度と尖度

確率分布の形状を把握するための量に歪度尖度があり、これらは上記の標準化積率を用いて定義されます。

◆歪度と尖度 3次の標準化積率を歪度とよび確率変数Xの歪度をγX,1とあらわす。 (10)γX,1=αX,3=E[(XμXσX)3] 4次の標準化積率を歪度とよび確率変数Xの尖度をγX,2とあらわす。 (11)γX,2=αX,4=E[(XμXσX)4]

歪度は確率分布の対称性・非対称性の指標となります。
歪度がγX,1=0となるとき、その確率変数の確率分布は左右対称であるといえます。
一方、歪度γX,1>0となるとき、Xは平均以上の値をとることが多いことから、分布の形状は平均より正の方向に長い右歪分布となります。
逆に歪度γX,1<0のとき、分布の形状は平均より負の方向に長い左歪分布となります。

尖度は確率分布の密集度を示します。尖度が大きいと、σXが小さくなるため、分布は中心付近に密集するとともに、XμXが大きくなるため、分布の裾が重い分布となります。

例として、ガンマ分布の歪度と尖度を求めてみましょう。

◆ガンマ分布の歪度・尖度 ガンマ分布を確率密度にもつ確率変数Xについて、 γX,1=αX,4=E[(XμXσX)4]=μX,33μX,2μX,1+2μX,13σX3=(α(α+1)(α+2)β33α(α+1)β2αβ+2α3β3)β3αα=2α γX,2=αX,4=E[(XμXσX)4]=μX,44μX,3μX,1+6μX,2μX,123μX,14σX4=3(α+2)α

積率母関数

次に積率母関数を定義します。積率母関数は、積率を生成する関数であることからこのような名前がついています。

◆積率母関数

確率変数X及び実数tに対して、etXの期待値を積率母関数といい、MX(t)であらわす。

(12)MX(t)=E[etX]

積率と積率母関数には以下の関係がある。

(13)μX,k=MX(k)(0)=dkdtkMX(t)|t=0


◆証明~積率と積率母関数の関係~ 確率変数Xについての積率母関数MX(t)をマクローリン展開すると、 MX(t)=E[1+tX+t2X22!++tnXnn!]=1+tE[X]+t22!E[X]++tnn!E[Xn] 上記結果から、MX(t)tで微分しt=0とすると、 MX(0)=E[X]=μX,1 MX(0)=E[X2]=μX,2 MX(k)(0)=E[Xk]=μX,k よって、(12)式が成り立つ。

例として、積率母関数を使ってガンマ分布の平均と分散を求めてみましょう。

◆ガンマ分布の積率母関数と平均・分散 ガンマ分布を確率密度にもつ確率変数Xに対して、積率母関数は、 MX(t)=E[etX]=0etxβαxα1eβxΓ(α)dx=βα(βt)α0(βt)αxα1e(βt)xΓ(α)dx=βα(βt)α0fΓ(α,βt)(x)dx  (t<β)=(1tβ)α  (t<β) よって、 E[X]=μX,1=ddtMX(t)|t=0=α(1tβ)(α+1)1β|t=0=αβ V[X]=μX,2μX,12=d2dt2MX(t)|t=0(ddtMX(t)|t=0)2=αβ((α+1))(1tβ)(α+2)(1β)|t=0α2β2=α(α+1)β2α2β2=αβ2

積率が簡単に求められない場合でも、積率母関数を使えば比較的簡単に積率を求められることがあります。

キュミュラント母関数

キュミュラント母関数も、積率や平均・分散・歪度・尖度の計算に使える便利な関数なのですが、核となる部分の証明に手も足も出なかったので、ちゃんと理解出来たらupしたいと思います。

コメントを書く


※ コメントは承認されると表示されます

承認されたコメント一覧