Skip to content

Latest commit

 

History

History
291 lines (260 loc) · 12 KB

ex_02_41-50.org

File metadata and controls

291 lines (260 loc) · 12 KB

PRML 第2章 演習 2.41-2.50

PRML 第2章 演習 2.41-2.50

2.41 ガンマ分布が正規化されていることの証明

ガンマ分布 \begin{align*} \Gam(λ|a,b) = & \f{1}{Γ(a)} b^a λa-1 exp(-bλ)
\end{align*}

ガンマ関数の定義 \begin{align*} Γ(x) = & ∫_0^∞ ux-1 e-u du
\end{align*}

ガンマ分布を\(λ\)で積分する。 \begin{align*} & ∫_0^∞ \Gam(λ|a,b) dλ
= & \f{1}{Γ(a)} b^a ∫_0^infty λa-1 exp(-bλ) dλ \ \end{align*} \(u = bλ\)と置く。 \begin{align*} = & \f{1}{Γ(a)} b^a ∫_0^∞ \f{ua-1}{ba-1} exp(-u) b du \ = & \f{1}{Γ(a)} b^a \f{1}{b^a} ∫_0^∞ ua-1 exp(-u) du \ = & \f{1}{Γ(a)} b^a \f{1}{b^a} Γ(a) \ = & 1 \ \end{align*}

2.42 ガンマ分布の平均、分散、モード

平均

\begin{align*} \E[λ] = & ∫_0^∞ λ \Gam(λ|a,b) dλ
= & \f{1}{Γ(a)} b^a ∫_0^∞ λ λa-1 exp(-bλ) dλ \ = & \f{1}{Γ(a)} b^a ∫_0^∞ λ^a exp(-bλ) dλ \ = & \f{1}{Γ(a)} b^a ∫_0^∞ \f{u^a}{b^a} exp(-u) \f{1}{b} du \ = & \f{1}{Γ(a)} b^a \f{1}{ba+1} ∫_0^∞ u^a exp(-u) du \ = & \f{1}{Γ(a)} \f{1}{b} Γ(a+1) \ = & \f{1}{Γ(a)} \f{1}{b} a Γ(a) \ = & \f{a}{b} \ \end{align*}

分散

\begin{align*} var[λ] = & \E[λ^2] - \E[λ]^2
\end{align*}

\begin{align*} \E[λ^2] = & ∫_0^∞ λ^2 \Gam(λ|a,b) dλ
= & \f{1}{Γ(a)} b^a ∫_0^∞ λ^2 λa-1 exp(-bλ) dλ \ = & \f{1}{Γ(a)} b^a ∫_0^∞ λa+1 exp(-bλ) dλ \ = & \f{1}{Γ(a)} b^a ∫_0^∞ \f{ua+1}{ba+1} exp(-u) \f{1}{b} du \ = & \f{1}{Γ(a)} b^a \f{1}{ba+2} ∫_0^∞ ua+1 exp(-u) du \ = & \f{1}{Γ(a)} \f{1}{b^2} Γ(a+2) \ = & \f{1}{Γ(a)} \f{1}{b^2} (a+1) a Γ(a) \ = & \f{a(a+1)}{b^2} \ \end{align*}

\begin{align*} var[λ] = & \E[λ^2] - \E[λ]^2
= & \f{a(a+1)}{b^2} - \f{a^2}{b^2} \ = & \f{a}{b^2} \ \end{align*}

モード

\begin{align*} \p{}{λ} \Gam(λ|a,b) = & 0
\f{1}{Γ(a)} b^a \p{}{λ} [ λa-1 exp(-bλ) ] = & 0 \ \p{}{λ} [ λa-1 exp(-bλ) ] = & 0 \ (a-1) λa-2 exp(-bλ) - b λa-1 exp(-bλ) = & 0 \ (a-1) - b λ = & 0 \ λ = & \f{a-1}{b} \ \end{align*}

2.43 \(q\)次形式に一般化したガウス関数

\begin{align*} p(x|σ^2,q) = \f{q}{2 (2σ^2)1/q Γ(1/q)} exp\l( -\f{|x|^q}{2σ^2} \r)
\end{align*}

正規化されていることの証明

\begin{align*} & ∫-∞^∞ p(x|σ^2,q) dx
= & \f{q}{2 (2σ^2)1/q Γ(1/q)} ∫-∞^∞ exp\l( -\f{|x|^q}{2σ^2} \r) dx \ = & \f{q}{(2σ^2)1/q Γ(1/q)} ∫_0^∞ exp\l( -\f{x^q}{2σ^2} \r) dx \ \end{align*} ここで以下の変数変換を行う。 \begin{align*} y = & \f{x^q}{2σ^2} \ x = & {(2σ^2 y)}1/q \ \f{dx}{dy} = & \f{{(2σ^2)}1/q y1/q-1}{q} \ \end{align*} すると \begin{align*} = & \f{q}{(2σ^2)1/q Γ(1/q)} \f{{(2σ^2)}1/q}{q} ∫_0^∞ y1/q-1 exp(-y) dy \ = & \f{q}{(2σ^2)1/q Γ(1/q)} \f{{(2σ^2)}1/q}{q} Γ(1/q) \ = & 1 \ \end{align*}

\(q=2\)のときガウス分布になることの証明

\begin{align*} p(x|σ^2,q=2) = & \f{2}{2 (2σ^2)1/2 Γ(1/2)} exp\l( -\f{|x|^2}{2σ^2} \r)
= & \f{1}{(2πσ^2)1/2} exp\l( -\f{x^2}{2σ^2} \r) \ \end{align*} \(Γ(1/2)\)の計算は以下の通り。 \begin{align*} Γ(1/2) = & ∫_0^∞ u1/2-1 exp(-u) du \ = & ∫_0^∞ u-1/2 exp(-u) du \ \end{align*} \(v^2=u\)と置くと \begin{align*} = & ∫_0^∞ v-1 exp(-v^2) 2vdv \ = & 2 ∫_0^∞ exp(-v^2) dv \ = & ∫-∞^∞ exp(-v^2) dv \ = & \sqrt{π} \end{align*} \(∫-∞^∞ exp(-v^2) dv\)はガウス積分と呼ばれる。 計算の仕方は演習1.7を参照。

対数尤度関数

\begin{align*} t = & y(\x,\w) + ε
ε = & t - y(\x,\w) = p(x|σ^2,q) \ \end{align*}

尤度関数 \begin{align*} p(\tt|\X,\w,σ^2) = ∏n=1^N \end{align*}

2.44 1変数ガウス分布のベイズ推定で事後分布がガウス-ガンマ分布になることの証明

平均\(μ\)と分散\(τ-1\)が与えられたときに観測値集合\(\xx=\{x_1,…,x_N\}\)が生じる確率である 尤度関数は以下のように書ける。 \begin{align*} p(\xx|μ,τ-1) = ∏n=1^N \N(x_n|μ,τ-1)
\end{align*}

平均\(μ\)と分散\(τ-1\)の事前分布にガウス-ガンマ分布を選ぶ。 \begin{align*} p(μ,τ-1) = \N(μ|μ_0,τ-1) \Gam(τ|a,b)
\end{align*}

事後分布は尤度関数と事前分布の積に比例する。 \begin{align*} p(μ,τ-1|\xx) \propto & p(\xx|μ,τ-1) p(μ,τ-1)
= & ∏n=1^N \N(x_n|μ,τ-1) \N(μ|μ_0,τ-1) \Gam(τ|a,b) \ \end{align*}

2.45 ウィシャート分布が多変量ガウス分布の精度行列の共役事前分布であることの証明

本文p.97で1変数ガウス分布の場合について行なった議論を 多変量ガウス分布の場合に一般化する。

精度行列\(\Λ\)が与えられたときに観測値集合\(\X=\{x_1,…,x_N\}\)が生じる確率である 尤度関数は次のように書ける。 \begin{align*} p(\X|\Λ) \propto & ∏n=1^N \N(\x_n|\μ,\Λ-1)
= & ∏n=1^N \f{1}{(2π)D/2} \f{1}{|\Λ-1|1/2} exp\l\{ -\f{1}{2} (\x_n - \μ)^T \Λ (\x_n - \μ) \r\} \ = & ∏n=1^N \f{1}{(2π)D/2} |\Λ|1/2 exp\l\{ -\f{1}{2} (\x_n - \μ)^T \Λ (\x_n - \μ) \r\} & |\A-1| = |\A|-1 \ = & \f{1}{(2π)ND/2} |\Λ|N/2 exp\l\{ -\f{1}{2} ∑n=1^N (\x_n - \μ)^T \Λ (\x_n - \μ) \r\} \ \end{align*}

精度行列\(\Λ\)の事前分布としてウィシャート分布を選ぶ。 \begin{align*} \mathcal{W}(\Λ|\W,ν) = & B|\Λ|(ν-D-1)/2 exp\l( -\f{1}{2} \Tr(\W-1 \Λ) \r)
B(\W,ν) = & |\W|-ν/2 \l( 2νD/2πD(D-1)/4i=1^D Γ\l(\f{ν+1-i}{2}\r) \r)-1 \ \end{align*}

精度行列\(\Λ\)の事後分布は尤度関数と事前分布の積に比例する。 \begin{align*} p(\Λ|\X) \propto & p(\X|\Λ) \mathcal{W}(\Λ|\W,ν)
\propto & |\Λ|N/2 exp\l\{ -\f{1}{2} ∑n=1^N (\x_n - \μ)^T \Λ (\x_n - \μ) \r\}

(ν-D-1)/2 exp\l( -\f{1}{2} \Tr(\W-1 \Λ) \r) \

= & |\Λ|(ν+N-D-1)/2 exp\l[ -\f{1}{2} \l\{ ∑n=1^N (\x_n - \μ)^T \Λ (\x_n - \μ)

  • \Tr(\W-1 \Λ) \r\} \r]

= & |\Λ|(ν+N-D-1)/2 exp\l[ -\f{1}{2} \l\{ \Tr\l( ∑n=1^N (\x_n - \μ)(\x_n - \μ)^T \Λ \r)

  • \Tr(\W-1 \Λ) \r\} \r]

= & |\Λ|(ν+N-D-1)/2 exp\l[ -\f{1}{2} \Tr\l\{ \l( ∑n=1^N (\x_n - \μ)(\x_n - \μ)^T + \W-1 \r) \Λ \r\} \r]
= & |\Λ|(ν_N-D-1)/2 exp\l[ -\f{1}{2} \Tr(\W_N-1 \Λ) \r] \ \propto & \mathcal{W}(\Λ|\W_N,ν_N) \ \end{align*} 事後分布が再びウィシャート分布の形になったので、 ウィシャート分布が多変量ガウス分布の精度行列の共役事前分布であることが言える。 ここで \begin{align*} ν_N = & ν + N \ \W_N-1 = & ∑n=1^N (\x_n - \μ)(\x_n - \μ)^T + \W-1 \ \end{align*}

ここで以下の性質を用いた。 \begin{align*} \Tr(\X \A) = & ∑_i (\X \A)ii = ∑_i ∑_k Xik Aki
\x^T \A \x = & ∑_i ∑_k x_i Aik x_k \ \end{align*} よって、\(\X = \x \x^T\)すなわち\(Xik = x_i x_k\)と置けば、 \(\Tr(\X \A)=\x^T \A \x\)となる。

2.46 [www] ガウス-ガンマ分布の周辺分布がスチューデントのt分布になることの証明

\begin{align*} p(x|μ,a,b) = & ∫_0^∞ \N(x|μ,τ-1) \Gam(τ|a,b) dτ
= & ∫_0^∞ \f{b^a e-bτ τa-1}{Γ(a)} \l(\f{τ}{2π}\r)1/2 exp\l\{ -\f{τ}{2} (x - μ)^2 \r\} dτ \ = & \f{b^a}{Γ(a)} \l(\f{1}{2π}\r)1/2 ∫_0^∞ τa-1/2 exp\l\{ -τ \l( b + \f{(x - μ)^2}{2} \r) \r\} dτ \ \end{align*}

\begin{align*} z = & τ \l[ b + \f{(x - μ)^2}{2} \r]
τ = & \f{z}{b + (x - μ)^2/2} \ \f{dτ}{dz} = & \f{1}{b + (x - μ)^2/2} \ \end{align*}

\begin{align*} p(x|μ,a,b) = & \f{b^a}{Γ(a)} \l(\f{1}{2π}\r)1/2 ∫_0^∞ \l[ \f{z}{b + (x - μ)^2/2} \r]a-1/2 exp(z) \f{1}{b + (x - μ)^2/2} dz
= & \f{b^a}{Γ(a)} \l(\f{1}{2π}\r)1/2 \l[ b + \f{(x - μ)^2}{2} \r]-a-1/2 ∫_0^∞ za-1/2 exp(z) dz \ = & \f{b^a}{Γ(a)} \l(\f{1}{2π}\r)1/2 \l[ b + \f{(x - μ)^2}{2} \r]-a-1/2 Γ(a+1/2) \ \end{align*}

\begin{align*} ν = & 2a & a = & ν/2
λ = & a/b & b = & a/λ = ν/2λ \ \end{align*}

\begin{align*} p(x|μ,a,b) = & \f{(ν/2λ)ν/2}{Γ(ν/2)} \l(\f{1}{2π}\r)1/2 \l[ ν/2λ + \f{(x - μ)^2}{2} \r]-ν/2-1/2 Γ(ν/2+1/2)
= & \f{Γ(ν/2+1/2)}{Γ(ν/2)} (2λ/ν)(-ν/2-1/2)+1/2 \l(\f{1}{2π}\r)1/2 \l[ ν/2λ + \f{(x - μ)^2}{2} \r]-ν/2-1/2 \ = & \f{Γ(ν/2+1/2)}{Γ(ν/2)} \l(\f{λ}{πν}\r)1/2 \l[ 1 + \f{λ(x - μ)^2}{ν} \r]-ν/2-1/2 \ \end{align*}

2.47 [www] t分布が\(ν→∞\)の極限でガウス分布になることの証明

\begin{align*} \St(x|μ,λ,ν) \propto & \l[ 1 + \f{λ(x - μ)^2}{ν} \r]-(ν+1)/2
= & exp\l( -\f{ν+1}{2} ln\l[ 1 + \f{λ(x - μ)^2}{ν} \r] \r) \ \end{align*} 対数関数は1の周辺で以下のようにテーラー展開できる。 \begin{align*} ln(1 + ε) = ε + O(ε^2) \ \end{align*} \(ν→∞\)のとき、上の展開を適用できる。 \begin{align*} & exp\l( -\f{ν+1}{2} ln\l[ 1 + \f{λ(x - μ)^2}{ν} \r] \r) \ = & exp\l( -\f{ν+1}{2} \l[ \f{λ(x - μ)^2}{ν} + O(ν-2) \r] \r) \ = & exp\l( - \f{λ(x - μ)^2}{2} + O(ν-1) \r) \ \end{align*}

2.48 スチューデントのt分布の多変量形式の導出とそれが正規化されていることの証明

\begin{align*} \St(\x|\μ,\Λ,ν) = & ∫_0^∞ \N(\x|\μ,(η\Λ)-1) \Gam(η|ν/2,ν/2) dη
= & ∫_0^∞ \f{1}{(2π)D/2} \f{1}{|(η\Λ)-1|1/2} exp\l( -\f{η Δ^2}{2} \r) \ & \f{1}{Γ(ν/2)} (ν/2)ν/2 ην/2-1 exp(-νη/2) dη \ = & \f{1}{Γ(ν/2)}\f{(ν/2)ν/2|\Λ|1/2}{(2π)D/2} ∫_0^∞ ην/2-1/2 exp\l[ -\f{η(Δ^2 + ν)}{2} \r] dη \ \end{align*}

\begin{align*} z = \f{η(Δ^2 + ν)}{2} & η = \f{2z}{Δ^2 + ν} & \f{dη}{dz} = & \f{2}{Δ^2 + ν}
\end{align*}

\begin{align*} \St(\x|\μ,\Λ,ν) = & \f{1}{Γ(ν/2)}\f{(ν/2)ν/2|\Λ|1/2}{(2π)D/2} ∫_0^∞ \l( \f{2z}{Δ^2 + ν} \r)ν/2-1/2 exp(z) \f{2}{Δ^2 + ν} dz
= & \f{1}{Γ(ν/2)}\f{(ν/2)ν/2|\Λ|1/2}{(2π)D/2} \l( \f{2}{Δ^2 + ν} \r)ν/2+1/2 ∫_0^∞ zν/2-1/2 exp(z) dz \ = & \f{Γ(ν/2+1/2)}{Γ(ν/2)}\f{(ν/2)ν/2|\Λ|1/2}{(2π)D/2} \l( \f{2}{Δ^2 + ν} \r)ν/2+1/2 \ \end{align*}

2.49 多変量スチューデントt分布の平均、共分散、モード

2.50 多変量スチューデントt分布が\(ν→∞\)の極限で多変量ガウス分布になることの証明

\begin{align*} \St(\x|\μ,\Λ,ν) = & \f{Γ(D/2+ν/2)}{Γ(ν/2)} \f{|\Λ|1/2}{(πν)D/2} \l[ 1 + \f{Δ^2}{ν} \r]-D/2-ν/2
\propto & \l[ 1 + \f{Δ^2}{ν} \r]-D/2-ν/2 \ = & exp\l( - \f{D+ν}{2} ln\l[ 1 + \f{Δ^2}{ν} \r] \r) \ = & exp\l( - \f{D+ν}{2} \l[ \f{Δ^2}{ν} + O(ν-2) \r] \r) \ = & exp\l( - \f{Δ^2}{2} + O(ν-1) \r) \ \end{align*}