多変量正規分布はリプシッツ連続
TL;DR
多変量正規分布の確率密度関数はリプシッツ連続であり、密度関数を
f(x)=(2π)d/2∣Σ∣1/21exp(−21(x−μ)TΣ−1(x−μ))
とするとリプシッツ定数は
L=(2π)d/2∣Σ∣1/2λmin(Σ)e−1/2
となります。
リプシッツ連続性
距離空間 (X,dX) と (Y,dY) の間の写像 f:X→Y がリプシッツ連続であるとは、ある実数 L が存在して
dY(f(x),f(y))≤LdX(x,y)(∀x,y∈X)
が成り立つことを言います。この最大の L をリプシッツ定数と呼びます。
要するに「入力の変化量に対して、出力の変化量が一定の範囲内に収まる」滑らかさの指標です。
また、f が微分可能な場合、リプシッツ連続性は勾配のノルムの上限がリプシッツ定数と一致します。
詳細はこちらを参照してください。
多変量正規分布の確率密度関数
Rd 上の多変量正規分布の確率密度関数は次のように定義されます。
f(x)=(2π)d/2∣Σ∣1/21exp(−21(x−μ)TΣ−1(x−μ))
ここで
- μ:平均ベクトル
- Σ:分散共分散行列(正定値対称行列)
多変量正規分布の確率密度関数のリプシッツ連続性
∇f(x)=f(x)Σ−1(x−μ)
なので1勾配のノルムは
∥∇f(x)∥2=f(x)∥Σ−1(x−μ)∥2
ノルムの最大値を求める
y=x−μ とおくと、
f(x)=Cexp(−21y⊤Σ−1y)
ただし、C=(2π)d/2∣Σ∣1/21.
マラハラノビス距離を r=y⊤Σ−1y とすると、
∥∇f(x)∥2=Cexp(−2r2)∥Σ−1y∥2
となります。
∥Σ−1y∥2 の上界について以下が成り立ちます。
∥Σ−1y∥2≤λmin(Σ)r
ここで λmin(Σ) は最小固有値。統合成立条件は y が最小固有値に対応する固有ベクトルの集合が生成する線形空間の元。したがって、
∥∇f(x)∥2≤Cλmin(Σ)rexp(−2r2)
この右辺は r=1 で最大値をとり、その値は e−1/2。
以上より、多変量正規分布の確率密度関数はリプシッツ連続であり、そのリプシッツ定数は
L=(2π)d/2∣Σ∣1/2λmin(Σ)e−1/2
となります。
特に、等方的な場合(Σ=σ2I)は
L=(2π)d/2σd+1e−1/2
とシンプルな形になります。
∥Σ−1y∥2 の上界
Σ は正定値対称行列より、正規直交行列 Q が存在して
Σ=QΛQT
ここで Λ は対角行列で、Σ の固有値を λi とすると Λ=diag(λ1,λ2,…,λd) となります。
y を Q の基底を用いて展開すると α を用いて y=Qα と書けます。
このとき、マラハラノビス距離は
r2=yTΣ−1y=yTQΛ−1QTy=αTQTQΛ−1QTQα=αTΛ−1α=i=1∑dλiαi2
同様に ∥Σ−1y∥2 は
∥Σ−1y∥22=yTΣ−2y=yTQΛ−2QTy=αTQTQΛ−2QTQα=αTΛ−2α=i=1∑dλi2αi2
任意の i について λi≥λmin(Σ) が成り立つから
∥Σ−1y∥22=i=1∑dλi2αi2≤λmin(Σ)1i=1∑dλiαi2=λmin(Σ)r2
よって
∥Σ−1y∥2≤λmin(Σ)r
統合成立条件は λi=λmin(Σ) となるような i についてのみ αi=0 であること。
つまり、y が最小固有値に対応する固有ベクトルの集合が生成する線形空間の元であることです。
References