はじめに
この記事は反例 Advent Calendar 2018 - Adventarの25日目の記事です.
24日目の記事にしようと思ったら埋まっていたので.
タイトル通り,2次元以上の分布関数には各変数に関する単調増加性より強い性質が必要になることを言います.分布関数の定義が少し分かりづらいかもしれませんが,「確率測度との1対1の対応があるような関数」ということです.
細々した話は伊藤雄二, 確率論, 朝倉書店(2002)を参照してください.
定義:1次元分布関数
関数$F:\mathbb{R}\to\mathbb{R}$が分布関数とは次を満たす時を言います:
- $\forall x\in\mathbb{R}$に対して$0\leq F(x)\leq 1$である.
- $x<x'$の時$F(x)\leq F(x')$である.
- $\displaystyle \lim_{x\to\infty}F(x)=1$,$\displaystyle \lim_{x\to-\infty}F(x)=0$である.
- $\forall x\in\mathbb{R}$で$F(x)$は右連続である.
要するに「0から1に値を取る」,「(広義)単調増加で」,「特に正の無限大と負の無限大でそれぞれ1と0であり」,「右連続な」関数のことを分布関数と言います.
分布関数$F$はある確率測度$P$を用いて
\begin{align} F(x)=P(X\leq x) \end{align}
と書くことができますし,$F$をこのように定義すれば$F$は分布関数となります*1.
例えば,サイコロの出目を$i$,それぞれの目が出る確率$P(i)$を考えると$P(i)=1/6, (i=1,\cdots,6)$であり,分布関数$F$は容易に想像できると思います.
その他具体例は工学部向けの適当な確率・統計の本に載っていると思いますので必要な方は参照してみてください.関係ないのでこれ以上は踏み込みません.
定義:2次元分布関数
さて2次元の分布関数について考えてみます.
関数$F:\mathbb{R}\times\mathbb{R}\to\mathbb{R}$が分布関数とは次を満たす時を言います:
- $\forall x_1,x_2\in\mathbb{R}$に対して$0\leq F(x_1,x_2)\leq 1$である.
- $\forall x_1,x_2\in\mathbb{R}$及び$\forall h_1>0, \forall h_2>0$に対して次が成り立つ: \begin{align} F(x_1+h_1,x_2+h_2)-F(x_1,x_2+h_2)-F(x_1+h_1,x_2)+F(x_1,x_2)\geq0. \end{align}
- $\displaystyle \lim_{x_1\to\infty,x_2\to\infty}F(x_1,x_2)=1$,$\displaystyle \lim_{x_1\to-\infty}F(x_1,x_2)=0$,$\displaystyle \lim_{x_2\to-\infty}F(x_1,x_2)=0$である.
- $\forall x_1,x_2\in\mathbb{R}$で次の意味で$F$は連続である: \begin{align} \forall &\varepsilon >0 : \exists \delta=\delta(\varepsilon)>0 \textrm{ s.t. } \\ 0&\leq t_1-x_1<\delta, 0\leq t_2-x_2 <\delta\Rightarrow 0\leq F(t_1,t_2)-F(x_1,x_2)<\varepsilon. \end{align}
2次元の分布関数$F$も1次元の場合と同様にある確率測度$P$を用いて
\begin{align} F(x,y)=P(X\leq x,Y\leq y) \end{align}
と書くことができますし,$F$をこのように定義したならば$F$は分布関数となります.
また2つ目の性質と3つ目の性質を組み合わせれば$F$は各変数に関して単調増加になることが出ます*2.つまり単調増加より強い性質を要請しています.
1次元の場合は単調増加だったのだから,2次元(もしくはそれ以上の次元)の場合でもそれでいいのではないか,という話になりますが,実際それではダメで2次元の場合に反例が作れることを言います.
命題:確率測度と分布関数の対応
$\mathbb{R}^n$上の確率測度の全体と$n$次元分布関数の全体は1対1に対応する*3.
反例
さて関数$F:\mathbb{R}\times\mathbb{R}\to\mathbb{R}$が上の定義の1., 3., 4.を満たし,各変数に関して単調増加であるします.
この時$F$に分布関数にならないものが存在することが言えます.
証明は実際に構成すれば良いので一瞬で終わります.$F$を
\begin{align}
F(x_1,x_2)=
\begin{cases}
1 , & \text{if $x_1+x_2 \geq 0$ }\\
0, & \text{otherwise}
\end{cases}
\end{align}
と定義します.イメージ的には2次元平面の左上から右下に直線を引いてその右側を1,左側を0とする感じです.
そうすると定義から性質の1.と3.及び各変数に関して単調増加であることを満たすことは即座に分かります.
性質の4.についても,ほぼ自明ですが,$h_i>0$として$t_i=x_i+h_i$と捉えれば分かりやすくなります.
性質の2.は$(x_1,x_2)=(-1,0)$,$(h_1,h_2)=(1,1)$と取ることによって
\begin{align}
F(0,1)-F(-1,1)-F(0,0)-F(-1,0)=1-1-1+0<0
\end{align}
となり,満たしません.
故に性質の1., 3., 4.を満たし単調増加であるとしても分布関数ではない(確率測度と1対1の対応がない)例が存在します.
これを素直に拡張すれば良いので2次元以上の場合でも同じことが言えます.
故に2次元以上の分布関数には単調増加性より強い性質を要請します.
しかし勿論普通は$F(x):=P(X\leq x)$で分布関数を定義しますし,実用上結局性質として出すのは単調増加性だと思います.
おわりに
参考までに3次元の分布関数は,1., 3., 4.はいいとして2.が \begin{align} F&(x_1+h_1,x_2+h_2,x_1+h_3) \\ &-F(x_1,x_2+h_2,x_3+h_3)-F(x_1+h_1,x_2,x_3+h_3)-F(x_1+h_1,x_2+h_2,x_3) \\ &+F(x_1,x_2,x_3+h_3)+F(x_1,x_2+h_2,x_3)+F(x_1+h_1,x_2,x_3) \\ &-F(x_1,x_2,x_3)\geq0 \end{align} となります.