コイン投げの表と裏などのように, 言葉で事象を表すのは不便なので確率変数というものを導入する. 例えば,
- X({表})=1
- X({裏})=0
などのように決める. このように標本空間上で定義された実数値関数 X を確率変数という.
標本点に対して確率が与えられていたことを考えれば, 確率変数のそれぞれの値に対しても確率が与えられているということになる. 即ち, 確率変数は, その取る値が確率的に決まる変数とも言える.
確率変数を用いることにより, これまでP({表})=1/2 などと書いていた所は, P(X=1)=1/2 のように書ける. このように, 言葉ではなく実数値で事象を表現することにより数学的にはとても扱い易いものとなる.
サイコロであれば, 確率変数は {1,2,3,4,5,6}の6つの値を取る. 気温などであれば, 10度, 20度のような値もあれば, 9.87度のように中途半端な値もあり連続な値を取るとしてよいといえる. コイン投げやサイコロのように飛び飛びの値を取る場合の確率変数を離散型確率変数や離散確率変数という. 一方, 連続な値を取る確率変数を連続型確率変数や連続確率変数という.
離散型確率変数の取る値は有限個とは限らず, 可算無限個(自然数の個数)の場合もある.
{xi}(1≤i<∞)を値に取る離散型確率変数 X が あるとき,
- f(xi) = P(X=xi)
によって関数 f を定義することができる. この f を確率質量関数という. 確率によって定義されていることから
- f(xi) ≥ 0
-
でなければならないことが分かる.
離散型の場合と同じように、連続型を定義するためには, 連続型確率変数 X に対して
-
を満たす関数fを考えればよい. この f を確率密度関数という.
- 離散型と違って連続型の確率の足し合わせはΣではなく積分で表されていることに注意.
離散型と同じように, 確率で定義されていることから,
- f(x) ≥ 0
-
でなければならないことが分かる.
f を確率質量関数や確率密度関数として
-
によって定義される関数 F(x)を, fの累積分布関数や分布関数と呼ぶ.
この累積分布関数を用いれば
-
と表すことができる.
離散型確率変数に対する累積分布関数は
-
連続型確率変数に対する累積分布関数は
-
と表現できる. 累積分布関数の値が分かれば P(a < X ≤ b) の値が計算できるので, 累積分布関数の値を数表にまとめておき, 確率の計算を行うということがしばしば行われる.
fを確率質量関数とするとき、
-
を期待値といい、
-
を分散という。分散については、
-
が成り立つので、これを用いて計算してもよい。
同様に、fを確率密度関数とするとき、
-
を期待値といい、
-
を分散という。分散については離散型のときと同様に、
-
が成り立つので、これを用いて計算してもよい。