コイン投げの表や裏などの事象を言葉で表すのは不便な場合があるため、「確率変数」を導入する。例えば、
- X({表}) = 1
- X({裏}) = 0
のように定義する。このように標本空間上で定義された実数値関数 X を確率変数と呼ぶ。
標本点に確率が割り当てられていることを考えれば、確率変数の各値にも確率が対応することになる。言い換えると、確率変数とは、確率的に取る値が決まる変数である。
確率変数を用いることで、例えば P({表}) = 1/2 のように書いていたものを P(X = 1) = 1/2 と表現できる。このように、言葉ではなく実数値で事象を記述することで、数学的に扱いやすくなる。
サイコロでは、確率変数は {1, 2, 3, 4, 5, 6} の6つの値を取る。気温のような場合には、10度や20度のような値だけでなく、9.87度のように連続的な値も取ると考えられる。
コイン投げやサイコロのように離散的な値を取る確率変数を離散型確率変数(または離散確率変数)といい、連続的な値を取る確率変数を連続型確率変数(または連続確率変数)という。
離散型確率変数の取る値は有限個に限らず、可算無限個(自然数と同じ個数)の場合もある。
離散型確率変数 X が {xi} (1 ≤ i < ∞) の値を取るとき、
-
によって関数 f を定義する。この f を確率質量関数と呼ぶ。
確率によって定義されているため、次の性質を満たす:
-
-
連続型確率変数 X に対して、次の関係を満たす関数 f を考える:
-
この f を確率密度関数と呼ぶ。
離散型の場合と異なり、確率の足し合わせは Σ ではなく積分で表される点に注意する。
確率によって定義されているため、次の性質を満たす:
-
-
f を確率質量関数または確率密度関数とするとき、
-
によって定義される関数 F(x) を f の累積分布関数または分布関数と呼ぶ。
累積分布関数を用いることで、次のように表現できる:
-
具体的には、
- 離散型確率変数の場合:
-
- 連続型確率変数の場合:
-
累積分布関数の値を数表としてまとめることで、確率の計算が容易になる。
f を確率質量関数とするとき、期待値 E(X) は次のように定義される:
-
分散 V(X) は以下のように定義される:
-
分散について、以下の式変形が成り立つため、計算に利用できる:
-
同様に、f を確率密度関数とするとき:
- 期待値:
-
- 分散:
-
分散については離散型の場合と同様に、
-
が成り立つ。