統計学基礎/単回帰分析
< 統計学基礎
単回帰分析のアルゴリズム定義
編集- 目的
- データ解析に関するサイトや書籍で学んだ統計解析の概念を確認するための定義式を作成した。これは、「分かる・できる!」シリーズのセミナーや教科書などで難解な数式を避けた解説がされた場合、その詳細な部分を補うためにも役立つ。
- 対象読者
- データ解析手法の概念を理解したい人や、サイト訪問者全般が対象となる。
- アルゴリズム定義式
- モデル
- 因果関係モデルは、現在最も分かりやすく、一般的なモデルである。
- このモデルの作成には、従属変数(被説明変数)と独立変数(説明変数)が必要である。
- 結果として得られるモデル式は、従属変数を Y、独立変数を X とすると、
- Y = a * X + b
- と表される。この式は、独立変数が原因で従属変数が結果となる因果関係モデルが構築されることを意味する。ここで、X と Y はそれぞれ入力データの実績値のベクトルを表し、a と b は回帰係数であり、Y の理論値と実績値の乖離(=残差)が最小となるように計算される。
- 回帰係数(=回帰パラメータ)
- 回帰係数の計算アルゴリズムは、以下の通りである。
- a = Σ((Xi - Xの平均) * (Yi - Yの平均)) / Σ((Xi - Xの平均)の二乗)
- b = Yの平均 - a * Xの平均
- モデル評価指標
- モデルそのものを評価する指標は、以下の通りである。
- 決定係数:(Σ(Yの予測値i - Yの平均)の二乗) / (Σ(Yi - Yの平均)の二乗)
- 重相関係数:決定係数の平方根