「主成分分析」の版間の差分

削除された内容 追加された内容
M 説明変数に言及
MathXplore (トーク | 投稿記録)
M +temp, -br
1 行
{{wikipedia}}
== 主成分分析の発想 ==
n個のp次元ベクトル<math>\mathbf{x_i}=(x_1, x_2,\cdots,x_p)^T \ (i=1,2,\cdots,n)</math>があるとする。
主成分分析の目的は、できるだけ元データの構造を保った上で、より次元の小さな次元に圧縮することである。
 
具体的には、例えば、<br>
:<math>x=(x_1, x_2,\cdots,x_p)^T\ (i=1,2,\cdots,n)</math><br>
を1次元の値で表すことを考えてみよう。
そのための方法として、p次元単位ベクトル<math>\mathbf{e}</math>を用意して、内積を取ることで、単位ベクトル方向の方向成分によって、n個のベクトルを識別するという方法がある。
15 ⟶ 16行目:
== 主成分分析における"主成分"の考え方 ==
では、p次元ベクトルの単位ベクトルはどのように選ぶのが良いだろうか?<br>
n個のベクトルの単位ベクトルの方向成分をとった時、成分ができるだけバラける方向に単位ベクトルを取ると、成分の値によって、<math>x_i</math>を区別しやすい。<br>
 
したがって、単位ベクトルは分散が大きい方向に取るのが良い。単位ベクトルをaとすると、<math>\mathbf{a}</math>の満たすべき条件は<br>
:<math>z=\mathbf{a}^T x</math>
<br>
 
<math>
var(z)=\frac{1}{n}\sum_{i=1}^n{(z_i-\bar{z})}
</math>を最大化する<math>\mathbf{a}</math><br>
である。<br>
 
これは射影変換後の変数zの分散が最大になるように単位ベクトルを決めるていることを意味する。<br>
また、上の条件を満たす<math>\mathbf{a}</math>によって得られる変数<math>z</math>は、標本<math>x</math>の特徴をよく表していることから、「説明変数」とよばれる。<br>