「旧課程(-2012年度)高等学校数学B/統計とコンピューター」の版間の差分

削除された内容 追加された内容
間違い
ページの白紙化
1 行
本項は[[高等学校数学B]]の統計とコンピューターの解説です。
 
 
==はじめに(統計とコンピューターとは)==
様々な統計資料の整理とグラフ化や代表値・標準偏差などの基礎概念、また実際の処理がどのように行われるかを身近な事例やコンピューターの表計算ソフトを利用して学習します。大まかな内容は以下の通りです。
 
*第2章「資料の整理」では統計資料に関する基礎事項や用語について学習します。
*第3章「代表値」では平均値などの計算方法を学習します。
*第4章「資料の散らばり」では資料の分布具合を数値にする方法を学習します。
*第5章「相関関係」では2種類のデータにどんな関係があるかを学習します。
*第6章「表計算(実践編)」では表計算に関する基礎事項や用語を学習し、実際に表計算ソフトを用いて演習を行います。
*第7章「表計算(基礎編)」では実際の表計算で知っていれば便利な項目を紹介しています。
 
教科書の中には[[高等学校数学B 数列|数列]]を既習としているものもありますが、ここではできるだけ<math> \sum </math>(和の記号で、シグマと読みます)の記号を使わないように配慮しています。
 
表計算のセクション(第6章・第7章)は予め各自使用している表計算ソフトの操作を知っておくとスムーズに学習が進められます。このページではMicrosoft Excelの書式に基づいています。実践編は表計算入門の記事を兼ねていますので余力があればとりかかってみて下さい。
 
この分野の演習問題は[[大学受験数学 統計とコンピューター]]をご覧下さい。表計算演習は該当セクション内の実習と前述のページ演習問題2・3にて代えます。
 
尚、このページに書かれている項目は2012年より代表値までは[[中学校数学]]に、資料の散らばりからは[[高等学校数学I]]へと移動されます。<math> \sum </math>は従来通り高等学校数学Bで扱います。
 
==資料の整理==
ここでは様々な統計資料を視覚的に分かりやすくなるようにまとめることを具体的な例を用いて学習する。
 
===資料の分布===
以下の資料1はある学校の生徒10人の体重をまとめた資料である。
 
*資料1
<table border="1">
<tr align="center">
<th>出席番号</th>
<td colspan="2">1</td>
<td colspan="2">2</td>
<td colspan="2">3</td>
<td colspan="2">4</td>
<td colspan="2">5</td>
<td colspan="2">6</td>
<td colspan="2">7</td>
<td colspan="2">8</td>
<td colspan="2">9</td>
<td colspan="2">10</td>
</tr>
<th>体重(kg)</th>
<td colspan="2">60.3</td>
<td colspan="2">57.9</td>
<td colspan="2">65.4</td>
<td colspan="2">56.1</td>
<td colspan="2">53.6</td>
<td colspan="2">62.7</td>
<td colspan="2">70.0</td>
<td colspan="2">55.8</td>
<td colspan="2">67.1</td>
<td colspan="2">63.1</td>
</tr>
</table>
 
上の資料1は個々の生徒の体重は読み取りやすいが全体の傾向は読み取りにくい。
 
以下の資料2は上の資料1から読み取った値を階級値の1つが62.5kg、その前後±1.5kgの3.0kg毎に階級の区間を定め、その区間に該当する生徒の人数を記録している。
 
*資料2
<table border="1">
<tr align="center">
<th>階級</th>
<td colspan="2">52.0以上~55.0未満</td>
<td colspan="2">55.0~58.0</td>
<td colspan="2">58.0~61.0</td>
<td colspan="2">61.0~64.0</td>
<td colspan="2">64.0~67.0</td>
<td colspan="2">67.0~70.0</td>
<td colspan="2">70.0~73.0</td>
</tr>
<th>階級値</th>
<td colspan="2">53.5</td>
<td colspan="2">56.5</td>
<td colspan="2">59.5</td>
<td colspan="2">62.5</td>
<td colspan="2">65.5</td>
<td colspan="2">68.5</td>
<td colspan="2">71.5</td>
</tr>
<th>度数</th>
<td colspan="2">1</td>
<td colspan="2">3</td>
<td colspan="2">1</td>
<td colspan="2">2</td>
<td colspan="2">1</td>
<td colspan="2">1</td>
<td colspan="2">1</td>
</tr>
</table>
 
このように値をいくつかの区間に区切り全体の傾向を読み取りやすくする時、その区間(ここでは体重)を'''階級'''、またその幅を'''階級の区間'''と言う。また、階級の区間の中央にくる値をその区間の'''階級値'''と言う。各階級に該当する資料の個数(ここでは人数)を'''度数'''、資料2のような各階級に度数を組み込んだ表を'''度数分布表'''と言う。
 
===資料とグラフ===
度数分布表を更に整理して柱状のグラフに表したものを'''ヒストグラム'''と言う。各長方形の高さは各階級の度数に比例する。
 
また、ヒストグラムの各長方形の上の辺の中点を結んでできるグラフのことを'''度数折れ線'''と言う。但しこのグラフを作る際は左右両端に度数が0である階級があるものとして作図をする。
 
以下の2つの図は資料2をグラフに表したものである。
 
また、同じ目盛幅であればヒストグラムの囲む面積と度数折れ線の囲む面積は等しい。
 
:<div style="float:center; margin:0 0 0 10px;text-align:center;">[[画像:ヒストグラム.JPG]]</div>
 
:<div style="float:center; margin:0 0 0 10px;text-align:center;">[[画像:度数折れ線.JPG]]</div>
 
===累積度数===
それぞれの階級以下、または階級以上の度数を全て加えた和を'''累積度数'''といい、それを表にまとめたものを'''累積度数分布表'''と言う。
 
[[高等学校数学B 統計とコンピューター#資料の分布|資料2]]を例に取ると、
 
*資料3
<table border="1">
<tr align="center">
<th>階級</th>
<td colspan="2">55.0未満</td>
<td colspan="2">58.0</td>
<td colspan="2">61.0</td>
<td colspan="2">64.0</td>
<td colspan="2">67.0</td>
<td colspan="2">70.0</td>
<td colspan="2">73.0</td>
</tr>
<th>累積度数</th>
<td colspan="2">1</td>
<td colspan="2">4</td>
<td colspan="2">5</td>
<td colspan="2">7</td>
<td colspan="2">8</td>
<td colspan="2">9</td>
<td colspan="2">10</td>
</tr>
</table>
 
となる。
 
===相対度数===
それぞれの階級の度数を資料の個数で割った値をその階級の'''相対度数'''といい、それを表にまとめたものを'''相対度数分布表'''と言う。相対度数分布表では各階級の相対度数の総和は1となる。
 
[[高等学校数学B 統計とコンピューター#資料の分布|資料2]]を例に取ると、
 
*資料4
<table border="1">
<tr align="center">
<th>階級</th>
<td colspan="2">52.0以上~55.0未満</td>
<td colspan="2">55.0~58.0</td>
<td colspan="2">58.0~61.0</td>
<td colspan="2">61.0~64.0</td>
<td colspan="2">64.0~67.0</td>
<td colspan="2">67.0~70.0</td>
<td colspan="2">70.0~73.0</td>
<td colspan="2">合計</td>
</tr>
<th>度数</th>
<td colspan="2">1</td>
<td colspan="2">3</td>
<td colspan="2">1</td>
<td colspan="2">2</td>
<td colspan="2">1</td>
<td colspan="2">1</td>
<td colspan="2">1</td>
<td colspan="2">10</td>
</tr>
<th>相対度数</th>
<td colspan="2">0.1</td>
<td colspan="2">0.3</td>
<td colspan="2">0.1</td>
<td colspan="2">0.2</td>
<td colspan="2">0.1</td>
<td colspan="2">0.1</td>
<td colspan="2">0.1</td>
<td colspan="2">1.0</td>
</tr>
 
</table>
 
==代表値==
資料の分布についてはヒストグラムなどからも得ることができるが全体の特徴を1つの数字に表すことにより分かりやすくできる。このような値を資料の'''代表値'''と言う。ここではよく用いられる代表値やその定め方について見ていくこととする。
 
===平均値===
変量が取るいくつかの値がある1組の資料でその階級値の総和を資料の個数で割ったものを変量の'''平均値'''と言う。
 
{| style="border:2px solid greenyellow;width:80%" cellspacing=0
|style="background:greenyellow"|'''資料の平均値'''
|-
|style="padding:5px"|
n個の資料<math>x_1 , x_2 , \cdots , x_n</math>の平均値<math>\overline{x}</math>は
'''<center><math>\overline{x} = \frac{x_1 + x_2 + \cdots + x_n} n</math></center>'''
|}
 
例えば、[[高等学校数学B 統計とコンピューター#資料の分布|資料1]]の平均値は
:<math>
\frac{60.3+57.9+65.4+56.1+53.6+62.7+70.0+55.8+67.1+63.1} {10} = 61.2 (kg)
</math>
が平均値となる。
 
 
度数分布表からも、平均値の近似値を求めることができる。このときは、各階級に属する資料の値は、その階級値に等しいと考えて計算する。
 
資料xの度数分布表で、階級値を<math>x_1 , x_2 , \cdots , x_r</math>とし、それに対応する度数を<math>f_1 , f_2 , \cdots , f_r</math>とする。
 
このとき、総和は
:<math>
x_1 f_1 + x_2 f_2 + \cdots + x_r f_r
</math>
で、総度数nは
:<math>
n=f_1 + f_2 + \cdots + f_r
</math>
であるから、資料xの平均値<math>\overline{x}</math>は次のようになる。
 
{| style="border:2px solid greenyellow;width:80%" cellspacing=0
|style="background:greenyellow"|'''度数分布表からの平均値'''
|-
|style="padding:5px"|
階級値を<math>x_1 , x_2 , \cdots , x_r</math>とし、それに対応する度数を<math>f_1 , f_2 , \cdots , f_r</math>とする。平均値<math>\overline{x}</math>は
'''<center><math>\overline{x} = \frac{x_1 f_1 + x_2 f_2 + \cdots + x_r f_r} n</math></center>'''
|}
 
例えば、[[高等学校数学B 統計とコンピューター#資料の分布|資料2]]の平均値は
:<math>
\frac{53.5 \times 1 + 56.5 \times 3 + 59.5 \times 1 + 62.5 \times 2 + 65.5 \times 1 + 68.5 \times 1 + 71.5 \times 1} {10} = 61.3 (kg)
</math>
と計算できる。確かに真の平均値と近い値が計算できている。
 
 
====仮平均====
変量の数が多い時に上記のような計算をすると計算をしなければいけない数が多くなるので、時間がかかったり計算間違いが起こる可能性が少なくない。そこで、計算をより簡単にするための方法を考えてみよう。
 
いま、度数の和<math>f_1+...+f_r</math>は資料の総数nに等しいことに注意すると、任意の値cについて上記の平均値は
:<math>
\frac{(x_1-c) \times f_1 + (x_2-c) \times f_2 + \cdots + (x_r-c) \times f_r} {n} + c
</math>
と等しいことがわかる。そこで、各<math>x_i-c</math>が絶対値の小さい整数などの計算しやすい数になるように適当にcを定めることで、平均値の計算を簡単な計算にすることができる。
 
<math>x_r</math>を新たな値<math>(x_r-c)</math>にすることを変量の'''変換'''といい、またその値<math>\frac{(x_1-c) \times f_1 + (x_2-c) \times f_2 + \cdots + (x_r-c) \times f_r} {n}</math>
を'''仮平均'''と言う。
 
[[高等学校数学B 統計とコンピューター#資料の分布|資料2]]の平均値をこれを用いて計算してみる。基準を62.5(kg)として計算をしてみると、
:<math>
\frac{(53.5-62.5) \times 1 + (56.5-62.5) \times 3 + (59.5-62.5) \times 1 + (62.5-62.5) \times 2 + (65.5-62.5) \times 1 + (68.5-62.5) \times 1 + (71.5-62.5) \times 1} {10} + 62.5 = 61.3 (kg)
</math>
となる。
 
===中央値===
資料を大きさの順に並べた時、中央の順位にくる数値をその資料の'''中央値'''または'''メジアン'''と言う。資料が偶数個の場合(例の場合は5番目と6番目にあたる)は中央に2つの値が並ぶので、その場合は2つの数値の相加平均を中央値とする。外れ値(階級が他のものと極端に離れている値)がある資料に対しては平均値より中央値のほうが代表値としては適している。
 
例えば、[[高等学校数学B 統計とコンピューター#資料の分布|資料1]]の中央値は<math> \frac { 60.3 + 62.7 } {2} = 61.5(kg) </math>となる。
 
また、[[高等学校数学B 統計とコンピューター#試料の分布|資料2]]の中央値は<math> \frac { 59.5 + 62.5 } {2} = 61.0(kg) </math>である。
 
===最頻値===
度数分布表において度数が最大である階級値をその資料の'''最頻値'''または'''モード'''と言う。最頻値はどのサイズがよく売れているかなどを判断するにはいい目安である。
 
例えば、[[高等学校数学B 統計とコンピューター#資料の分布|資料2]]の最頻値は56.5(kg)である。
 
====所得の分布(コラム)====
「世帯の平均年収は549.6万円」と言われても大多数の人は実感がわかないだろう。
 
実際には平均年収以下の世帯が61.4%であり、その中でも年収300万円未満の世帯が約半分を占めている(全体の32.0%)。また、年収1000万円以上の世帯は12.0%となっている。
このパーセンテージが示すように、家計の平均年収は一般的な感情にあまり合っていないことがわかる。
 
中央値は438万円であり、最頻値は(100万円毎に区切ってヒストグラムにした場合)200万円以上~300万円未満の世帯の13.5%となっている。
このご時世、最も実感が沸きやすいのは最頻値ではないだろうか。
 
尚、コラムのデータは[[http://www.mhlw.go.jp/toukei/saikin/hw/k-tyosa/k-tyosa10/2-2.html 厚生労働省 平成22年国民生活基礎調査 各種世帯の所得等の状況]]を参考にした。
 
==資料の散らばり==
代表値が同じであってもその分布が代表値近くに密集していたりばらばらであったりと色々なことが考えられる。ここでは資料の散らばり具合の表す量について見てみよう。
 
===範囲===
資料が取る最大値から最小値を引いた値をその資料の分布の'''範囲'''と言う。
 
例えば、[[高等学校数学B 統計とコンピューター#資料の分布|資料1]]の範囲は<math> 70.0 - 53.6 = 16.4</math>(kg)となる。
 
===四分位数===
データを大きさの順に並べた時、25%、50%、75%に当たる数値をその資料の'''四分位数'''と言う。特に下位から25%に当たる数値を'''第1四分位数'''、
下位から75%に当たる数値を'''第3四分位数'''と言われる。下位から50%に当たる数値は'''第2四分位数'''と言うこともできるが、'''中央値'''と同義である。
 
[[高等学校数学B 統計とコンピューター#資料の分布|資料1]]の四分位数を求めてみよう。まずは資料を昇順に並びかえる。
*資料5
<table border="1">
<tr align="center">
<th>順位</th>
<td colspan="2">10</td>
<td colspan="2">9</td>
<td colspan="2">8</td>
<td colspan="2">7</td>
<td colspan="2">6</td>
<td colspan="2">5</td>
<td colspan="2">4</td>
<td colspan="2">3</td>
<td colspan="2">2</td>
<td colspan="2">1</td>
</tr>
<th>体重(kg)</th>
<td colspan="2">53.6</td>
<td colspan="2">55.8</td>
<td colspan="2">56.1</td>
<td colspan="2">57.9</td>
<td colspan="2">60.3</td>
<td colspan="2">62.7</td>
<td colspan="2">63.1</td>
<td colspan="2">65.4</td>
<td colspan="2">67.1</td>
<td colspan="2">70.0</td>
</tr>
</table>
 
まずは中央値を求めてみる。中央値のセクションでも述べた通り、この資料の中央値は5番目と6番目の平均である61.5kgである。
 
第1四分位数はこの資料では''順位が6番目~10番目の中央値''とも読み取ることができる。言い換えると8番目の値となるので56.1kgとなる。
 
第3四分位数も同様に''順位が1番目~5番目の中央値''とできるので求める数値は3番目の値の65.4kgである。
 
====四分位偏差====
第3四分値と第1四分値の差の半分のことをその資料の'''四分位偏差'''と言う。
 
[[高等学校数学B 統計とコンピューター#資料の分布|資料1]]の四分位偏差は<math> \frac { 65.4 - 56.1 } {2} = 4.65(kg) </math>となる。
 
===偏差===
変数xのとる値が
:<math>
x_1 , x_2 , \cdots , x_n
</math>
のn個あるとき、各値と平均値<math>\overline{x}</math>との差
:<math>
x_1 - \overline{x} , x_2 - \overline{x} , \cdots , x_n - \overline{x}
</math>
を、それぞれ平均値からの'''偏差'''という。
 
[[高等学校数学B 統計とコンピューター#資料の分布|資料1]]で、平均値からの偏差は次のようになる。
 
*資料6
<table border="1">
<tr align="center">
<th>出席番号</th>
<td colspan="2">1</td>
<td colspan="2">2</td>
<td colspan="2">3</td>
<td colspan="2">4</td>
<td colspan="2">5</td>
<td colspan="2">6</td>
<td colspan="2">7</td>
<td colspan="2">8</td>
<td colspan="2">9</td>
<td colspan="2">10</td>
</tr>
<th>体重</th>
<td colspan="2">60.3</td>
<td colspan="2">57.9</td>
<td colspan="2">65.4</td>
<td colspan="2">56.1</td>
<td colspan="2">53.6</td>
<td colspan="2">62.7</td>
<td colspan="2">70.0</td>
<td colspan="2">55.8</td>
<td colspan="2">67.1</td>
<td colspan="2">63.1</td>
</tr>
</tr>
<th>偏差</th>
<td colspan="2">-0.9</td>
<td colspan="2">-3.3</td>
<td colspan="2">4.2</td>
<td colspan="2">-5.1</td>
<td colspan="2">-7.6</td>
<td colspan="2">1.5</td>
<td colspan="2">8.8</td>
<td colspan="2">-5.4</td>
<td colspan="2">5.9</td>
<td colspan="2">1.9</td>
</tr>
</table>
 
さて、今知りたいのは資料全体の偏り具合の傾向であった。それを調べるために、試みに偏差の平均値を計算してみよう。
:<math>
\frac{( x_1 - \overline{x} ) + ( x_2 - \overline{x} ) + \cdots + ( x_n - \overline{x} )} n
</math>
:<math>
= \frac{1}{n} (x_1 + x_2 + \cdots + x_n) - \frac{1}{n} \times n \overline{x}
</math>
:<math>
= \overline{x} - \overline{x} =0
</math>
 
このように、偏差の平均値は常に0になる。
 
===分散と標準偏差===
偏差の平均は常に0となるので、これを計算してもデータの散らばりの大きさを知ることはできないことがわかった。そこで、偏差の2乗の平均値を考える。この値を'''分散'''という。分散を<math>s^2</math>で表すと、次のようになる。
 
{| style="border:2px solid greenyellow;width:80%" cellspacing=0
|style="background:greenyellow"|'''分散'''
|-
|style="padding:5px"|
'''<center><math>s^2 = \frac{( x_1 - \overline{x} )^2 + ( x_2 - \overline{x} )^2 + \cdots + ( x_n - \overline{x} )^2} n
</math></center>'''
|}
 
この分散の定義は自然なものであるが、たとえば、データが身長の場合、その単位はcmであるが、分散は偏差の2乗の平均なので、その単位は<math>cm^2</math>になってしまう。そのため、単位を変量と合わせるために、分散<math>s^2</math>の正の平方根sを考えることも多い。このsを資料xの'''標準偏差'''という。
 
{| style="border:2px solid greenyellow;width:80%" cellspacing=0
|style="background:greenyellow"|'''標準偏差'''
|-
|style="padding:5px"|
'''<center><math>s = \sqrt{\frac{( x_1 - \overline{x} )^2 + ( x_2 - \overline{x} )^2 + \cdots + ( x_n - \overline{x} )^2} n}
</math></center>'''
|}
 
[[高等学校数学B 統計とコンピューター#資料の分布|資料1]]の分散と標準偏差を求めよう。
 
*資料7
<table border="1">
<tr align="center">
<th>体重</th>
<td colspan="2">60.3</td>
<td colspan="2">57.9</td>
<td colspan="2">65.4</td>
<td colspan="2">56.1</td>
<td colspan="2">53.6</td>
<td colspan="2">62.7</td>
<td colspan="2">70.0</td>
<td colspan="2">55.8</td>
<td colspan="2">67.1</td>
<td colspan="2">63.1</td>
</tr>
</tr>
<th>偏差</th>
<td colspan="2">-0.9</td>
<td colspan="2">-3.3</td>
<td colspan="2">4.2</td>
<td colspan="2">-5.1</td>
<td colspan="2">-7.6</td>
<td colspan="2">1.5</td>
<td colspan="2">8.8</td>
<td colspan="2">-5.4</td>
<td colspan="2">5.9</td>
<td colspan="2">1.9</td>
</tr>
<th>偏差の2乗</th>
<td colspan="2">0.81</td>
<td colspan="2">10.89</td>
<td colspan="2">17.64</td>
<td colspan="2">27.04</td>
<td colspan="2">57.76</td>
<td colspan="2">2.25</td>
<td colspan="2">77.44</td>
<td colspan="2">29.16</td>
<td colspan="2">34.81</td>
<td colspan="2">3.61</td>
</tr>
</table>
 
分散<math>s^2</math>は
:<math>
s^2 = \frac{0.81 + 10.89 + 17.64 + 27.04 + 57.76 + 2.25 + 77.44 + 29.16 + 34.81 + 3.61} {10} = 26.038
</math>
 
標準偏差sは
:<math>s = \sqrt{26.038} = 5.102 \cdots
</math>
 
 
度数分布表から分散と標準偏差を求めるときは次のようになる。
{| style="border:2px solid greenyellow;width:80%" cellspacing=0
|style="background:greenyellow"|'''度数分布表からの分散と標準偏差'''
|-
|style="padding:5px"|
階級値を<math>x_1 , x_2 , \cdots , x_r</math>とし、それに対応する度数を<math>f_1 , f_2 , \cdots , f_r</math>とする。分散<math>s^2</math>と標準偏差sは
 
'''<center><math>s^2 =\frac{( x_1 - \overline{x} )^2 f_1 + ( x_2 - \overline{x} )^2 f_2 + \cdots + ( x_r - \overline{x} )^2 f_r} n
</math></center>'''
'''<center><math>s = \sqrt{\frac{( x_1 - \overline{x} )^2 f_1 + ( x_2 - \overline{x} )^2 f_2 + \cdots + ( x_r - \overline{x} )^2 f_r} n}
</math></center>'''
|}
 
==== 偏差値(コラム) ====
諸君も興味を持っているかもしれない大学受験の世界では、「偏差値」という数値がしばしば取り上げられる。偏差値は、次の式で計算される。
 
{| style="border:2px solid greenyellow;width:80%" cellspacing=0
|style="background:greenyellow"|'''偏差値'''
|-
|style="padding:5px"|
<math>x_1,x_2,...</math>の中の数値<math>x_i</math>の偏差値は、
'''<center><math>\frac{10(x_i-\overline{x})}{s}+50</math></center>'''
|}
 
10とか50といった定数は、出てきた数値が直感的にわかりやすい大きさとなるようにしている定数(規格化定数という)であり、直接に意味はない。注目すべきは、この計算式の中に、平均と標準偏差が含まれているということである。つまり、同じ学力を持った人どうしであっても、違う試験を受ければ、試験を受けた他の人たちの動向によって偏差値は大きく変化するということである。そのような数値であるので、少しの変化にあまり一喜一憂しすぎないようにしたい。
 
===分散と2乗の平均値===
分散の式は、次のように変形できる。
 
:<math>
s^2 = \frac{1}{n} \left\{ ( x_1 - \overline{x} )^2 + ( x_2 - \overline{x} )^2 + \cdots + ( x_n - \overline{x} )^2 \right\}
</math>
:<math>
= \frac{1}{n} \left[ \left\{ ( x_1 )^2 + ( x_2 )^2 + \cdots + ( x_n )^2 \right\} - 2 \overline{x} ( x_1 + x_2 + \cdots + x_n ) + n ( \overline{x} )^2 \right]
</math>
:<math>
= \frac{1}{n} \left\{ ( x_1 )^2 + ( x_2 )^2 + \cdots + ( x_n )^2 \right\} - \frac{1}{n} \times 2 \overline{x} ( x_1 + x_2 + \cdots + x_n ) + \frac{1}{n} \times n ( \overline{x} )^2
</math>
:<math>
= \frac{1}{n} \left\{ ( x_1 )^2 + ( x_2 )^2 + \cdots + ( x_n )^2 \right\} - 2 \overline{x} \times \frac{1}{n} ( x_1 + x_2 + \cdots + x_n ) + ( \overline{x} )^2
</math>
:<math>
= \overline{x^2} -2 \overline{x} \times \overline{x} + ( \overline{x} )^2
</math>
:<math>
= \overline{x^2} - ( \overline{x} )^2
</math>
 
すなわち、公式の形にするならば、次のように書ける。
 
{| style="border:2px solid greenyellow;width:80%" cellspacing=0
|style="background:greenyellow"|'''分散と2乗の平均値'''
|-
|style="padding:5px"|
 
'''<center>(xの分散) = (x<sup>2</sup>の平均) - (xの平均)<sup>2</sup></center>'''
|}
 
 
この式を使って、[[高等学校数学B 統計とコンピューター#資料の分布|資料1]]の分散を求めよう。
 
<math>x^2</math>の平均は
:<math>
\overline{x^2} = \frac{(60.3)^2 + (57.9)^2 + (65.4)^2 + (56.1)^2 + (53.6)^2 + (62.7)^2 + (70.0)^2 + (55.8)^2 + (67.1)^2 +(63.1)^2} {10} = 3771.478
</math>
 
xの平均の2乗は
:<math>
( \overline{x} )^2 = (61.2)^2 = 3745.44
</math>
 
よって、分散は
:<math>
s^2 = \overline{x^2} - ( \overline{x} )^2 = 3771.478 - 3745.44 = 26.038
</math>
と、前に出した方法と同じ値になる。
 
==相関関係==
今までは1種類のステータスについてのデータ分析を行ってきた。ここでは2種類のステータスがどのような傾向になっているか見て行くこととしよう。
 
===相関図===
以下の資料8は[[高等学校数学B 統計とコンピューター#資料の分布|資料1]]に身長の値を加えたものである。
 
*資料8
<table border="1">
<tr align="center">
<th>出席番号</th>
<td colspan="2">1</td>
<td colspan="2">2</td>
<td colspan="2">3</td>
<td colspan="2">4</td>
<td colspan="2">5</td>
<td colspan="2">6</td>
<td colspan="2">7</td>
<td colspan="2">8</td>
<td colspan="2">9</td>
<td colspan="2">10</td>
</tr>
<th>体重(kg)</th>
<td colspan="2">60.3</td>
<td colspan="2">57.9</td>
<td colspan="2">65.4</td>
<td colspan="2">56.1</td>
<td colspan="2">53.6</td>
<td colspan="2">62.7</td>
<td colspan="2">70.0</td>
<td colspan="2">55.8</td>
<td colspan="2">67.1</td>
<td colspan="2">63.1</td>
</tr>
<th>身長(cm)</th>
<td colspan="2">161.2</td>
<td colspan="2">154.3</td>
<td colspan="2">162.8</td>
<td colspan="2">160.4</td>
<td colspan="2">155.7</td>
<td colspan="2">163.5</td>
<td colspan="2">172.5</td>
<td colspan="2">166.4</td>
<td colspan="2">173.2</td>
<td colspan="2">164.0</td>
</tr>
</table>
 
例えば、上の資料8の体重をx(kg)、身長をy(cm)として、点<math>\left(x , y \right)</math>を座標平面上にとったとする。
 
2つの変量からなる資料を平面上に図示したものを'''相関図'''または'''散布図'''という。以下は資料8の相関図である。また、点の付近にある数字はその数値に該当する人の出席番号を表す。
 
:<div style="float:center; margin:0 0 0 10px;text-align:center;">[[画像:相関図.JPG]]</div>
 
一般に、相関図において、
 
*2つのデータの一方が増えるとき、もう一方も増える傾向にある場合、'''正の相関関係'''があるという。
*2つのデータの一方が増えるとき、もう一方が減る傾向にある場合、'''負の相関関係'''があるという。
*2つのデータの間に、正の相関関係も負の相関関係もない場合、'''相関関係はない'''という。
 
===相関係数===
2つのデータx , yについて、次のn個の値の組を考える。
:<math>
\left(x _1 , y _1 \right) , \left(x _2 , y _2 \right) , \cdots , \left(x _n , y _n \right)
</math>
 
xの平均値を<math>\overline{x} </math>、yの平均値を<math>\overline{y} </math>とすると
:<math>
\overline{x}= \frac{1}{n} ( x_1 + x_2 + \cdots + x_n )
</math>
:<math>
\overline{y}= \frac{1}{n} ( y_1 + y_2 + \cdots + y_n )
</math>
 
また、xの標準偏差を<math>S_x</math>、yの標準偏差を<math>S_y</math>とすると
:<math>
S_x = \sqrt{ \frac{1}{n} \left\{ ( x_1 - \overline{x} )^2 + ( x_2 - \overline{x} )^2 + \cdots + ( x_n - \overline{x} )^2 \right\} }
</math>
:<math>
S_y = \sqrt{ \frac{1}{n} \left\{ ( y_1 - \overline{y} )^2 + ( y_2 - \overline{y} )^2 + \cdots + ( y_n - \overline{y} )^2 \right\} }
</math>
 
ここで
:<math>
S_{xy} = \frac{1}{n} \left\{ ( x_1 - \overline{x} ) ( y_1 - \overline{y} ) + ( x_2 - \overline{x} ) ( y_2 - \overline{y} ) + \cdots + ( x_n - \overline{x} ) ( y_n - \overline{y} ) \right\}
</math> ……(1)
の値の符号について考える。(1)をxとyの'''共分散'''という。
 
共分散が正のときは、<math>( x_k - \overline{x} ) ( y_k - \overline{y} ) >0</math>となるものが、<math>( x_k - \overline{x} ) ( y_k - \overline{y} ) <0</math>よりも多いと考えられる。
 
すなわち
 
<math>( x_k - \overline{x} ) >0</math> かつ <math>( y_k - \overline{y} ) >0</math>
 
または
 
<math>( x_k - \overline{x} ) <0</math> かつ <math>( y_k - \overline{y} ) <0</math>
 
が多いということになる。
 
よって、共分散が正のとき、xとyには正の相関関係があるといえる。
 
 
共分散が負のときは、<math>( x_k - \overline{x} ) ( y_k - \overline{y} ) <0</math>となるものが、<math>( x_k - \overline{x} ) ( y_k - \overline{y} ) >0</math>よりも多いと考えられる。
 
すなわち
 
<math>( x_k - \overline{x} ) >0</math> かつ <math>( y_k - \overline{y} ) <0</math>
 
または
 
<math>( x_k - \overline{x} ) <0</math> かつ <math>( y_k - \overline{y} ) >0</math>
 
が多いということになる。
 
よって、共分散が負のとき、xとyには負の相関関係があるといえる。
 
 
共分散の値は、資料x , yの内容によって大きく値が変わるので、x , yの偏差をそれぞれの標準偏差<math>S_x , S_y</math>で割った値の積の平均値
 
:<math>
\frac{1}{n} \left( \frac{x_1 - \overline{x}}{S_x} \times \frac{y_1 - \overline{y}}{S_y} + \frac{x_2 - \overline{x}}{S_x} \times \frac{y_2 - \overline{y}}{S_y} + \cdots + \frac{x_n - \overline{x}}{S_x} \times \frac{y_n - \overline{y}}{S_y} \right)
</math>
 
を考え、この値を資料x , yの'''相関係数'''といい、rで表す。
 
:<math>
S_x = \sqrt{ \frac{1}{n} \left\{ ( x_1 - \overline{x} )^2 + ( x_2 - \overline{x} )^2 + \cdots + ( x_n - \overline{x} )^2 \right\} }
</math>
:<math>
S_y = \sqrt{ \frac{1}{n} \left\{ ( y_1 - \overline{y} )^2 + ( y_2 - \overline{y} )^2 + \cdots + ( y_n - \overline{y} )^2 \right\} }
</math>
 
であるから、
 
:<math>
\frac{1}{n} \left( \frac{x_1 - \overline{x}}{S_x} \times \frac{y_1 - \overline{y}}{S_y} + \frac{x_2 - \overline{x}}{S_x} \times \frac{y_2 - \overline{y}}{S_y} + \cdots + \frac{x_n - \overline{x}}{S_x} \times \frac{y_n - \overline{y}}{S_y} \right)
</math>
:<math>
= \frac{1}{n} \left( \frac{x_1 - \overline{x}}{\sqrt{ \frac{1}{n} \left\{ ( x_1 - \overline{x} )^2 + ( x_2 - \overline{x} )^2 + \cdots + ( x_n - \overline{x} )^2 \right\} }} \times \frac{y_1 - \overline{y}}{\sqrt{ \frac{1}{n} \left\{ ( y_1 - \overline{y} )^2 + ( y_2 - \overline{y} )^2 + \cdots + ( y_n - \overline{y} )^2 \right\} }} + \frac{x_2 - \overline{x}}{\sqrt{ \frac{1}{n} \left\{ ( x_1 - \overline{x} )^2 + ( x_2 - \overline{x} )^2 + \cdots + ( x_n - \overline{x} )^2 \right\} }} \times \frac{y_2 - \overline{y}}{\sqrt{ \frac{1}{n} \left\{ ( y_1 - \overline{y} )^2 + ( y_2 - \overline{y} )^2 + \cdots + ( y_n - \overline{y} )^2 \right\} }} + \cdots + \frac{x_n - \overline{x}}{\sqrt{ \frac{1}{n} \left\{ ( x_1 - \overline{x} )^2 + ( x_2 - \overline{x} )^2 + \cdots + ( x_n - \overline{x} )^2 \right\} }} \times \frac{y_n - \overline{y}}{\sqrt{ \frac{1}{n} \left\{ ( y_1 - \overline{y} )^2 + ( y_2 - \overline{y} )^2 + \cdots + ( y_n - \overline{y} )^2 \right\} }} \right)
</math>
:<math>
= \frac{(x_1 - \overline{x}) (y_1 - \overline{y}) + (x_2 - \overline{x}) (y_2 - \overline{y}) + \cdots + (x_n - \overline{x}) (y_n - \overline{y})}{\sqrt{ \left\{ ( x_1 - \overline{x} )^2 + ( x_2 - \overline{x} )^2 + \cdots + ( x_n - \overline{x} )^2 \right\} \times \left\{ ( y_1 - \overline{y} )^2 + ( y_2 - \overline{y} )^2 + \cdots + ( y_n - \overline{y} )^2 \right\} }}
</math>
 
{| style="border:2px solid greenyellow;width:80%" cellspacing=0
|style="background:greenyellow"|'''相関係数'''
|-
|style="padding:5px"|
xの平均値を<math>\overline{x} </math>、yの平均値を<math>\overline{y} </math>とすると、相関係数rは
'''<center><math>r= \frac{(x_1 - \overline{x}) (y_1 - \overline{y}) + (x_2 - \overline{x}) (y_2 - \overline{y}) + \cdots + (x_n - \overline{x}) (y_n - \overline{y})}{\sqrt{ \left\{ ( x_1 - \overline{x} )^2 + ( x_2 - \overline{x} )^2 + \cdots + ( x_n - \overline{x} )^2 \right\} \times \left\{ ( y_1 - \overline{y} )^2 + ( y_2 - \overline{y} )^2 + \cdots + ( y_n - \overline{y} )^2 \right\} }}</math></center>'''
|}
 
 
相関係数rは、一般に<math>-1 \le r \le 1</math>が成り立つ。
*相関係数rの値が1に近いほど、正の相関が強くなる。このとき、相関図の点は右上がりに分布する。
*相関係数rの値が-1に近いほど、負の相関が強くなる。このとき、相関図の点は右下がりに分布する。
*相関係数rの値が0に近いときは、相関は弱くなる。
 
ではこれを用いて[[高等学校数学B 統計とコンピューター#相関図|資料8]]の相関関係を見てみよう。
 
*資料9
<table border="1">
<tr align="center">
<th>出席番号</th>
<td colspan="2">1</td>
<td colspan="2">2</td>
<td colspan="2">3</td>
<td colspan="2">4</td>
<td colspan="2">5</td>
<td colspan="2">6</td>
<td colspan="2">7</td>
<td colspan="2">8</td>
<td colspan="2">9</td>
<td colspan="2">10</td>
</tr>
<th>体重(kg)</th>
<td colspan="2">60.3</td>
<td colspan="2">57.9</td>
<td colspan="2">65.4</td>
<td colspan="2">56.1</td>
<td colspan="2">53.6</td>
<td colspan="2">62.7</td>
<td colspan="2">70.0</td>
<td colspan="2">55.8</td>
<td colspan="2">67.1</td>
<td colspan="2">63.1</td>
</tr>
<th>体重偏差</th>
<td colspan="2">-0.9</td>
<td colspan="2">-3.3</td>
<td colspan="2">4.2</td>
<td colspan="2">-5.1</td>
<td colspan="2">-7.6</td>
<td colspan="2">1.5</td>
<td colspan="2">8.8</td>
<td colspan="2">-5.4</td>
<td colspan="2">5.9</td>
<td colspan="2">1.9</td>
</tr>
<th>身長(cm)</th>
<td colspan="2">161.2</td>
<td colspan="2">154.3</td>
<td colspan="2">162.8</td>
<td colspan="2">160.4</td>
<td colspan="2">155.7</td>
<td colspan="2">163.5</td>
<td colspan="2">172.5</td>
<td colspan="2">166.4</td>
<td colspan="2">173.2</td>
<td colspan="2">164.0</td>
</tr>
<th>身長偏差</th>
<td colspan="2">-2.2</td>
<td colspan="2">-9.1</td>
<td colspan="2">-0.6</td>
<td colspan="2">-3.0</td>
<td colspan="2">7.7</td>
<td colspan="2">0.1</td>
<td colspan="2">9.1</td>
<td colspan="2">3.0</td>
<td colspan="2">9.8</td>
<td colspan="2">0.6</td>
</tr>
</table>
 
よって相関係数rは
<math>r= \frac{( -0.9 ) \times ( -2.2 ) + ( -3.3 ) \times ( -9.1 ) + 4.2 \times ( -0.6 ) + ( -5.1 ) \times ( -3.0 ) + ( -7.6 ) \times ( -7.7 ) + 1.5 \times 0.1 + 8.8 \times 9.1 + ( -5.4 ) \times 3.0 + 5.9 \times 9.8 + 1.9 \times 0.6 }{\sqrt{ \left\{ ( -0.9 )^2 + ( -3.3 )^2 + ( 4.2 )^2 + ( -5.1 )^2 + ( -7.6 )^2 + ( 1.5 )^2 + ( 8.8 )^2 + ( -5.4 )^2 + ( 5.9 )^2 + ( 1.9 )^2 \right\} \times \left\{ ( -2.2 )^2 + ( -9.1 )^2 + ( -0.6 )^2 + ( -3.0 )^2 + ( 7.7 )^2 + ( 0.1 )^2 + ( 9.1 )^2 + ( 3.0 )^2 + ( 9.8 )^2 + ( 0.6 )^2 \right\} }} </math>
 
<math> = 0.755568 \cdots </math>
 
となり、この10人の身長と体重には強い正の相関関係があることが分かる。
 
==表計算(基礎編)==
アンケートなど、資料の数が多い場合には手作業で計算をすると膨大な時間がかかる。そこでコンピューターの表計算ソフト(ここではMicrosoft Excelを例に取る)を用いて統計処理を行ってみよう。
 
コンピューターにMicrosoft Excelが入っていない場合はフリーソフトのOpenoffice Calcなどで代用できる。自身のOS(Windows,Mac,Linuxなど)に合ったバージョンをダウンロードしないと動かないので注意。
 
===表計算ソフト===
表計算ソフトを起動すると長方形の何も書かれていない枠が無数に並んでいる。この枠それぞれのことを'''セル'''と言う。また縦方向(1・2・3・・・)のことを'''行'''、横方向(A・B・C・・・)のことを'''列'''と言う。
 
セルの個々の呼び方は横列→縦行のように表す。例えば横列がC、縦行が3であるセルは「C3のセル」であると言う。
 
*表1
<table border="1">
<tr align="center">
<th></th>
<td colspan="2">'''A'''</td>
<td colspan="2">'''B'''</td>
<td colspan="2">'''C'''</td>
<td colspan="2">'''D'''</td>
<td colspan="2">'''E'''</td>
</tr>
<th>1</th>
<td colspan="2">30</td>
<td colspan="2">2</td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>2</th>
<td colspan="2">20</td>
<td colspan="2">4</td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>3</th>
<td colspan="2">40</td>
<td colspan="2">6</td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>4</th>
<td colspan="2">35</td>
<td colspan="2">5</td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
</table>
*問:A2のセル・B3のセルに当たる数値をそれぞれ答えよ。また、「35」・「2」はそれぞれどのセルに入力されているか。
*実習1:表計算ソフトを起動し、上記の表を作成してみよ。各セルをクリックすると文字入力待機状態になり、キーボードからの入力を受け付ける。
 
===数値計算===
ここでは数値が入力されたセルに対しての計算方法を学ぶ。表計算ソフトによって計算式の種類や入力方法など異なる場合があるので事前に確認しておくこと。ここではよく用いられる演算式を示すが、詳細は表計算ソフトのヘルプ・表計算ソフトについて書かれた書籍を参考にして欲しい。
 
表計算ソフトでは直接セルに計算式を入力することによって、指定されたセルに対して計算を行い、その実行結果が計算式を入力したセルに反映される。またそのセルを複写すると複写先のセルに応じた計算式となって入力され、その実行結果が表示される。
 
====演算子====
セルに計算式を入力することによって様々な計算ができる。また、その計算に必要な記号のことを(算術-)'''演算子'''と言う。一般にX1のセルとY1のセルに入力されている数値の計算は以下のようになる。
 
*X1を代入・・・ <math> =X1 </math>
*X1とY1の和・・・ <math> =X1+Y1 </math>
*X1からY1を引いた値・・・ <math> =X1-Y1 </math>
*X1とY1の積・・・ <math> =X1*Y1 </math>
*X1をY1で割った値の整数部分・・・ <math> =X1/Y1 </math>
*X1をY1で割った余り・・・ <math> =X1%Y1 </math>
*X1をY1回掛けた値(べき乗)・・・ <math> =X1</math>^<math>Y1 </math>
 
*実習2:表1のC1のセルに<math> =A1+B1 </math>、C2のセルに<math> =A2-B2 </math>、C3のセルに<math> =A3*B3 </math>、C4のセルに<math> =A4/B4 </math>と入力してみよ。また、それらの数値が他の方法で計算した結果と合致しているか確かめよ。
 
====関数====
一般に関数とは''xの値を決めるとyの値が1つに定まるもの''であるが、コンピュータ分野においての関数は一般のそれとは異なり'''用途別に予め用意された計算式'''のことを表す。この時計算対象のセルを括弧で指定するが、括弧内を'''引数'''('''ひきすう''')と言う。X1のセルに入力された数値の演算の代表的な例を以下に挙げる。関数の計算結果を出力することを数値を'''返す'''と言う。
 
*正の平方根・・・ <math> =SQRT(X1) </math>
*絶対値・・・ <math> =ABS(X1) </math>
*X1を超えない最大の整数・・・ <math> =INT(X1) </math>
*整数値で四捨五入・・・ <math> =ROUND(X1) </math>
 
三角関数を用いる場合は[[高等学校数学II いろいろな関数#弧度法|弧度法]](「'''弧の長さ<math>\div</math>半径の長さ'''」で記述する角の測り方で、単位は'''ラジアン''':詳細は数学IIで勉強する)での取扱いになる為、度数法での記述の場合は予め弧度法に直しておかなければならない。
 
度数法から弧度法への変換は、<math>n ^{\circ} =n \times \frac{\pi}{180}</math>とすればよい。
 
*正弦(サイン)・・・ <math> =SIN(X1) </math>
*余弦(コサイン)・・・ <math> =COS(X1) </math>
*正接(タンジェント)・・・ <math> =TAN(X1) </math>
 
またX1・X2・X3・・・Xnのセルに対して演算を行う場合は以下のようになる。A1・B1・C1・・・x1のセルに対して演算する場合は以下の(X1:Xn)を(A1:x1)と書き換えればよい。
 
*セルの個数・・・ <math> =COUNT(X1:Xn) </math>
*全ての和・・・ <math> =SUM(X1:Xn) </math>
*平均値・・・ <math> =AVERAGE(X1:Xn) </math>
*中央値・・・ <math> =MEDIAN(X1:Xn) </math>
*最頻値・・・ <math> =MODE(X1:Xn) </math>
 
===グラフの作成===
以下の表は[[高等学校数学B 統計とコンピューター#資料の分布|資料2]]を表計算ソフトに入力したものである。ただし階級は、52.0kg以上55.0kg未満の階級のことを52.0-55.0などと表すことにする。セルに入る文字が長くデフォルトの大きさで収まらない場合、セルの大きさを調節して表を見やすくしてみよう。グラフの作成の仕方を以下に示す。
#グラフの元になるデータの左上のセルから右下のセルまでドラッグし、選択させた状態にする。
#ヒストグラムが書いてあるアイコンをクリックし、グラフウィザードを起動させ、グラフの種類を選択する。
#範囲が正しく設定されてることを確認し、系列を選択する。
#タイトルと項目軸の名前を設定し(無くても可)、グラフを表示させるSheetを選択する。
 
*表2
<table border="1">
<tr align="center">
<th></th>
<td colspan="2">'''A'''</td>
<td colspan="2">'''B'''</td>
<td colspan="2">'''C'''</td>
</tr>
<th>1</th>
<td colspan="2">階級</td>
<td colspan="2">階級値</td>
<td colspan="2">度数</td>
</tr>
<th>2</th>
<td colspan="2">52.0-55.0</td>
<td colspan="2">53.5</td>
<td colspan="2">1</td>
</tr>
<th>3</th>
<td colspan="2">55.0-58.0</td>
<td colspan="2">56.5</td>
<td colspan="2">3</td>
</tr>
<th>4</th>
<td colspan="2">58.0-61.0</td>
<td colspan="2">59.5</td>
<td colspan="2">1</td>
</tr>
<th>5</th>
<td colspan="2">61.0-64.0</td>
<td colspan="2">62.5</td>
<td colspan="2">2</td>
</tr>
<th>6</th>
<td colspan="2">64.0-67.0</td>
<td colspan="2">65.5</td>
<td colspan="2">1</td>
</tr>
<th>7</th>
<td colspan="2">67.0-70.0</td>
<td colspan="2">68.5</td>
<td colspan="2">1</td>
</tr>
<th>8</th>
<td colspan="2">70.0-73.0</td>
<td colspan="2">71.5</td>
<td colspan="2">1</td>
</tr>
</table>
*実習3:表計算ソフトに上記の表を作成してみよ。また、グラフ作成機能を用いてヒストグラムと度数折れ線を作成してみよ。この時、B列・C列さえあればグラフは作成できる。完成すると上のほうの「[[高等学校数学B 統計とコンピューター#資料とグラフ|資料とグラフ]]」に挙げたようなグラフになるはずである。
*'''注意'''
度数折れ線は''左右両端に度数が0である階級があるものとして作図をする''と前に述べた。故にこのグラフを表計算ソフトで作成する場合は表2の2行の前の行に階級値が50.5であるもの、8行の後の行に階級値が74.5であるもの(それぞれ度数は0)を事前に挿入しておかなければならない。
 
===平均値・分散・標準偏差===
以下の表3は表2にいくつかの情報を追加したものである。尚、10行については表を見やすくするために空けてある。表の空欄を埋めながら実習をするとよい。
*表3
<table border="1">
<tr align="center">
<th></th>
<td colspan="2">'''A'''</td>
<td colspan="2">'''B'''</td>
<td colspan="2">'''C'''</td>
<td colspan="2">'''D'''</td>
<td colspan="2">'''E'''</td>
<td colspan="2">'''F'''</td>
<td colspan="2">'''G'''</td>
</tr>
<th>1</th>
<td colspan="2">階級</td>
<td colspan="2">階級値</td>
<td colspan="2">度数</td>
<td colspan="2">階級値×度数</td>
<td colspan="2">偏差</td>
<td colspan="2">偏差の2乗</td>
<td colspan="2">偏差の2乗×度数</td>
</tr>
<th>2</th>
<td colspan="2">52.0-55.0</td>
<td colspan="2">53.5</td>
<td colspan="2">1</td>
<td colspan="2">53.5</td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>3</th>
<td colspan="2">55.0-58.0</td>
<td colspan="2">56.5</td>
<td colspan="2">3</td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>4</th>
<td colspan="2">58.0-61.0</td>
<td colspan="2">59.5</td>
<td colspan="2">1</td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>5</th>
<td colspan="2">61.0-64.0</td>
<td colspan="2">62.5</td>
<td colspan="2">2</td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>6</th>
<td colspan="2">64.0-67.0</td>
<td colspan="2">65.5</td>
<td colspan="2">1</td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>7</th>
<td colspan="2">67.0-70.0</td>
<td colspan="2">68.5</td>
<td colspan="2">1</td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>8</th>
<td colspan="2">70.0-73.0</td>
<td colspan="2">71.5</td>
<td colspan="2">1</td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>9</th>
<td colspan="2">合計</td>
<td colspan="2"></td>
<td colspan="2">10</td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>10</th>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>11</th>
<td colspan="2">平均値</td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>12</th>
<td colspan="2">分散</td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>13</th>
<td colspan="2">標準偏差</td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
</table>
*実習4:表計算ソフトに上記の表を作成し、D列にそれぞれの「階級値×度数」を求める式を入力せよ。例えばD2のセルの値はB2のセルの値とC2のセルの値を掛け合わせた数値なので<math> =B2*C2 </math>と入力される。
*実習5:実習3の結果からB11のセルに平均値を求める式を<math> SUM </math>を使った式で入力せよ。(ヒント:D2~D8のセルの数値の合計を10で割る。)
*実習6:E列にそれぞれの偏差を求める式を入力せよ。例えばE2のセルの値はB2のセルの値からB11のセルの値を引いた数値なので<math> =B2-B11 </math>と入力される。
*実習7:F列にそれぞれ偏差の2乗を入力した後、G9のセルに「偏差の2乗×度数」の合計を求める式を入力せよ。
*実習8:実習7よりB12のセルに分散、B13のセルに標準偏差をそれぞれ表示させてみよ。(ヒント:分散は偏差の2乗の平均なので実習5に同じく<math> SUM </math>が使える。標準偏差は分散の正の平方根なので<math> SQRT </math>を使うと簡単にできる。)
 
 
尚、全ての空欄を埋めた表は以下の通りになる。
*表3(完成)
<table border="1">
<tr align="center">
<th></th>
<td colspan="2">'''A'''</td>
<td colspan="2">'''B'''</td>
<td colspan="2">'''C'''</td>
<td colspan="2">'''D'''</td>
<td colspan="2">'''E'''</td>
<td colspan="2">'''F'''</td>
<td colspan="2">'''G'''</td>
</tr>
<th>1</th>
<td colspan="2">階級</td>
<td colspan="2">階級値</td>
<td colspan="2">度数</td>
<td colspan="2">階級値×度数</td>
<td colspan="2">偏差</td>
<td colspan="2">偏差の2乗</td>
<td colspan="2">偏差の2乗×度数</td>
</tr>
<th>2</th>
<td colspan="2">52.0-55.0</td>
<td colspan="2">53.5</td>
<td colspan="2">1</td>
<td colspan="2">53.5</td>
<td colspan="2">-7.8</td>
<td colspan="2">60.84</td>
<td colspan="2">60.84</td>
</tr>
<th>3</th>
<td colspan="2">55.0-58.0</td>
<td colspan="2">56.5</td>
<td colspan="2">3</td>
<td colspan="2">169.5</td>
<td colspan="2">-4.8</td>
<td colspan="2">23.04</td>
<td colspan="2">69.12</td>
</tr>
<th>4</th>
<td colspan="2">58.0-61.0</td>
<td colspan="2">59.5</td>
<td colspan="2">1</td>
<td colspan="2">59.5</td>
<td colspan="2">-1.8</td>
<td colspan="2">3.24</td>
<td colspan="2">3.24</td>
</tr>
<th>5</th>
<td colspan="2">61.0-64.0</td>
<td colspan="2">62.5</td>
<td colspan="2">2</td>
<td colspan="2">125.0</td>
<td colspan="2">1.2</td>
<td colspan="2">1.44</td>
<td colspan="2">2.88</td>
</tr>
<th>6</th>
<td colspan="2">64.0-67.0</td>
<td colspan="2">65.5</td>
<td colspan="2">1</td>
<td colspan="2">65.5</td>
<td colspan="2">4.2</td>
<td colspan="2">17.64</td>
<td colspan="2">17.64</td>
</tr>
<th>7</th>
<td colspan="2">67.0-70.0</td>
<td colspan="2">68.5</td>
<td colspan="2">1</td>
<td colspan="2">68.5</td>
<td colspan="2">7.2</td>
<td colspan="2">51.84</td>
<td colspan="2">51.84</td>
</tr>
<th>8</th>
<td colspan="2">70.0-73.0</td>
<td colspan="2">71.5</td>
<td colspan="2">1</td>
<td colspan="2">71.5</td>
<td colspan="2">10.2</td>
<td colspan="2">104.04</td>
<td colspan="2">104.04</td>
</tr>
<th>9</th>
<td colspan="2">合計</td>
<td colspan="2"></td>
<td colspan="2">10</td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2">309.6</td>
</tr>
<th>10</th>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>11</th>
<td colspan="2">平均値</td>
<td colspan="2">61.3</td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>12</th>
<td colspan="2">分散</td>
<td colspan="2">30.96</td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>13</th>
<td colspan="2">標準偏差</td>
<td colspan="2">5.564</td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
</table>
 
===相関係数===
以下の表4は[[高等学校数学B 統計とコンピューター#相関図|資料7]]を表にしたものである。ここでは今まで学んだことを用いて全ての空欄を埋めて欲しい。13行は表の見やすさのために空けてある。いくつかのセルは結合されているがその手順を以下に示す。以下の例ではA1・A2のセルを結合させる場合を考える。
#A1のセルからA2のセルに向けてドラッグ(逆方向にドラッグしてもよい)し、2つのセルを選択させた状態にする。
#選択された範囲内で右クリックし、「セルの書式設定>配置>文字の制御」の「セルの結合」の部分にチェックマークを入れる。
#A1・A2のセルの間の境界線が無くなり、2つのセルが結合された状態になる。
 
*表4
{| border="1"
|-
|||<center>'''A'''</center>||<center>'''B'''</center>||<center>'''C'''</center>||<center>'''D'''</center>||<center>'''E'''</center>||<center>'''F'''</center>||<center>'''G'''</center>
|-
!1
|rowspan="2"|出席番号
|colspan="3"|<center>体重</center>||colspan="3"|<center>身長</center>
|-
!2
|数値
|偏差||偏差の2乗||数値||偏差||偏差の2乗
|-
!3
|1
|60.3|| || ||161.2|| ||
|-
!4
|2
|57.9|| || ||154.3|| ||
|-
!5
|3
|65.4|| || ||162.8|| ||
|-
!6
|4
|56.1|| || ||160.4|| ||
|-
!7
|5
|53.6|| || ||155.7|| ||
|-
!8
|6
|62.7|| || ||163.5|| ||
|-
!9
|7
|70.0|| || ||172.5|| ||
|-
!10
|8
|55.8|| || ||166.4|| ||
|-
!11
|9
|67.1|| || ||173.2|| ||
|-
!12
|10
|63.1|| || ||164.0|| ||
|-
!13
|
| || || || || ||
|-
!14
|相関係数
| || || || || ||
|}
 
全ての空欄を埋めた表は以下の通りである。各々作成した表と見比べ確かめてみるとよい。
*表4(完成)
{| border="1"
|-
|||<center>'''A'''</center>||<center>'''B'''</center>||<center>'''C'''</center>||<center>'''D'''</center>||<center>'''E'''</center>||<center>'''F'''</center>||<center>'''G'''</center>
|-
!1
|rowspan="2"|出席番号
|colspan="3"|<center>体重</center>||colspan="3"|<center>身長</center>
|-
!2
|数値
|偏差||偏差の2乗||数値||偏差||偏差の2乗
|-
!3
|1
|60.3||-0.9||0.81||161.2||-2.2||4.84
|-
!4
|2
|57.9||-3.3||10.89||154.3||-9.1||82.81
|-
!5
|3
|65.4||4.2||17.64||162.8||-0.6||0.36
|-
!6
|4
|56.1||-5.1||26.01||160.4||-3||9
|-
!7
|5
|53.6||-7.6||57.76||155.7||-7.7||59.29
|-
!8
|6
|62.7||1.5||2.25||163.5||0.1||0.01
|-
!9
|7
|70.0||8.8||77.44||172.5||9.1||82.81
|-
!10
|8
|55.8||-5.4||29.16||166.4||3||9
|-
!11
|9
|67.1||5.9||34.81||173.2||9.8||96.04
|-
!12
|10
|63.1||1.9||3.61||164.0||0.6||0.36
|-
!13
|
||| || || || ||
|-
!14
|相関係数
|0.755568|| || || || ||
|}
 
==表計算(実践編)==
ここでは実際の表計算で知っていると便利な項目を紹介していきます。ここから先はセンター試験の範囲ではありませんので余力のある方が学習するとよいでしょう。
 
===関数の仕様===
関数の中に別の関数を書くこともできますし、関数を項とみなして加減乗除などもできます。前者を'''ネスト'''や'''入れ子'''と言います。
 
例えば30度の正弦を求めたい場合には<math> =SIN(RADIANS(30)) </math>と入力します。<math> =RADIANS(degree) </math>は度数法を弧度法に変換する関数のことです。degreeには求めたい角度を入れます。
 
表計算ソフトには統計に必要な関数が揃っており、以下は前セクションまでに扱った関数です。
*四分位数・・・ <math> =QUARTILE(X1:Xn,number) </math> ※numberには最小値=0・第一四分位数=1・中央値=2・第三四分位数=3・最大値=4と入れる
*分散・・・ <math> =VARP(X1:Xn) </math>
*標準偏差・・・ <math> =STDEVP(X1:Xn) </math>
*共分散・・・ <math> =COVAR(X1:Xn,Y1:Yn) </math>
*相関係数・・・ <math> =CORREL(X1:Xn,Y1:Yn) </math>
 
今までの関数を利用して資料1の代表値等をまとめてみましょう。<math> =MAX(X1:Xn) </math> は最大値を返す関数、<math> =MIN(X1:Xn) </math>は最小値を返す関数です。
 
{| border="1"
|-
|||<center>'''A'''</center>||<center>'''B'''</center>||<center>'''C'''</center>||<center>'''D'''</center>||<center>'''E'''</center>||<center>'''F'''</center>||<center>'''G'''</center>||<center>'''H'''</center>||<center>'''I'''</center>||<center>'''J'''</center>||<center>'''K'''</center>
|-
!1
|出席番号||1||2||3||4||5||6||7||8||9||10
|-
!2
|体重||60.3||57.9||65.4||56.1||53.6||62.7||70.0||55.8||67.1||63.1
|-
!3
| || || || || || || || || || ||
|-
!4
|平均値||61.2||colspan="9"|=AVERAGE(B2:K2)
|-
!5
|中央値||61.5||colspan="9"|=MEDIAN(B2:K2)
|-
!6
|範囲||16.4||colspan="9"|=MAX(B2:K2)-MIN(B2:K2)
|-
!7
|分散||26.038||colspan="9"|=VARP(B2:K2)
|-
!8
|標準偏差||5.1027||colspan="9"|=STDEVP(B2:K2)
|}
 
===相対参照と絶対参照===
前の実習みたいにいちいち式を書くのは面倒ですし間違いが起こりやすくなります。ここで活躍するのが'''セルの参照'''です。実際に見ていきましょう。
 
<table border="1">
<tr align="center">
<th></th>
<td colspan="2">'''B'''</td>
<td colspan="2">'''C'''</td>
<td colspan="2">'''D'''</td>
<td colspan="2">'''E'''</td>
</tr>
<th>1</th>
<td colspan="2">階級値</td>
<td colspan="2">度数</td>
<td colspan="2">階級値×度数</td>
<td colspan="2">備考</td>
</tr>
<th>2</th>
<td colspan="2">53.5</td>
<td colspan="2">1</td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>3</th>
<td colspan="2">56.5</td>
<td colspan="2">3</td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>4</th>
<td colspan="2">59.5</td>
<td colspan="2">1</td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>5</th>
<td colspan="2">62.5</td>
<td colspan="2">2</td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>6</th>
<td colspan="2">65.5</td>
<td colspan="2">1</td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>7</th>
<td colspan="2">68.5</td>
<td colspan="2">1</td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>8</th>
<td colspan="2">71.5</td>
<td colspan="2">1</td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
</table>
 
上の表は表3のB・C・D列を抜き出し、E列に備考を加えたものです。備考には左隣のセルに対応する式が入ります。
 
D2のセルは実習3の通り<math> =B2*C2 </math>でしたね。D3以降は実習では<math> =B3*C3 </math>や<math> =B4*C4 </math>・・・とやったはずです。
 
D2のセルの数式をコピーしD3のセルにペーストしてみましょう。するとD3のセルには169.5と出力されます。ここでD3に代入された式を見ると<math> =B3*C3 </math>と参照しているセルが自動的にそれぞれが1行下になっていることが分かります。目で見える情報では番地になって出てきますがプログラム内では''3つ左のセルの数値と2つ左のセルの数値を掛け合わせなさい''という命令に置き換わっているのです。この命令をコピーペーストしているのですから、反映先のセルの命令も全く変わりません。下の表は必要な部分だけ抜き出しています。
 
<table border="1">
<tr align="center">
<th></th>
<td colspan="2">'''B'''</td>
<td colspan="2">'''C'''</td>
<td colspan="2">'''D'''</td>
<td colspan="2">'''E'''</td>
</tr>
<th>1</th>
<td colspan="2">階級値</td>
<td colspan="2">度数</td>
<td colspan="2">階級値×度数</td>
<td colspan="2">備考</td>
</tr>
<th>2</th>
<td colspan="2">53.5</td>
<td colspan="2">1</td>
<td colspan="2">53.5</td>
<td colspan="2">=B2*C2</td>
</tr>
<th>3</th>
<td colspan="2">56.5</td>
<td colspan="2">3</td>
<td colspan="2">169.5</td>
<td colspan="2">'''=B3*C3'''</td>
</tr>
</table>
 
同じようにD列の他のセルにペーストしてみましょう。
 
<table border="1">
<tr align="center">
<th></th>
<td colspan="2">'''B'''</td>
<td colspan="2">'''C'''</td>
<td colspan="2">'''D'''</td>
<td colspan="2">'''E'''</td>
</tr>
<th>1</th>
<td colspan="2">階級値</td>
<td colspan="2">度数</td>
<td colspan="2">階級値×度数</td>
<td colspan="2">備考</td>
</tr>
<th>2</th>
<td colspan="2">53.5</td>
<td colspan="2">1</td>
<td colspan="2">53.5</td>
<td colspan="2">=B2*C2</td>
</tr>
<th>3</th>
<td colspan="2">56.5</td>
<td colspan="2">3</td>
<td colspan="2">169.5</td>
<td colspan="2">=B3*C3</td>
</tr>
<th>4</th>
<td colspan="2">59.5</td>
<td colspan="2">1</td>
<td colspan="2">59.5</td>
<td colspan="2">=B4*C4</td>
</tr>
<th>5</th>
<td colspan="2">62.5</td>
<td colspan="2">2</td>
<td colspan="2">125.0</td>
<td colspan="2">=B5*C5</td>
</tr>
<th>6</th>
<td colspan="2">65.5</td>
<td colspan="2">1</td>
<td colspan="2">65.5</td>
<td colspan="2">=B6*C6</td>
</tr>
<th>7</th>
<td colspan="2">68.5</td>
<td colspan="2">1</td>
<td colspan="2">68.5</td>
<td colspan="2">=B7*C7</td>
</tr>
<th>8</th>
<td colspan="2">71.5</td>
<td colspan="2">1</td>
<td colspan="2">71.5</td>
<td colspan="2">=B8*C8</td>
</tr>
</table>
 
これで完成しました。コピーペーストをした時に自動的に参照が変わる方法を'''相対参照'''と言います。
 
下の表は表3の平均値の計算まで終わり偏差を求めようとする段階です。F列は備考としておきます。偏差は''階級値-平均値''でしたね。E2のセルに<math> =B2-B11 </math>と入力しましょう。
 
<table border="1">
<tr align="center">
<th></th>
<td colspan="2">'''A'''</td>
<td colspan="2">'''B'''</td>
<td colspan="2">'''C'''</td>
<td colspan="2">'''D'''</td>
<td colspan="2">'''E'''</td>
<td colspan="2">'''F'''</td>
</tr>
<th>1</th>
<td colspan="2">階級</td>
<td colspan="2">階級値</td>
<td colspan="2">度数</td>
<td colspan="2">階級値×度数</td>
<td colspan="2">偏差</td>
<td colspan="2">備考</td>
</tr>
<th>2</th>
<td colspan="2">52.0-55.0</td>
<td colspan="2">53.5</td>
<td colspan="2">1</td>
<td colspan="2">53.5</td>
<td colspan="2">-7.8</td>
<td colspan="2">=B2-B11</td>
</tr>
<th>3</th>
<td colspan="2">55.0-58.0</td>
<td colspan="2">56.5</td>
<td colspan="2">3</td>
<td colspan="2">169.5</td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>4</th>
<td colspan="2">58.0-61.0</td>
<td colspan="2">59.5</td>
<td colspan="2">1</td>
<td colspan="2">59.5</td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>5</th>
<td colspan="2">61.0-64.0</td>
<td colspan="2">62.5</td>
<td colspan="2">2</td>
<td colspan="2">125.0</td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>6</th>
<td colspan="2">64.0-67.0</td>
<td colspan="2">65.5</td>
<td colspan="2">1</td>
<td colspan="2">65.5</td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>7</th>
<td colspan="2">67.0-70.0</td>
<td colspan="2">68.5</td>
<td colspan="2">1</td>
<td colspan="2">68.5</td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>8</th>
<td colspan="2">70.0-73.0</td>
<td colspan="2">71.5</td>
<td colspan="2">1</td>
<td colspan="2">71.5</td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>9</th>
<td colspan="2">合計</td>
<td colspan="2"></td>
<td colspan="2">10</td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>10</th>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>11</th>
<td colspan="2">平均値</td>
<td colspan="2">61.3</td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>12</th>
<td colspan="2">分散</td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>13</th>
<td colspan="2">標準偏差</td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
</table>
 
E2のセルをコピーしてE3のセルにペーストしてみましょう。4行から9行は割愛しています。
 
<table border="1">
<tr align="center">
<th></th>
<td colspan="2">'''A'''</td>
<td colspan="2">'''B'''</td>
<td colspan="2">'''C'''</td>
<td colspan="2">'''D'''</td>
<td colspan="2">'''E'''</td>
<td colspan="2">'''F'''</td>
</tr>
<th>1</th>
<td colspan="2">階級</td>
<td colspan="2">階級値</td>
<td colspan="2">度数</td>
<td colspan="2">階級値×度数</td>
<td colspan="2">偏差</td>
<td colspan="2">備考</td>
</tr>
<th>2</th>
<td colspan="2">52.0-55.0</td>
<td colspan="2">53.5</td>
<td colspan="2">1</td>
<td colspan="2">53.5</td>
<td colspan="2">-7.8</td>
<td colspan="2">=B2-B11</td>
</tr>
<th>3</th>
<td colspan="2">55.0-58.0</td>
<td colspan="2">56.5</td>
<td colspan="2">3</td>
<td colspan="2">169.5</td>
<td colspan="2">''56.5''</td>
<td colspan="2">'''=B3-B12'''</td>
</tr>
<th>10</th>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>11</th>
<td colspan="2">平均値</td>
<td colspan="2">61.3</td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>12</th>
<td colspan="2">分散</td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>13</th>
<td colspan="2">標準偏差</td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
</table>
 
明らかに間違いな数値が出てきてしまいました。E3のセルの式を見ると<math> =B3-B12 </math> となっています。プログラム内では''3つ左のセルの数値から3つ左、9つ下のセルの数値を引きなさい''という命令に置き変わっています。コピーペーストしてもその命令は変わらないので、参照先が両方とも移動してしまいます。今の段階ではB12のセルに何も入っていないのですから、そのセルには0が入っているものとして計算されます。他のE列にコピーしてもやはり間違いな数値が出力されてしまいます。(実験してみて下さい)
 
このような場合は'''参照するセルを固定する'''ことが必要になります。参照セルを固定する場合は固定したい行番号もしくは列番号の前に''' $ '''の文字を入れます。
 
では平均値が出力されているB11を固定してE2のセルをコピーしE3のセルにペーストしてみましょう。この場合は11のほうを固定したいので'''B$11'''のように入力して固定します。
 
<table border="1">
<tr align="center">
<th></th>
<td colspan="2">'''A'''</td>
<td colspan="2">'''B'''</td>
<td colspan="2">'''C'''</td>
<td colspan="2">'''D'''</td>
<td colspan="2">'''E'''</td>
<td colspan="2">'''F'''</td>
</tr>
<th>1</th>
<td colspan="2">階級</td>
<td colspan="2">階級値</td>
<td colspan="2">度数</td>
<td colspan="2">階級値×度数</td>
<td colspan="2">偏差</td>
<td colspan="2">備考</td>
</tr>
<th>2</th>
<td colspan="2">52.0-55.0</td>
<td colspan="2">53.5</td>
<td colspan="2">1</td>
<td colspan="2">53.5</td>
<td colspan="2">-7.8</td>
<td colspan="2">=B2-'''B$11'''</td>
</tr>
<th>3</th>
<td colspan="2">55.0-58.0</td>
<td colspan="2">56.5</td>
<td colspan="2">3</td>
<td colspan="2">169.5</td>
<td colspan="2">-4.8</td>
<td colspan="2">=B3-B$11</td>
</tr>
<th>10</th>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>11</th>
<td colspan="2">平均値</td>
<td colspan="2">61.3</td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>12</th>
<td colspan="2">分散</td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
<th>13</th>
<td colspan="2">標準偏差</td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
<td colspan="2"></td>
</tr>
</table>
 
これで正しい結果を得ることができました。参照セルを固定する方法を'''絶対参照'''と言います。
 
「''' $ はどちらにつければいいの?'''」という疑問があるかと思いますが、それは[[初級システムアドミニストレータ/表計算ソフト#絶対参照に使う記号($記号)|旧初級シスアド試験の表計算セクション]]に詳しく記述されていますのでここでは述べません。
 
===条件分岐===
ある物事を一定の数値以上ならAを表示、それ未満ならBを表示する・・・などの操作をするためにどのようなことをするか学びましょう。
 
以下の表はレタス・トマト・ねぎの値段を記したものです。ここで以下のような条件をつけてみます。
 
''値段を比較して昨年と同じか上がっている野菜は「↑」下がっていれば「↓」を比較列に入力する''
 
{| border="1"
|-
! ||<center>'''A'''<center>||<center>'''B'''<center>||<center>'''C'''<center>||<center>'''D'''<center>
|-
!1
|野菜||昨年同時期の値段||現在の値段||比較
|-
!2
|レタス||138||125||
|-
!3
|トマト||152||160||
|-
!4
|きゅうり||99||99||
|}
 
IF関数は<math> =IF(formula,value1,value2) </math>で指定します。formulaには論理式、value1には真の場合の値を、value2には偽の場合の値を入力します。値が半角数字や関数でない場合はvalue1やvalue2に" "をつけるのを忘れずに。" "は''" "で囲まれた文字を出力しなさい''、という命令です。
 
'''論理式'''には判定の条件となる式を入れます。'''真'''(true)であることは論理式を満たすもの、逆に'''偽'''(false)はそうでないもののことです。
 
論理式には'''比較演算子'''なるものを入れます。簡単に言えば等号や不等号のことです。気をつけるべき点としてはいわゆる≧や≦、≠の記号は使えないということです。
*<math> A1>100 </math>・・・A1の値が100より大きい
*<math> A1<100 </math>・・・A1の値が100より小さい
*<math> A1>=100 </math>・・・A1の値が100以上
*<math> A1<=100 </math>・・・A1の値が100以下
*<math> A1=100 </math>・・・A1の値が100である
*<math> A1<>100 </math>・・・A1の値が100'''ではない'''
 
また、真偽を反転させたい場合は<math> =NOT(formula) </math>で記述します。<math> =NOT(true) </math>はfalse、<math> =NOT(false) </math>はtrueになります。
 
レタスを例にすると、D2のセルを選択し、以下のように記述します。''昨年を基準として今年はそれ以上なのかどうか''を判定するわけですから、論理式には<math> B2<=C2 </math>と入力します。真偽の部分には矢印を入れます。
*'''=IF(B2<=C2,"↑","↓")'''
 
レタスは昨年より値段が下がっているので論理式を満たさず偽に書かれている内容が出力されます。
 
{| border="1"
|-
! ||<center>'''A'''<center>||<center>'''B'''<center>||<center>'''C'''<center>||<center>'''D'''<center>
|-
!1
|野菜||昨年同時期の値段||現在の値段||比較
|-
!2
|レタス||138||125||↓
|-
!3
|トマト||152||160||
|-
!4
|きゅうり||99||99||
|}
 
他の野菜は相対参照を活用することができますので、同じことを2回も3回もやる必要はありません。
 
{| border="1"
|-
! ||<center>'''A'''<center>||<center>'''B'''<center>||<center>'''C'''<center>||<center>'''D'''<center>
|-
!1
|野菜||昨年同時期の値段||現在の値段||比較
|-
!2
|レタス||138||125||↓
|-
!3
|トマト||152||160||↑
|-
!4
|きゅうり||99||99||↑
|}
 
IF関数は真・偽の2つの分岐をする関数ですので、3分岐以上させるにはIF関数を複数使う必要があります。以下の表はある娯楽施設の入場料を示したものです。
 
{| border="1"
|-
|'''一度に入場する人数'''||'''1人当たりの入場料'''
|-
|30人未満||1,200円
|-
|30人~39人||1,100円
|-
|40人以上||1,000円
|}
 
こちらは上記の娯楽施設の団体予約表です。
 
{| border="1"
|-
! ||<center>'''A'''<center>||<center>'''B'''<center>||<center>'''C'''<center>
|-
!1
|期日||予約人数||1人当たりの値段
|-
!2
|7月18日||25||
|-
!3
|7月19日||46||
|-
!4
|7月20日||38||
|}
 
まずは40人以上から設定しましょう。C2のセルにIF関数を用います。''40人以上ならば入場料を1,000円にする''ので、以下のように設定します。
 
*'''=IF(C2>=40,"1,000円",)'''
 
ここで偽となった場合、更に2種類の選択肢があります。更に分岐させる場合は1度IF関数を呼び出します。
 
*'''=IF(C2>=40,"1,000円",IF())'''
 
2つ目のIF関数において今度は''30人~39人の入場料は1,100円''を設定していきましょう。既に40人以上の設定は1つ目のIF関数で終わっているので30<=B2<=39と書く必要はなく'''30<=B2'''だけでよいのです。ここで真の場合は30人~39人、偽の場合は29人以下ですので、これで設定は全て終了です。エラーが出る場合は括弧や" "が正しく閉じているかに気をつけましょう。
 
*'''=IF(C2>=40,"1,000円",IF(C2>=30,"1,100円","1,200円"))'''
 
セルに反映してみましょう。4つ以上の場合も偽の場合に更にIF関数を使用することによって分岐できます。ただし、IF関数を同時に使用できるのは64回(Excel2003バージョンは7回)までなことには注意しましょう。
 
{| border="1"
|-
! ||<center>'''A'''<center>||<center>'''B'''<center>||<center>'''C'''<center>
|-
!1
|期日||予約人数||1人当たりの値段
|-
!2
|7月18日||25||1,200円
|-
!3
|7月19日||46||1,000円
|-
!4
|7月20日||38||1,100円
|}
 
====複数の条件がある分岐====
条件が1つでない場合は論理式にAND関数ないしOR関数で複数の条件を記述します。
 
*複数の条件があり''全てが''満たされている場合真となるものは'''AND関数'''
*複数の条件があり''どれか1つでも''満たされている場合真となるものは'''OR関数'''
 
AND関数の例を見てみましょう。以下はある資格試験の点数状況の受験番号の若い人から数人を示したものです。配点は第1問400点・第2問300点・第3問300点とし、合格ラインは全体7割以上かつ各問5割以上です。
 
{| border="1"
|-
! ||<center>'''A'''<center>||<center>'''B'''<center>||<center>'''C'''<center>||<center>'''D'''<center>||<center>'''E'''<center>||<center>'''F'''<center>
|-
!1
|受験番号||第1問<br>(配点400)||第2問<br>(配点300)||第3問<br>(配点300)||全体<br>(満点1000)||判定
|-
!2
|1001A||325||269||172||766||
|-
!3
|1002B||173||260||291||724||
|-
!4
|1003C||232||163||200||595||
|}
 
論理式には合格ラインを入れます。点数の条件が全て合格ライン以上でないと合格にならないため、AND関数を使用します。AND関数は<math> =AND(formula1,formula2,...) </math>で表記します。各formulaには条件式を入れます。
 
この試験の場合は''第1問200点以上・第2問150点以上・第3問150点以上・全体700点以上''の全てを満たせば合格です。
 
*<math> AND(B2>=200,C2>=150,D2>=150,E2>=700) </math>
 
これを条件にしたIF文を記述します。受験番号1001Aの人の判定をしてみましょう。
 
*'''=IF(AND(B2>=200,C2>=150,D2>=150,E2>=700),"合格","不合格")'''
 
受験番号1001Aの人は合格ラインの全てを満たしていたので合格です。
 
{| border="1"
|-
! ||<center>'''A'''<center>||<center>'''B'''<center>||<center>'''C'''<center>||<center>'''D'''<center>||<center>'''E'''<center>||<center>'''F'''<center>
|-
!1
|受験番号||第1問<br>(配点400)||第2問<br>(配点300)||第3問<br>(配点300)||全体<br>(満点1000)||判定
|-
!2
|1001A||325||269||172||766||合格
|-
!3
|1002B||173||260||291||724||
|-
!4
|1003C||232||163||200||595||
|}
 
他の人も見ると受験番号1002Bの人は第1問が下回っていたので不合格、受験番号1003Cの人は全体が下回っていたので不合格となります。
 
{| border="1"
|-
! ||<center>'''A'''<center>||<center>'''B'''<center>||<center>'''C'''<center>||<center>'''D'''<center>||<center>'''E'''<center>||<center>'''F'''<center>
|-
!1
|受験番号||第1問<br>(配点400)||第2問<br>(配点300)||第3問<br>(配点300)||全体<br>(満点1000)||判定
|-
!2
|1001A||325||269||172||766||合格
|-
!3
|1002B||173||260||291||724||不合格
|-
!4
|1003C||232||163||200||595||不合格
|}
 
 
OR関数も同様にして<math> =OR(formula1,formula2,...) </math>で記述します。
 
先程の試験は''第1問200点以上・第2問150点以上・第3問150点以上・全体700点以上の全てを満たせば合格''でした。この合格ラインを逆に見ると''第1問200点未満・第2問150点未満・第3問150点未満・全体700点未満のどれか1つでも満たしてしまうと不合格''になるということです。これを条件にしてみましょう。
 
*<math> OR(B2<200,C2<150,D2<150,E2<700) </math>
 
OR関数が真の時不合格になるわけですから、真偽の振る舞いが先程とは逆になることに注意しましょう。
 
*'''=IF(OR(B2<200,C2<150,D2<150,E2<700),"不合格","合格")'''
 
受験番号1001Aの人の判定に上式を入れても2つ上の表と同じになります。