「旧課程(-2012年度)高等学校数学B/統計とコンピューター」の版間の差分

削除された内容 追加された内容
M編集の要約なし
M編集の要約なし
12 行
*第7章「表計算(実践編)」では実際の表計算で知っていれば便利な項目を紹介しています。
 
教科書の中には[[高等学校数学B/数列|数列]]を既習としているものもありますが、ここではできるだけ<math> \sum </math>(和の記号で、シグマと読みます)の記号を使わないように配慮しています。
 
この分野が基礎になる科目は[[高等学校数学C 統計処理|数学Cの統計処理]]があります。統計に加えて[[高等学校数学C 確率分布|確率]]・[[高等学校数学B/数列|数列]]・[[高等学校数学II 微分・積分の考え|微積分]]の知識もある程度必要となります(特に確率)。
 
表計算のセクション(第6章・第7章)は予め各自使用している表計算ソフトの操作を知っておくとスムーズに学習が進められます。このページではMicrosoft Excelの書式に基づいています。実践編は表計算入門の記事を兼ねていますので余力があればとりかかってみて下さい。
122 行
それぞれの階級以下、または階級以上の度数を全て加えた和を'''累積度数'''といい、それを表にまとめたものを'''累積度数分布表'''と言う。
 
[[高等学校数学B/統計とコンピューター#資料の分布|資料2]]を例に取ると、
 
*資料3
152 行
それぞれの階級の度数を資料の個数で割った値をその階級の'''相対度数'''といい、それを表にまとめたものを'''相対度数分布表'''と言う。相対度数分布表では各階級の相対度数の総和は1となる。
 
[[高等学校数学B/統計とコンピューター#資料の分布|資料2]]を例に取ると、
 
*資料4
204 行
|}
 
例えば、[[高等学校数学B/統計とコンピューター#資料の分布|資料1]]の平均値は
:<math>
\frac{60.3+57.9+65.4+56.1+53.6+62.7+70.0+55.8+67.1+63.1} {10} = 61.2 (kg)
233 行
|}
 
例えば、[[高等学校数学B/統計とコンピューター#資料の分布|資料2]]の平均値は
:<math>
\frac{53.5 \times 1 + 56.5 \times 3 + 59.5 \times 1 + 62.5 \times 2 + 65.5 \times 1 + 68.5 \times 1 + 71.5 \times 1} {10} = 61.3 (kg)
252 行
を'''仮平均'''と言う。
 
[[高等学校数学B/統計とコンピューター#資料の分布|資料2]]の平均値をこれを用いて計算してみる。基準を62.5(kg)として計算をしてみると、
:<math>
\frac{(53.5-62.5) \times 1 + (56.5-62.5) \times 3 + (59.5-62.5) \times 1 + (62.5-62.5) \times 2 + (65.5-62.5) \times 1 + (68.5-62.5) \times 1 + (71.5-62.5) \times 1} {10} + 62.5 = 61.3 (kg)
261 行
資料を大きさの順に並べた時、中央の順位にくる数値をその資料の'''中央値'''または'''メジアン'''と言う。資料が偶数個の場合(例の場合は5番目と6番目にあたる)は中央に2つの値が並ぶので、その場合は2つの数値の相加平均を中央値とする。外れ値(階級が他のものと極端に離れている値)がある資料に対しては平均値より中央値のほうが代表値としては適している。
 
例えば、[[高等学校数学B/統計とコンピューター#資料の分布|資料1]]の中央値は<math> \frac { 60.3 + 62.7 } {2} = 61.5(kg) </math>となる。
 
また、[[高等学校数学B/統計とコンピューター#資料の分布|資料2]]の中央値は<math> \frac { 59.5 + 62.5 } {2} = 61.0(kg) </math>である。
 
===最頻値===
度数分布表において度数が最大である階級値をその資料の'''最頻値'''(さいひんち)または'''モード'''と言う。最頻値はどのサイズがよく売れているかなどを判断するにはいい目安である。
 
例えば、[[高等学校数学B/統計とコンピューター#資料の分布|資料2]]の最頻値は56.5(kg)である。
 
====所得の分布(コラム)====
287 行
資料が取る最大値から最小値を引いた値をその資料の分布の'''範囲'''(はんい)と言う。
 
例えば、[[高等学校数学B/統計とコンピューター#資料の分布|資料1]]の範囲は<math> 70.0 - 53.6 = 16.4</math>(kg)となる。
 
===四分位数===
293 行
下位から75%に当たる数値を'''第3四分位数'''と言われる。下位から50%に当たる数値は'''第2四分位数'''と言うこともできるが、'''中央値'''と同義である。
 
[[高等学校数学B/統計とコンピューター#資料の分布|資料1]]の四分位数を求めてみよう。まずは資料を昇順に並びかえる。
*資料5
<table border="1">
332 行
第3四分値と第1四分値の差の半分のことをその資料の'''四分位偏差'''と言う。
 
[[高等学校数学B/統計とコンピューター#資料の分布|資料1]]の四分位偏差は<math> \frac { 65.4 - 56.1 } {2} = 4.65(kg) </math>となる。
 
===偏差===
345 行
を、それぞれ平均値からの'''偏差'''(へんさ)という。
 
[[高等学校数学B/統計とコンピューター#資料の分布|資料1]]で、平均値からの偏差は次のようになる。
 
*資料6
423 行
|}
 
[[高等学校数学B/統計とコンピューター#資料の分布|資料1]]の分散と標準偏差を求めよう。
 
*資料7
536 行
 
 
この式を使って、[[高等学校数学B/統計とコンピューター#資料の分布|資料1]]の分散を求めよう。
 
<math>x^2</math>の平均は
558 行
 
===相関図===
以下の資料8は[[高等学校数学B/統計とコンピューター#資料の分布|資料1]]に身長の値を加えたものである。
 
*資料8
712 行
*相関係数rの値が0に近いときは、相関は弱くなる。
 
ではこれを用いて[[高等学校数学B/統計とコンピューター#相関図|資料8]]の相関関係を見てみよう。
 
*資料9
881 行
 
===グラフの作成===
以下の表は[[高等学校数学B/統計とコンピューター#資料の分布|資料2]]を表計算ソフトに入力したものである。ただし階級は、52.0kg以上55.0kg未満の階級のことを52.0-55.0などと表すことにする。セルに入る文字が長くデフォルトの大きさで収まらない場合、セルの大きさを調節して表を見やすくしてみよう。グラフの作成の仕方を以下に示す。
#グラフの元になるデータの左上のセルから右下のセルまでドラッグし、選択させた状態にする。
#ヒストグラムが書いてあるアイコンをクリックし、グラフウィザードを起動させ、グラフの種類を選択する。
936 行
</tr>
</table>
*実習3:表計算ソフトに上記の表を作成してみよ。また、グラフ作成機能を用いてヒストグラムと度数折れ線を作成してみよ。この時、B列・C列さえあればグラフは作成できる。完成すると上のほうの「[[高等学校数学B/統計とコンピューター#資料とグラフ|資料とグラフ]]」に挙げたようなグラフになるはずである。
*'''注意'''
度数折れ線は''左右両端に度数が0である階級があるものとして作図をする''と前に述べた。故にこのグラフを表計算ソフトで作成する場合は表2の2行の前の行に階級値が50.5であるもの、8行の後の行に階級値が74.5であるもの(それぞれ度数は0)を事前に挿入しておかなければならない。
1,212 行
 
===相関係数===
以下の表4は[[高等学校数学B/統計とコンピューター#相関図|資料7]]を表にしたものである。ここでは今まで学んだことを用いて全ての空欄を埋めて欲しい。13行は表の見やすさのために空けてある。いくつかのセルは結合されているがその手順を以下に示す。以下の例ではA1・A2のセルを結合させる場合を考える。
#A1のセルからA2のセルに向けてドラッグ(逆方向にドラッグしてもよい)し、2つのセルを選択させた状態にする。
#選択された範囲内で右クリックし、「セルの書式設定>配置>文字の制御」の「セルの結合」の部分にチェックマークを入れる。