中学数学3年 標本調査
母集団と標本
編集選挙の前などに、有権者の何人かの意見を調査して選挙の結果を事前に予想することがある。このように、集団の一部分を調べることによって全体の傾向を予想することを考えてみよう。
全数調査と標本調査
編集調査の対象となっている集団全部のものについて調査することを全数調査(ぜんすうちょうさ)という。
たとえば、日本の国勢調査(こくせい ちょうさ)は、全数調査である。
しかし、かならずしも全数調査が、適切な調査方法とは限らない場合もある。
たとえば、ある湖の水質調査は、ふつう、全数調査は不可能である。(その湖のすべての水を検査所まで持ち運ぶのは無理であるし、たぶん検査所よりも湖のほうが大きい。)
他の例でも、たとえば食品の缶詰(かんづめ)の中身が安全であるかを確かめる場合など、調べるために商品を消費しなくてはならないような場合には、もし全数調査をしては出荷できる商品がなくなってしまう。
なので、このような場合、調査対象から一部を取り出して調査して、調査の結果から、全体の性質を推定します。
このように集団の一部分を調査して全体を推定する調査を標本調査(ひょうほんちょうさ)という。
- 例
- 学校での健康診断は、学校に所属する学生全員を対象とするので、全数調査
- テレビの視聴率は、対象者を選んで調査するので、標本調査
母集団と標本
編集標本調査を行うとき、調査する対象の集団全体を母集団(ぼしゅうだん)という。
母集団の一部分として母集団から取り出されたものを標本(ひょうほん)といい、取り出した資料の個数を標本の大きさという。
- 例
- ある都市の有権者102749人から、5000人を選び出して世論調査を行った。
- この調査の母集団はある都市の有権者、標本は選び出された有権者、標本の大きさは5000である。
無作為に抽出する
編集母集団から標本を取り出すことを 「抽出」(ちゅうしゅつ) といいます。
標本調査を行うときは、その標本の性質から母集団の性質を推定するのが目的であるから、かたよりがないように選ばなければならない。例えば、100人から20人を選ぶとき、くじ引きなどを使って選ぶことがある。
母集団から かたよりなく 標本を選び出すことを無作為に抽出するという。
無作為に抽出する方法には、次の方法などがある。
- 乱数さいを使う方法
- 乱数さい(らんすうさい)には、正20面体の各面に0~9までの数字が2度ずつ書き込まれている。普通のさいころと同様、どの数字が出る確率も等しくなっている。
- 乱数表を使う方法
- 乱数表(らんすうひょう)は、0から9までの数字を不規則に並べた表で、どの数字が現れる確率がどの方向をとっても になるように作成されたもの。
- 表計算ソフトウェアを使う方法
- コンピュータの表計算ソフトウェアで
=INT(RAND()*<発生させたい最大の数>)+1
、もしくは=RANDBETWEEN(1,<発生させたい最大の数>)
と入力することで発生できる。
1936年のアメリカ大統領選挙では、民主党(みんしゅとう)のフランクリン・ルーズベルト氏 と 共和党(きょうわとう)のランドン氏 が立候補し、候補者として、あらそっていました。
当時の有名な週刊誌である L誌(『リテラリィ・ダイジェスト』)は、選挙結果の予想のために、電話や自動車をもっている有権者を対象に、なんと1000万人もの多数の人を対象にアンケートを実施し、200万人あまりの人から回答を回収できました。
そして、そのアンケートの結果から、ランドン氏が勝利するだろうとL誌は予想しました。
しかし、実際の選挙が行われると、予想は外れ、選挙結果はルーズベルト氏の圧勝で、ルーズベルトが大統領に当選しました。
では、なぜ、予想が外れたのでしょうか?
その原因のひとつは、当時、電話や自動車は高額なものであり、多くの人は電話も自動車も買えなかったので、予想の標本とされた集団が高所得者に かたよっていたのです。
つまり、標本調査のさいの標本の抽出が、無作為(むさくい)な抽出には、なっていなかったのです。
いっぽう、選挙前に、L誌の出版社とは別の出版社 G社 も世論調査を行いました。G社の実施したアンケートは、たった3000人を対象にしたアンケートでした。しかし、G社はその3000人へのアンケートにより、選挙前に、ルーズベルトが圧勝するだろうと予想しました。そして、G社のその予想どおり、ルーズベルトは圧勝したのでした。
G社は、標本のかたよりを防ぐために、工夫をこらして、アンケート者を選んだので、たった3000人のアンケートでも、予想を当てることができたのです。
そもそも国勢調査とは、
日本国内の人口や世帯の実態を知るための調査で、国内のすべての住民を対象に行われる調査です。(子供が国勢調査に記入しないのは、親や保護者が代わりに記入してあげてるからです。)
国勢調査は5年ごとに行われます。
国勢調査は、集計が出るまで時間がとても掛かり、1年以上もの時間が掛かります。(※ 日本文教出版の検定教科書が、1年以上掛かる と言っている。)
ですので、もっと早く国勢調査の結果を利用したい人のために、国勢調査でも、標本調査が行われ、全体の100分の1の標本から算出した結果を速報値として発表しています。
母集団の平均値の推定
編集母集団から取り出した標本の平均値を標本平均(ひょうほんへいきん)という。
下の資料は、あるクラスの生徒30人の通学時間の調査である。
番号 | 通学時間(分) | 番号 | 通学時間(分) | 番号 | 通学時間(分) | ||||||
1 | 11 | 11 | 3 | 21 | 13 | ||||||
2 | 16 | 12 | 13 | 22 | 22 | ||||||
3 | 5 | 13 | 28 | 23 | 19 | ||||||
4 | 23 | 14 | 16 | 24 | 16 | ||||||
5 | 4 | 15 | 14 | 25 | 23 | ||||||
6 | 19 | 16 | 13 | 26 | 8 | ||||||
7 | 22 | 17 | 29 | 27 | 6 | ||||||
8 | 21 | 18 | 15 | 28 | 17 | ||||||
9 | 11 | 19 | 12 | 29 | 20 | ||||||
10 | 16 | 20 | 7 | 30 | 15 |
この資料から5人分を選んで平均値を求め、母集団の平均値を推定してみよう。
たとえば、無作為に抽出した5、11、13、23、28の5人の平均を出してみる。
この5人の標本平均は
- (分)
となる。
もっと標本の数を多くして10人を選んで平均値を求め、母集団の平均値を推定してみよう。
たとえば、無作為に抽出した2、6、10、12、14、15、21、23、24、30の10人の平均を出してみる。
この10人の標本平均は
- (分)
となる。
母集団30人の平均値は
- (分)
となる。
母集団の平均値は、標本平均から推定することができる。
標本の数が大きいほど母集団の平均値に近づいていき、母集団の平均値との差も小さくなっている。
母集団の数量の推定
編集母集団の数量を推定するには、標本調査で得られた数量の割合を母集団の数量の割合と考えればよい。
- 例題1
- 袋の中に白玉と赤玉が合わせて160個入っている。これをよくかき混ぜて24個取り出したところ、その中に白玉が15個入っていた。袋の中には、白玉はおよそ何個入っていると考えられるか。
160個の母集団から無作為に抽出された標本の大きさは24である。
標本における白玉の比率は である。
したがって、母集団における白玉の比率も であると推定することができる。
すなわち、白玉の総数は、およそ
- (個)
であると考えられる。
- 例題2
- ある池からコイを50匹捕まえて印をつけ、もとの池に戻した。数日後、再びコイを50匹捕まえたところ、印のついたコイが7匹含まれていた。この池には、およそ何匹のコイがいると考えられるか。
母集団(池の中のコイの数) の数を推測する。
(池の中のコイの数) : (印をつけたコイの数50) = (取り出したコイの数50) : (印のついたコイの数7)
と考えることができるから、
(池の中のコイの数)
(池の中のコイの数)
よって、およそ360匹いると考えられる。
コンピュータの活用
編集Microsoft Excel や Google スプレッドシート、 LibreOffice Calc などの表計算ソフトによって統計データの処理をすることが出来る。これらの表計算ソフトでは、平均値の計算や乱数の生成、グラフの作成などの機能がある。例えば、関数 RAND を実行することで0以上1未満のランダムな実数を生成することが出来る。無作為を英語で random (ランダム)というのが、Rand の由来です。