統計を理解するためには、まず基本概念を知る必要があります。
本記事では統計の基礎となる「データ」「尺度」「変数」「母集団」「標本」について解説します。
データとは
データとは測定により得たもののことをいいます。
質的データ qualitative data
数値を得ることができない、ある状態がわかるデータのことを言います。
例、アンケートなどの「思う」「思わない」「どちらでもない」などの言語系。
量的データ quantitative data
取り得るデータ値が数直線上の値である数量的なデータのことをいい、化学分析ではこれを扱います。
例、温度や重量などの数値で表したもの。
1次元データ 1-dimensional data
1つのものに対して1つのデータが得られたデータのことをいいます。
例、東京都の気候として気温のみを測った場合など。
多次元データ multi- dimensional data
1つのものに対して2つ以上のデータが得られたデータのことをいい、検量線はこれに該当します。
濃度と強度など2つの場合を2次元データ、3つの場合を3次元データと言います。
例、東京都の気候として気温と湿度を測った場合を2次元データ、これに気圧を加えると3次元データとなります。
時系列データ time series data
時間の変化に対して得られたデータのことをいい、分析装置の精度管理などで扱います。
例、東京都の年間の気温の推移など。
尺度とは
データにはその性質にとって4つの尺度に分類することが出来ます。
名義尺度 nominal scale
区別しかなく、順序もない。分類のみ可能なもの。
例、アンケートなどの「思う」「思わない」「どちらでもない」などの言語系。
順序尺度 ordinal scale
区別と順序がある。分類・累積が可能なもの。
例、学校の通知表などの5段階評価など。
間隔尺度 interval scale
差の大きさに意味があるが比に意味がない。加算・減算が可能なもの。
例、温度など(20℃は10℃の2倍熱いとは言わない、但しケルビンで表した場合は比率尺度となる)
比率尺度 ratio scale
差・比に意味がある。加算・減算・乗算。除算が可能なもので、化学分析での測定値はこれに該当します。
また「0(ゼロ)」が存在するのも特徴です。
例、長さ・重さなど。
精度順
これらの尺度には精度の順番があり、統計的な計算ができるものほど精度は上がります。
比率尺度 > 間隔尺度 > 順序尺度 > 名義尺度
変数(variable)とは
変数とは状態や数値が変化するものことをいいます。
離散変数 discrete variable
対象を何らかの特性に応じて区分するため、測定値の境界線を明確にできないもの。
- 順序づけ不可能な離散変数 nonorderable discrete variable
例、アンケートなどの「思う」「思わない」「どちらでもない」など順番がなく、中間を表せないもの。
- 順所づけ可能な離散的変数 orderable discrete variable
例、学校の通知表などの5段階評価など順番はあるが、中間を表せないもの。
連続変数 continuous variable
対象の状態を数量や大小・高低などで表すもので、化学分析での測定値はこれに該当します。
例、長さや重さ、時間など常に連続したもの。(時間はいきなり1分から2分にはならない、必ず間には1秒、2秒と刻みがある)
母集団(population)とは
調査・測定の対象全体であり本来知りたいもののことをいいます。
ほとんどの場合は測定不可能です。
例、料理に例えると鍋の中身すべてを指す。
標本(sample)とは
母集団から一部を抽出したもののことをいい、一部を取り出して測定します。
例、料理に例えると料理中に鍋の中身の一部を味見用で採った(サンプリングした)おたまの中身を指す。
母集団と標本の関係
測定においては通常知りたいものは母集団です。
ですが、前記のように料理に例えると鍋の中身すべての味(母集団)を知るためには中身すべてを食べて味を確認する必要があります。
当然、すべて食べれば鍋の中身すべての味(母集団)を知ることはできますが、鍋の中身が空っぽになってしまい料理を食卓に出すことが出来なくなります。そのため、一部(標本)をお玉などで採って(サンプリング)味を確認し、鍋の中身すべての味(母集団)を確認(推定)します。
これを化学分析の考え方に直すと、大量の排水全体(母集団)の測定値がほしいが多すぎて測定でできません。なので、一部(標本)を採って(サンプリング)その測定値を大量の排水全体(母集団)の測定値とするということになります。
ただし、排水は均一と仮定する必要があります。
※国勢調査は全数調査のため、全国民を調査(測定)し、国内(母集団)を直接調査(測定)しています。
母集団を直接測定する方法を全数調査といい、標本を用いた調査を標本調査・サンプル調査といいます。

コメント