定義
統計学において、調査・分析の対象となる全ての要素(個体・観測値)の集合。
サンプル(標本)はこの母集団の一部を抜き出したもの。
特徴
母集団全体を完全に把握できれば、推測の必要はなく「記述統計」だけで全体像を捉えられる。
実際には母集団が膨大・未知であることが多く、標本調査が行われる。
使いどころ
記述統計でも、母集団全体を集計して「母平均」「母分散」を直接計算するケース(国勢調査など)。
推測統計では、「母集団から標本を取り、母数を推定する」過程が生じる。
応用例
国勢調査で全国民をカバーできれば、それが日本の“母集団”データ。
企業のデータベースに登録された全顧客が母集団という場合も。
留意点
母集団の定義が曖昧だと、分析結果の解釈範囲が曖昧になる。
ビッグデータの時代でも全てのデータを集めているとは限らず、「母集団の何%をカバーしているか」を意識することが大事。