中心極限定理とは?|統計学で最も重要な法則をわかりやすく解説

統計

この記事はこんな人におすすめ

  • 統計やデータ分析をこれから学びたい方
  • 「平均をとるとなぜ安定するのか」を知りたい方
  • 検定や推定などの統計的手法の根拠を理解したい方
  • ビジネスやAI分野でデータの“確からしさ”を説明したい方

記事の概要

「中心極限定理(Central Limit Theorem)」とは、どんな母集団からデータを取ってきても、平均値の分布は正規分布に近づくという統計学の基本法則です。

これは、統計推論(仮説検定、信頼区間、AIの確率モデルなど)のほぼすべての理論の“支柱”となる考え方です。


🔍 中心極限定理とは?(定義)

中心極限定理とは、
「同じ母集団から多数のサンプルを取り出して平均を計算すると、
その平均の分布はサンプル数が大きくなるにつれて正規分布(ガウス分布)に近づく」
という統計学の法則である。


直感的に理解する「中心極限定理」

例えば──
あなたが1回サイコロを振ると、出る目は1〜6のいずれか(均等な分布)。
しかし、サイコロを30回振ってその平均を取るとどうなるでしょう?

最初はバラバラでも、
平均を何度も取っていくうちに、「3.5の周り」に山型の分布(正規分布)が現れます。

つまり:

  • どんな分布のデータでも(偏っていても)
  • 平均を取ることで
  • 「きれいな正規分布」に近づいていく。

これが 中心極限定理の“魔法” です。


例:ビジネスでの応用イメージ

分野応用例中心極限定理の役割
マーケティング顧客単価の平均を予測サンプルから全体の傾向を推定
品質管理製品の重量やサイズのばらつき分析平均が安定すれば品質が一定と判断
医療臨床試験データの効果推定少数の実験結果を全体へ一般化
金融リスクの分布をモデリング取引結果の平均リターンが安定する理由を説明

中心極限定理の有用性

サンプルの平均値を正規分布に従うものとして考えることができること。
サンプルから、元の集団の平均値(真の平均値)及びそのばらつきを推定することができます

定理なので、演繹法として思考が展開できることは便利です。
ただし、数をとる必要があります。その数はまず目安はサンプル数1000としています。

この数が取れないときに使えるのがベイズ統計です。

中心極限定理と大数の法則の違い

項目中心極限定理大数の法則
焦点平均の“分布の形”平均の“収束の事実”
結果正規分布に近づく真の平均に近づく
多くの標本平均のヒストグラムを描くサンプル数を増やすと平均が安定

歴史と理論背景

  • 1733年:アブラアム・ド・モアブルが二項分布と正規分布の関係を発見
  • 1810年:ピエール=シモン・ラプラスが一般化し、「中心極限定理」として定式化
  • 1930年代以降:確率論的厳密性が強化され、現代統計の礎に

アブラアム・ド・モアブル

ピエール=シモン・ラプラス

画像はWikipediaより。

参考動画

ヨビノリさんの解説はわかりやすく理解が進むと思いますのでぜひご覧ください。

コメント

タイトルとURLをコピーしました