こんにちは!皆さんは「正規分布」という言葉を聞いたことがありますか?なんだか難しそう…と思うかもしれませんが、実は私たちの身近なところで大活躍している、とっても便利な考え方なんです。今回は、製造業の品質管理を例に、正規分布の基本とその使い方を分かりやすく解説します。
正規分布の基本:平均とバラつきで決まる「釣鐘型」の不思議
正規分布とは、自然現象や社会現象で最もよく見られるデータの分布パターンの一つです。その形は、まるで教会の鐘のような美しい釣鐘型をしています。Licensed by Google
この釣鐘型の形は、たった2つの数字、平均と分散(または標準偏差)で決まります。
- 平均(μ): データの中心を示す値です。釣鐘型のてっぺん、一番高いところに位置します。
- 分散(σ²): データのバラつき具合を示す値です。この値が小さいほどデータは平均値にギュッと集まり、グラフの山は高く細くなります。逆に、大きいほどデータは広く散らばり、山は低く平らになります。
正規分布の面白いところは、この2つの数字さえ分かれば、全体の分布が完全に決まってしまう点です。また、どんなにパラメータを変えても、その形は必ず一山型になります。二つの山を持つような形にはならないんです。
特に、平均が0、分散が1の正規分布は「標準正規分布」と呼ばれ、データ分析の世界では基準としてよく使われます。
驚きの応用!正規分布で不良品数を予測してみよう
さて、この正規分布の知識が、どうして製造業の品質管理に役立つのでしょうか?
ある製品の重さが、平均100gで、バラつきが正規分布に従うとします。このとき、「平均値±2×標準偏差」の範囲を製品の合格基準(規格)と決めた場合、どれくらいの不良品が出るか予測できるんです。
実は、正規分布には有名な経験則があります。
- データの約95.45%が「平均値±2×標準偏差」の範囲に収まる
- データの約99.73%が「平均値±3×標準偏差」の範囲に収まる
これを利用して不良品率を計算してみましょう。
ケース1: 規格が「平均値±2×標準偏差」の場合 この範囲内に収まるのは全体の約95.45%です。ということは、この範囲から外れる不良品は、100%−95.45%=4.55% 発生します。 1,000個生産したとすると、1000×0.0455=45.5 個。つまり、約46個の不良品が出ることになります。
ケース2: 規格が「平均値±3×標準偏差」の場合 さらに厳しい規格にすると、不良品率はぐっと下がります。この範囲外に出る不良品はわずか$100% – 99.73% = 0.27%$です。 10,000個生産しても、10000×0.0027=27 個。約27個しか不良品が出ません。
この計算からわかるように、規格をより厳しく(つまり、平均値からの許容範囲を広げる)することで、不良品を劇的に減らすことができるのです。
✨ 基礎知識:正規分布の「5つの重要性質」
正規分布に関する問題を解く前に、その基本的な特徴を把握しておきましょう。
| No. | 性質 | 説明 |
| 1 | 分布の決定要因 | 平均値 (μ) と 標準偏差 (σ) の2つのパラメーターで分布の形状が完全に決まる。 |
| 2 | 形状 | 平均値を中心として左右対称の釣鐘型(ベルシェイプ)である。 |
| 3 | 68%ルール | 平均値±(1×標準偏差) の範囲内に、全データの**約68.3%**が含まれる。 |
| 4 | 95%ルール | 平均値±(2×標準偏差) の範囲内に、全データの**約95.4%**が含まれる。 |
| 5 | 99.7%ルール | 平均値±(3×標準偏差) の範囲内に、全データの**約99.73%**が含まれる。 |
💡 σ区間の確率は「語呂合わせ」で暗記!
特に重要となる$\sigma$区間の確率は、語呂合わせでまとめて暗記しましょう!
| シグマ数 | 含まれる確率 | 語呂合わせ |
| ±1σ | 68% | ロック(6) はち(8) |
| ±2σ | 95% | キュー(9) ゴー(5) |
| ±3σ | 99.7% | キュー(9) キュー(9) なな(7) |
- まとめて覚える:「1σは68(ロックはち)、2σは95(キューゴー)、3σは99.7(キューキューなな)」
標準正規分布表の「読み方」は必須スキル!
正規分布に関する問題を解く上で、標準正規分布表の正確な読み取りは、まさに必須スキルです。
📊 KpとPの対応関係を理解する
| 項目 | 説明 |
| 縦軸 | Kp(標準化した値)の小数第一位までを示します。 |
| 横軸 | Kpの小数第二位を示します。 |
| 交差する値(P) | 縦軸と横軸の値を合算した**Kpに対応する確率(P)**です。 |
➡️ 表が示すのは「右側確率(上側確率)」
最も重要な点は、記載された確率Pは、Kp値がその値「以上」になる確率、つまり**右側確率(または上側確率)**を表しているということです。
左右対称性を利用する「変換テクニック」
標準正規分布表には、Kpが0より小さい値の確率は記載されていません。これは、正規分布が左右対称であるという性質を利用して、自分で計算(変換)する必要があるからです。
1. 左側確率を求める場合
例:P(Kp≤−1)=P(Kp≥1)
2. 範囲の確率を求める場合
ある範囲の確率 P(a≤Kp≤b) は、右側確率の引き算に置き換えて計算します。P(a≤Kp≤b)=P(Kp≥a)−P(Kp≥b)
まとめ
正規分布は、一見複雑な数式で表されますが、「平均」と「バラつき」というシンプルな概念で、データの特性を捉える強力なツールです。品質管理だけでなく、マーケティングでの顧客分析や、医療分野での効果測定など、さまざまな分野で応用されています。
皆さんも身の回りのデータが、もしかしたら正規分布に従っているかもしれません。ぜひ、探してみてくださいね!
