「数える」データを
統計的判断に変える
計数値の検定・推定ガイド
「不良品が減った気がする」を「統計的に証明できる」へ。不良品の個数・キズの数を使った検定手法を、記号の意味からひとつずつ丁寧に解説します。平均・分散がわかれば大丈夫です。
計数値データとは?なぜ統計的検定が必要なのか
計数値データとは、「数えることができるデータ」のことです。「今日の不良品は3個」「この製品のキズは2か所」のように、整数で表せるデータが該当します。重さや長さのように連続した値をとる「計量値データ」とは区別します。
計数値データには、さらに2種類あります。「良品か不良品か」のように結果が2択になるデータと、「キズが何個あるか」のように個数を直接数えるデータです。この違いが、後で使う計算式の選択に直結します。
なぜ「ただ数えるだけ」では不十分なのか
たとえば、先月の不良率が3.2%、今月が2.8%になったとします。「下がった!改善できた!」と思いたいところですが、少し立ち止まって考えてみましょう。
100個のうち3個だった不良品が、次の100個では2個になっただけかもしれません。これは、改善した結果ではなく、たまたまサンプリングの「運」で変わっただけの可能性があります。統計的検定を使うと、「この変化は偶然の範囲内か、それとも本当に変わったのか」を数値で判断できます。
この記事で学ぶ内容(試験対応表)
QC検定2級では以下の手法が「○レベル(計算手順を習得)」として求められます。この記事ではすべてを順番に学んでいきます。
| 項目 | レベル | 求められること |
|---|---|---|
| 母不適合品率の検定・推定 | ○ | 二項分布の理解、正規近似の条件、検定・推定の手順 |
| 2つの母不適合品率の差 | ○ | 2工程の比較、共通不適合品率 p̄ の使い方 |
| 母不適合数の検定・推定 | ○ | ポアソン分布、単位あたり不適合数 c̄ の扱い |
| 2つの母不適合数の違い | ○ | 観測単位が異なる場合の比較方法 |
| 分割表による検定 | ○ | 2×2分割表、期待度数の計算、カイ二乗分布の利用 |
◎:実務で自力適用できる ○:計算手順を習得している △:用語を理解している
2つの確率分布を正しく使い分ける
計数値データには、大きく分けて2つのタイプがあります。タイプによって使う計算式(確率分布)が変わります。最初にこの分類を確実に理解しましょう。
迷ったときの判断基準:「製品1個について良否を判定している?」→ 二項分布。「製品1個(または1ロット)の上にある欠点・キズの数を数えている?」→ ポアソン分布。
不適合品率データ
→ 二項分布を使う
- 1個ずつ「良品 or 不良品」と判定する
- 例:電子部品が動く/動かない
- 例:成形品の寸法が規格内/規格外
- 管理する値:母不適合品率 P(全体の中で不良品が占める割合)
不適合数データ
→ ポアソン分布を使う
- 製品の表面や一定の範囲にあるキズ・欠点を数える
- 例:塗装面1枚あたりのキズの個数
- 例:1日あたりの機械の故障回数
- 管理する値:母平均不適合数 m(単位あたりの平均欠点数)
2つの分布を比べてみる
混同しやすいので、類似点と相違点を整理します。
| 比較項目 | 二項分布 | ポアソン分布 |
|---|---|---|
| 何を数えるか | 不良品の「個数(件数)」 | 欠点・キズの「個数」 |
| 1回の観測の結果 | 良品 or 不良品(2択) | 0個、1個、2個…(上限なし) |
| 管理する統計量 | 不適合品率 P(割合) | 平均不適合数 m(個数) |
| 主な現場例 | 部品の合否判定、外観検査 | 塗装のキズ、布の織りムラ |
| 正規近似の条件 | nP≥5 かつ n(1−P)≥5 | m≥5 |
| 検定で使う統計量 | u₀(正規分布の値) | u₀(正規分布の値) |
正規近似とは?なぜ条件が必要なのか
二項分布やポアソン分布は、そのまま計算するととても複雑です。しかし、データ数が十分に多いと、これらの分布は正規分布(なだらかな釣り鐘型の分布)に近い形になります。これを「正規近似」と呼びます。
正規近似が使えると、計算が大幅にシンプルになります。ただし、データが少なすぎると正規分布の形にならないため、近似を使う前に以下の条件を必ず確認します。
// 「不適合品の期待個数」と「適合品の期待個数」が両方5以上あること
// 例:n=500, P=0.05 なら nP=25≥5, n(1-P)=475≥5 → OK
ポアソン分布の近似条件: m ≥ 5
// 単位あたりの平均欠点数が5以上あること
母不適合品率の検定と推定
「改善後の不良率は本当に下がったか?」を判断する、最も基本的な手法です。まず記号の意味を確認してから、5つのステップを順番に追っていきます。
p(小文字):標本不適合品率。実際にサンプルを調べて計算した不良率(= 不良品数 ÷ サンプル数)。
n:サンプルサイズ(調べた製品の個数)。
P₀:比較の基準になる不良率。「改善前」や「目標値」がここに入る。添字の「0」は「基準」を表す。
検定の5ステップ
まず「何と比べるか」を2つの仮説として宣言します。
H₀(帰無仮説):P = 0.051 ←「変化していない」という前提。H は Hypothesis(仮説)の頭文字。添字の「0」は「捨てたい仮説(帰無)」を意味します。
H₁(対立仮説):P < 0.051 ←「改善した(不良率が下がった)」という主張。
今回は「下がったかどうか」だけを調べるので、片側(左側)検定を選びます。もし「変化があるかどうか(上がっても下がっても)」なら両側検定になります。
有意水準 α(アルファ)= 0.05。これは「5%の確率で起こりうる誤り(偶然の差を本物と判断するリスク)まで許容する」という意味です。
左片側検定・α = 0.05 の棄却限界値 u(0.05) = 1.645(正規分布表から読み取る値)
nP₀ = 500 × 0.051 = 25.5 ≥ 5 ✓
n(1−P₀) = 500 × 0.949 = 474.5 ≥ 5 ✓
両方5以上なので、正規近似を使って計算できます。
この式は「サンプルの不良率 p が、基準 P₀ からどれだけ離れているか」を、バラツキ(√内)で割って標準化した値です。絶対値が大きいほど、差が偶然では説明しにくいことを意味します。
= (0.032 − 0.051) / √(0.051 × 0.949 / 500)
= −0.019 / √(0.04839 / 500)
= −0.019 / √0.00009678
= −0.019 / 0.00984 ≈ −1.931
|u₀| = 1.931 > 1.645 → 棄却限界値を超えた。H₀を棄却します。
(この差が偶然起こる確率は5%未満)
推定:「真の不良率はどのくらいか」を区間で表す
検定では「差があるかないか」しかわかりません。推定を行うと、「真の不良率はおそらくこの範囲に収まる」という信頼区間が求められます。推定では母数値 P₀ ではなく、サンプルから得た p を使って標準誤差を計算します。
= 0.032 ± 1.96 × √(0.032 × 0.968 / 500)
= 0.032 ± 1.96 × √(0.030976 / 500)
= 0.032 ± 1.96 × √0.000061952
= 0.032 ± 1.96 × 0.00787
= 0.032 ± 0.015
結果:[0.017, 0.047] (1.7%〜4.7%)
2つの母不適合品率の差の検定と推定
「ラインAとラインBで不良率に差があるか?」など、2つの工程・条件を比較するときに使います。
ポイント:共通不適合品率 p̄ を使う
検定では「2つの不良率は等しい(差はない)」と仮定します。そのため、両者を合わせた共通の p̄ を計算して使います。
検定統計量:
|u₀| = |pₐ − p_b| / √(p̄(1−p̄) × (1/nₐ + 1/n_b))
ラインB:n=350, 不適合品16個(p=0.0457)
有意差はあるか?(両側検定、α=0.05)
① 共通不適合品率:p̄ = (13+16) / (400+350) = 29/750 = 0.0387
= 0.0132 / √(0.0001990)
= 0.0132 / 0.0141 ≈ 0.936
現在のサンプルサイズでは2ラインの差を検出できなかった
推定:差の信頼区間
推定では p̄ ではなく、各群の分散を独立に扱い、加法性を使って標準誤差を求めます。
= −0.0132 ± 1.96 × √(0.0314/400 + 0.0436/350)
= −0.0132 ± 1.96 × 0.0143
= −0.0132 ± 0.0280
結果:[−0.0412, 0.0148]
母不適合数の検定と推定
製品1単位あたりのキズ数・故障回数など、ポアソン分布に従うカウントデータを扱います。
キーワード:平均不適合数 c̄ = c/n
観測単位(台数・長さ・面積など)が変わっても公平に比較するために、「単位あたり」に換算した c̄(cバー) を使います。
u₀ = (c̄ − m) / √(m/n)
// m: 基準となる母平均不適合数
改善後 n = 10日間で平均 c̄ = 5.0回になった。
変化したと言えるか?(両側検定、α = 0.05)
= (5.0 − 7.0) / √(7.0/10)
= −2.0 / √0.70
= −2.0 / 0.836 ≈ −2.39
紙切れ回数は統計的に有意に変化した(減少した)
推定(95%信頼区間):
= 5.0 ± 1.96 × 0.707 = 5.0 ± 1.39
結果:3.61 ≤ m ≤ 6.39
2つの母不適合数の違いの検定と推定
観測単位(台数・面積など)が異なる2ラインのキズ数を比較します。
検定統計量:
u₀ = (c̄ₐ − c̄_b) / √(c̄ × (1/nₐ + 1/n_b))
ラインB:20台で100個のキズ(c̄_b = 5.0)
有意差はあるか?
共通の平均:c̄ = (80+100)/(10+20) = 180/30 = 6.0
= 3.0 / √(6.0 × 0.15)
= 3.0 / √0.90
= 3.0 / 0.949 ≈ 3.16
分割表によるカイ二乗検定
2つの属性に関連があるかどうかを調べます。「作業形態と不良発生の関係」のようなカテゴリー×カテゴリーの分析に強力な手法です。
例題:作業形態と不良の関連
| 作業形態 | 良品 | 不良品 | 計 |
|---|---|---|---|
| 立ち作業 | 751(a) | 49(b) | 800(T₁) |
| 座り作業 | 967(c) | 133(d) | 1100(T₂) |
| 計 | 1718(T·₁) | 182(T·₂) | 1900(T) |
期待度数 = (行合計 × 列合計)/ 総合計
| セル | 計算 | 期待度数 |
|---|---|---|
| 立ち×良品 | (800×1718)/1900 | 723.4 |
| 立ち×不良 | (800×182)/1900 | 76.6 |
| 座り×良品 | (1100×1718)/1900 | 994.6 |
| 座り×不良 | (1100×182)/1900 | 105.4 |
= (751×133 − 49×967)² × 1900
/ (800 × 1100 × 1718 × 182)
≈ 19.0
自由度 φ = (2−1)(2−1) = 1
棄却限界値 χ²(1, 0.05) = 3.84
作業形態と不良発生率には統計的に有意な関連がある
試験対策チェック間違えやすいポイント3選
- % のまま計算しない!
計算途中で「%」表示にすると桁がずれてエラーの元です。必ず 小数(0.01など) で計算を完結させ、最後に必要なら%に直しましょう。 - 母数値とサンプル値を混同しない!
P、m(母集団の真の値)と p、c̄(サンプルから計算した値)は別物です。検定統計量の公式でどちらを代入するかを毎回確認する習慣をつけましょう。 - 途中の丸め誤差に注意!
標準誤差の計算途中で桁数を削りすぎると、最終的な u₀ が棄却限界値をまたいでしまうことがあります。小数点以下4〜5位は保持して計算しましょう。
手法の選び方:まとめ早見表
| データの種類 | 比較対象 | 使う手法 | 鍵となる統計量 |
|---|---|---|---|
| 不適合品率 | 基準値との比較 | 母不適合品率の検定 | P₀ vs p |
| 不適合品率 | 2群の比較 | 2群の不適合品率差の検定 | 共通 p̄ |
| 不適合数 | 基準値との比較 | 母不適合数の検定 | m vs c̄ |
| 不適合数 | 2群の比較 | 2群の不適合数差の検定 | 共通 c̄ |
| カテゴリー×カテゴリー | 関連の有無 | 分割表のカイ二乗検定 | 期待度数 fₑ |

