×品質管理事業金融

計数値データに基づく検定と推定

QC検定2級合格ガイド|計数値データの検定・推定
QC検定® 2級 完全対策

「数える」データを
統計的判断に変える
計数値の検定・推定ガイド

「不良品が減った気がする」を「統計的に証明できる」へ。不良品の個数・キズの数を使った検定手法を、記号の意味からひとつずつ丁寧に解説します。平均・分散がわかれば大丈夫です。

計数値データとは?なぜ統計的検定が必要なのか

計数値データとは、「数えることができるデータ」のことです。「今日の不良品は3個」「この製品のキズは2か所」のように、整数で表せるデータが該当します。重さや長さのように連続した値をとる「計量値データ」とは区別します。

計数値データには、さらに2種類あります。「良品か不良品か」のように結果が2択になるデータと、「キズが何個あるか」のように個数を直接数えるデータです。この違いが、後で使う計算式の選択に直結します。

なぜ「ただ数えるだけ」では不十分なのか

たとえば、先月の不良率が3.2%、今月が2.8%になったとします。「下がった!改善できた!」と思いたいところですが、少し立ち止まって考えてみましょう。

100個のうち3個だった不良品が、次の100個では2個になっただけかもしれません。これは、改善した結果ではなく、たまたまサンプリングの「運」で変わっただけの可能性があります。統計的検定を使うと、「この変化は偶然の範囲内か、それとも本当に変わったのか」を数値で判断できます。

💡
統計的検定が答える問い 「改善活動の効果は本物か、それとも偶然か?」——この問いに客観的な根拠を与えるのが検定です。感覚や経験ではなく、数値で判断することで、次のアクションを正確に決められます。

この記事で学ぶ内容(試験対応表)

QC検定2級では以下の手法が「○レベル(計算手順を習得)」として求められます。この記事ではすべてを順番に学んでいきます。

項目レベル求められること
母不適合品率の検定・推定二項分布の理解、正規近似の条件、検定・推定の手順
2つの母不適合品率の差2工程の比較、共通不適合品率 p̄ の使い方
母不適合数の検定・推定ポアソン分布、単位あたり不適合数 c̄ の扱い
2つの母不適合数の違い観測単位が異なる場合の比較方法
分割表による検定2×2分割表、期待度数の計算、カイ二乗分布の利用

◎:実務で自力適用できる ○:計算手順を習得している △:用語を理解している

2つの確率分布を正しく使い分ける

計数値データには、大きく分けて2つのタイプがあります。タイプによって使う計算式(確率分布)が変わります。最初にこの分類を確実に理解しましょう。

迷ったときの判断基準:「製品1個について良否を判定している?」→ 二項分布。「製品1個(または1ロット)の上にある欠点・キズの数を数えている?」→ ポアソン分布。

Type A — 2択の結果

不適合品率データ
→ 二項分布を使う

  • 1個ずつ「良品 or 不良品」と判定する
  • 例:電子部品が動く/動かない
  • 例:成形品の寸法が規格内/規格外
  • 管理する値:母不適合品率 P(全体の中で不良品が占める割合)
Type B — 個数を数える

不適合数データ
→ ポアソン分布を使う

  • 製品の表面や一定の範囲にあるキズ・欠点を数える
  • 例:塗装面1枚あたりのキズの個数
  • 例:1日あたりの機械の故障回数
  • 管理する値:母平均不適合数 m(単位あたりの平均欠点数)

2つの分布を比べてみる

混同しやすいので、類似点と相違点を整理します。

比較項目二項分布ポアソン分布
何を数えるか不良品の「個数(件数)」欠点・キズの「個数」
1回の観測の結果良品 or 不良品(2択)0個、1個、2個…(上限なし)
管理する統計量不適合品率 P(割合)平均不適合数 m(個数)
主な現場例部品の合否判定、外観検査塗装のキズ、布の織りムラ
正規近似の条件nP≥5 かつ n(1−P)≥5m≥5
検定で使う統計量u₀(正規分布の値)u₀(正規分布の値)

正規近似とは?なぜ条件が必要なのか

二項分布やポアソン分布は、そのまま計算するととても複雑です。しかし、データ数が十分に多いと、これらの分布は正規分布(なだらかな釣り鐘型の分布)に近い形になります。これを「正規近似」と呼びます。

正規近似が使えると、計算が大幅にシンプルになります。ただし、データが少なすぎると正規分布の形にならないため、近似を使う前に以下の条件を必ず確認します。

正規近似が使える条件(必ずチェック!)
二項分布の近似条件: nP ≥ 5 かつ n(1−P) ≥ 5
// 「不適合品の期待個数」と「適合品の期待個数」が両方5以上あること
// 例:n=500, P=0.05 なら nP=25≥5, n(1-P)=475≥5 → OK

ポアソン分布の近似条件: m ≥ 5
// 単位あたりの平均欠点数が5以上あること
⚠️
条件を満たさないときはどうする? 条件が満たされていないデータで無理に正規近似を使うと、検定の結果が信頼できなくなります(誤った判断=第1種の過誤のリスクが上がります)。対処法は、サンプルサイズ n を増やすこと、または観測単位を広げることです(例:1台単位の検査 → 10台まとめて検査)。

母不適合品率の検定と推定

「改善後の不良率は本当に下がったか?」を判断する、最も基本的な手法です。まず記号の意味を確認してから、5つのステップを順番に追っていきます。

🔤
ここで登場する記号の意味P(大文字):母不適合品率。工程全体の「真の不良率」。直接は観測できない。
p(小文字):標本不適合品率。実際にサンプルを調べて計算した不良率(= 不良品数 ÷ サンプル数)。
n:サンプルサイズ(調べた製品の個数)。
P₀:比較の基準になる不良率。「改善前」や「目標値」がここに入る。添字の「0」は「基準」を表す。

検定の5ステップ

例題 ゴム部品の改善効果の検証
従来の不良率 P₀ = 5.1%(= 0.051)。改善活動後に n = 500個を調査したところ、不適合品が16個だった(p = 16÷500 = 0.032)。改善したと言えるか?(有意水準 α = 0.05)
仮説の設定——比較の基準を言葉で決める

まず「何と比べるか」を2つの仮説として宣言します。

H₀(帰無仮説):P = 0.051 ←「変化していない」という前提。H は Hypothesis(仮説)の頭文字。添字の「0」は「捨てたい仮説(帰無)」を意味します。

H₁(対立仮説):P < 0.051 ←「改善した(不良率が下がった)」という主張。

今回は「下がったかどうか」だけを調べるので、片側(左側)検定を選びます。もし「変化があるかどうか(上がっても下がっても)」なら両側検定になります。

有意水準と棄却限界値——「どこまでなら偶然と言えるか」の境界を決める

有意水準 α(アルファ)= 0.05。これは「5%の確率で起こりうる誤り(偶然の差を本物と判断するリスク)まで許容する」という意味です。

左片側検定・α = 0.05 の棄却限界値 u(0.05) = 1.645(正規分布表から読み取る値)

正規近似のチェック——この計算式が使えるか確認する

nP₀ = 500 × 0.051 = 25.5 ≥ 5 ✓

n(1−P₀) = 500 × 0.949 = 474.5 ≥ 5 ✓

両方5以上なので、正規近似を使って計算できます。

検定統計量 u₀ の算出——「差がどれだけ大きいか」を1つの数値にする

この式は「サンプルの不良率 p が、基準 P₀ からどれだけ離れているか」を、バラツキ(√内)で割って標準化した値です。絶対値が大きいほど、差が偶然では説明しにくいことを意味します。

u₀ = (p − P₀) / √(P₀(1−P₀)/n)

= (0.032 − 0.051) / √(0.051 × 0.949 / 500)
= −0.019 / √(0.04839 / 500)
= −0.019 / √0.00009678
= −0.019 / 0.00984 ≈ −1.931
判定——棄却限界値と比べる

|u₀| = 1.931 > 1.645 → 棄却限界値を超えた。H₀を棄却します。

結論:有意水準5%で改善の効果があったと判定できる
(この差が偶然起こる確率は5%未満)

推定:「真の不良率はどのくらいか」を区間で表す

検定では「差があるかないか」しかわかりません。推定を行うと、「真の不良率はおそらくこの範囲に収まる」という信頼区間が求められます。推定では母数値 P₀ ではなく、サンプルから得た p を使って標準誤差を計算します。

95%信頼区間の公式(p を使う点に注意)
p ± u(α/2) × √(p(1−p)/n)

= 0.032 ± 1.96 × √(0.032 × 0.968 / 500)
= 0.032 ± 1.96 × √(0.030976 / 500)
= 0.032 ± 1.96 × √0.000061952
= 0.032 ± 1.96 × 0.00787
= 0.032 ± 0.015

結果:[0.017, 0.047] (1.7%〜4.7%)
📌
信頼区間が持つ意味 「真の不良率は1.7%〜4.7%の間にある(確率95%)」と読みます。点推定(2.8%という1点の数値)だけでなく、「最悪でも4.7%以下」という上限が見えることで、品質保証計画の根拠として使えます。

2つの母不適合品率の差の検定と推定

「ラインAとラインBで不良率に差があるか?」など、2つの工程・条件を比較するときに使います。

ポイント:共通不適合品率 p̄ を使う

検定では「2つの不良率は等しい(差はない)」と仮定します。そのため、両者を合わせた共通の p̄ を計算して使います。

検定統計量の公式(2群比較)
共通不適合品率: p̄ = (xₐ + x_b) / (nₐ + n_b)

検定統計量:
|u₀| = |pₐ − p_b| / √(p̄(1−p̄) × (1/nₐ + 1/n_b))
例題 ラインA vs ラインB の比較
ラインA:n=400, 不適合品13個(p=0.0325)
ラインB:n=350, 不適合品16個(p=0.0457)
有意差はあるか?(両側検定、α=0.05)

① 共通不適合品率:p̄ = (13+16) / (400+350) = 29/750 = 0.0387

|u₀| = |0.0325 − 0.0457| / √(0.0387×0.9613×(1/400+1/350))
= 0.0132 / √(0.0001990)
= 0.0132 / 0.0141 ≈ 0.936
判定:0.936 < 1.96 → 有意差なし
現在のサンプルサイズでは2ラインの差を検出できなかった

推定:差の信頼区間

推定では p̄ ではなく、各群の分散を独立に扱い、加法性を使って標準誤差を求めます。

差の区間推定
(pₐ − p_b) ± 1.96 × √(pₐ(1−pₐ)/nₐ + p_b(1−p_b)/n_b)

= −0.0132 ± 1.96 × √(0.0314/400 + 0.0436/350)
= −0.0132 ± 1.96 × 0.0143
= −0.0132 ± 0.0280

結果:[−0.0412, 0.0148]
🔍
「0を含む信頼区間」の読み方 区間に0が含まれる → 差がゼロである可能性が排除できない。「差がない証明」ではなく「現在のnでは差を検出できなかった」と読みましょう。本当に差があると考えるなら n を増やした再試験が必要です。

母不適合数の検定と推定

製品1単位あたりのキズ数・故障回数など、ポアソン分布に従うカウントデータを扱います。

キーワード:平均不適合数 c̄ = c/n

観測単位(台数・長さ・面積など)が変わっても公平に比較するために、「単位あたり」に換算した c̄(cバー) を使います。

母不適合数の検定統計量
c̄ = c / n  (c: 総不適合数, n: 観測単位数)

u₀ = (c̄ − m) / √(m/n)
// m: 基準となる母平均不適合数
例題 紙切れ回数の改善効果
従来は1日平均 m = 7.0回の紙切れが発生。
改善後 n = 10日間で平均 c̄ = 5.0回になった。
変化したと言えるか?(両側検定、α = 0.05)
u₀ = (c̄ − m) / √(m/n)
= (5.0 − 7.0) / √(7.0/10)
= −2.0 / √0.70
= −2.0 / 0.836 ≈ −2.39
判定:|u₀| = 2.39 > 1.96 → 有意差あり
紙切れ回数は統計的に有意に変化した(減少した)

推定(95%信頼区間):

c̄ ± 1.96 × √(c̄/n) = 5.0 ± 1.96 × √(5.0/10)
= 5.0 ± 1.96 × 0.707 = 5.0 ± 1.39
結果:3.61 ≤ m ≤ 6.39

2つの母不適合数の違いの検定と推定

観測単位(台数・面積など)が異なる2ラインのキズ数を比較します。

2群比較の検定公式
共通の平均: c̄ = (cₐ + c_b) / (nₐ + n_b)

検定統計量:
u₀ = (c̄ₐ − c̄_b) / √(c̄ × (1/nₐ + 1/n_b))
例題 塗装ラインのキズ数比較
ラインA:10台で80個のキズ(c̄ₐ = 8.0)
ラインB:20台で100個のキズ(c̄_b = 5.0)
有意差はあるか?

共通の平均:c̄ = (80+100)/(10+20) = 180/30 = 6.0

u₀ = (8.0 − 5.0) / √(6.0 × (1/10 + 1/20))
= 3.0 / √(6.0 × 0.15)
= 3.0 / √0.90
= 3.0 / 0.949 ≈ 3.16
判定:3.16 > 1.96 → 有意差あり。ラインAの方が有意にキズが多い
💡
観測単位 n を増やすと何が変わるか n が大きいほど標準誤差(分母)が小さくなり、小さな差も検出できるようになります(検定力向上)。「なぜ台数を増やすのか」をこの式で説明できると、エンジニアとして一段上の議論ができます。

分割表によるカイ二乗検定

2つの属性に関連があるかどうかを調べます。「作業形態と不良発生の関係」のようなカテゴリー×カテゴリーの分析に強力な手法です。

例題:作業形態と不良の関連

作業形態良品不良品
立ち作業751(a)49(b)800(T₁)
座り作業967(c)133(d)1100(T₂)
1718(T·₁)182(T·₂)1900(T)
期待度数 fₑ の計算

期待度数 = (行合計 × 列合計)/ 総合計

セル計算期待度数
立ち×良品(800×1718)/1900723.4
立ち×不良(800×182)/190076.6
座り×良品(1100×1718)/1900994.6
座り×不良(1100×182)/1900105.4
検定統計量 χ₀² の算出(2×2簡便式)
χ₀² = (ad − bc)² × T / (T₁ × T₂ × T·₁ × T·₂)

= (751×133 − 49×967)² × 1900
/ (800 × 1100 × 1718 × 182)

19.0
判定

自由度 φ = (2−1)(2−1) = 1

棄却限界値 χ²(1, 0.05) = 3.84

19.0 > 3.84 → 有意差あり
作業形態と不良発生率には統計的に有意な関連がある
🏆
分割表が唯一の武器になる場面 比較する要因が3つ以上(立ち・座り・歩行など)になると、2標本t検定や不適合品率の差の検定では対応できません。そのときカイ二乗検定が唯一の強力な手段です。

試験対策チェック間違えやすいポイント3選

  • % のまま計算しない!
    計算途中で「%」表示にすると桁がずれてエラーの元です。必ず 小数(0.01など) で計算を完結させ、最後に必要なら%に直しましょう。
  • 母数値とサンプル値を混同しない!
    P、m(母集団の真の値)と p、c̄(サンプルから計算した値)は別物です。検定統計量の公式でどちらを代入するかを毎回確認する習慣をつけましょう。
  • 途中の丸め誤差に注意!
    標準誤差の計算途中で桁数を削りすぎると、最終的な u₀ が棄却限界値をまたいでしまうことがあります。小数点以下4〜5位は保持して計算しましょう。

手法の選び方:まとめ早見表

データの種類比較対象使う手法鍵となる統計量
不適合品率基準値との比較母不適合品率の検定P₀ vs p
不適合品率2群の比較2群の不適合品率差の検定共通 p̄
不適合数基準値との比較母不適合数の検定m vs c̄
不適合数2群の比較2群の不適合数差の検定共通 c̄
カテゴリー×カテゴリー関連の有無分割表のカイ二乗検定期待度数 fₑ
合格への最短ルート 各手法の「公式を覚える」より「なぜその公式を使うのかを説明できる」レベルを目指しましょう。例題の数値を自分で計算し直す練習を繰り返すことが、本番での計算ミスを防ぐ最善策です。

本資料はQC検定®2級対策を目的とした学習用まとめです。

QC検定® は一般財団法人日本規格協会の登録商標です。

タイトルとURLをコピーしました