計量値の検定・推定
初心者でも合格できる完全ガイド
u 検定・t 検定・χ²検定・F 検定の使い分けから計算手順まで、「なぜその記号?」「なぜその公式?」を丁寧に解説します。
📋 目次
1検定と推定の基本的な考え方
- 工場の品質管理では母集団を全数調査できない。だからサンプルで推測する。
- 検定=「差がある・変わった」を統計的に判断する手続き。
- 推定=母集団の真の値(μ, σ²)をサンプルから推測すること。
母集団とは調べたい対象全体。例:「今日工場で作ったボルト10万本すべて」。全数測定は不可能なので、一部(サンプル)を取り出して調べます。
母集団の特性を表す値を母数(パラメータ)と呼びます。直接測れない「真の値」です。サンプルから推測するしかありません。
mean(平均)の頭文字 m に対応するギリシャ文字。母集団の値にはラテン文字と区別するためギリシャ文字を使う慣習がある。
standard deviation(標準偏差)の頭文字 s に対応するギリシャ文字。
検定とは
- 目的 差・変化を統計的に判断
- 手順 仮説 → 統計量 → 判定
- 結論 有意差あり or なし
推定とは
- 目的 μ・σ² の真の値を推測
- 種類 点推定・区間推定
- 結論 ○○〜○○の間(信頼率95%)
2仮説の立て方:H₀ と H₁
- 検定は必ず「差がない(H₀)」という仮説から始める。
- H₀ が棄却されたとき初めて「差がある(H₁)」と積極的に言える。
- H₀ が棄却できなくても「等しい」とは言えない。「差があるとはいえない」が正しい。
裁判では「被告は無実(推定無罪)」から始め、証拠が揃って初めて「有罪」と判定します。検定も同じです。まず「差がない(H₀)」を前提とし、データが十分な証拠を示したとき「差がある(H₁)」と判定します。証拠不十分なら「無罪(差があるとはいえない)」——「無実(差がない)」ではありません。
H は Hypothesis(仮説)の頭文字。₀ は「無(null)」を意味し、”Null Hypothesis” とも呼ばれる。棄却されたとき「無に帰す(= 存在しなかったことになる)」仮説。
H₀ に対立(Alternative)するので “Alternative Hypothesis”。₁ は「H₀ の次の仮説」を示す番号。Hₐ と書く流儀もある。
μ(母平均)に ₀ を添えて「H₀ の下での基準値」を示す。「ゼロ仮説の μ」と覚えると混乱しない。
検定では必ず次の2つの仮説を立てます。
| 仮説名 | 記号 | 意味 | 採択されたときの結論 |
|---|---|---|---|
| 帰無仮説 | H₀ | 「差がない・変わっていない」 | 「差があるとはいえない」(消極的) |
| 対立仮説 | H₁ | 検定の目的そのもの | 「差があるといえる」(積極的)✅ |
| パターン | 対立仮説 | 使う場面 | 有意になりやすさ |
|---|---|---|---|
| 両側検定 | H₁: μ ≠ μ₀ | 増えたか減ったか方向を問わず「変わったかどうか」を知りたいとき | 最も厳しい(棄却域が両端に分散) |
| 右片側検定 | H₁: μ > μ₀ | 「大きくなった」と予想して確認したいとき | 両側より有意になりやすい |
| 左片側検定 | H₁: μ < μ₀ | 「小さくなった(改善した)」と予想して確認したいとき | 両側より有意になりやすい |
32種類の誤り:α(第1種)と β(第2種)
- 判定は確率的な推論なので、必ずどちらかの誤りを犯す可能性がある。
- α(有意水準)は検定前に自分で決める。β は決めない。
- α を小さくすると β は大きくなる(トレードオフの関係)。
正規分布の山を思い浮かべてください。山の真ん中付近は「H₀ が正しいとき普通に起こる値の範囲(採択域)」。両端のほんの一部は「H₀ が正しくても滅多に起きない値の範囲(棄却域)」です。計算した統計量が棄却域に入れば「これは偶然じゃない=差がある」と判断して H₀ を棄却します。
ギリシャ文字アルファベットの第1番目の文字。「第1種の誤り」を表すために最初の文字 α が割り当てられた。通常 0.05(5%)または 0.01(1%)を使う。
ギリシャ文字の第2番目の文字。「第2種の誤り」を表すため α の次の文字 β が使われる。検定では事前に指定しない(n や μ との距離によって変わるため)。
| 誤りの種類 | 別名 | 確率 | 内容 | 事前に決めるか |
|---|---|---|---|---|
| 第1種の誤り | 「あわて者の誤り」 | α(有意水準) | H₀ が正しいのに棄却してしまう(差がないのに「差がある」と判定) | ✅ 決める(通常0.05) |
| 第2種の誤り | 「ぼんやり者の誤り」 | β | H₁ が正しいのに採択しない(差があるのに「差がない」と判定) | ❌ 決めない |
- α を小さくする(基準を厳しくする)→ 棄却域が狭まる → β が大きくなる(見逃しが増える)
- α を大きくする → 棄却域が広がる → β が小さくなる(見逃しが減る)
- β を減らすには n(サンプル数)を増やすのが最善の方法
4u 検定 ― σ が既知のときの母平均の検定
- σ(母標準偏差)が問題文で与えられているときに使う。
- 「サンプル平均 x̄ を標準化した値」が u₀ で、正規分布の棄却限界値 1.96 と比べる。
- 検定後は必要に応じて区間推定も行う。
学校のテストの点数をそのまま比べても、科目ごとの難しさが違うので不公平です。そこで偏差値(平均50、標準偏差10に変換)に直して比べます。統計の標準化も同じ発想で、どんな正規分布も「平均0、標準偏差1」に変換します。これにより1種類の正規分布表(u 表)だけで確率を調べられます。
ドイツ語の Urverteilung(原分布)に由来するという説と “unit normal” の略という説がある。日本の QC 教科書ではこの記号が定着している。
₀(ゼロ)は「H₀ の下で計算した値」を示す。μ₀ の「₀=基準値」とは意味が異なるので注意。u₀・t₀・χ₀²・F₀ はすべて「計算して求める検定統計量」。
H₀: μ = μ₀ H₁: μ ≠ μ₀(変化があるかどうか知りたいので両側検定)
通常 α = 0.05(5%)。特に危険な誤りを避けたいときは α = 0.01。
両側検定(α=0.05): |u₀| ≥ 1.96 右片側: u₀ ≥ 1.645 左片側: u₀ ≤ −1.645
下の公式を使って数値を求める。
u₀ が棄却域に入れば「有意差あり → H₀ 棄却・H₁ 採択」。
分子「x̄ − μ₀」:測定した平均と基準値との差。大きいほど変化した可能性が高い。
分母「σ ÷ √n」:サンプル平均のばらつき(標準誤差)。n が大きいほど小さくなり、小さな差でも検出しやすくなる。
|u₀| = 2.78 ≥ 1.96 → 棄却域に入る → 有意差あり(H₀ 棄却)
結論:「新工程の強度は従来品と比べて差があるといえる」
5t 検定 ― σ が未知のときの母平均の検定
- σ が未知のとき、サンプルから計算した不偏分散 V で代用する。
- その結果、正規分布ではなく t 分布(正規分布より裾が重い形)を使う。
- 自由度 φ = n − 1 で t 表を引いて棄却限界値を求める。
σ が既知なら x̄ のばらつきは正確にわかります。でも σ の代わりに V(推定値)を使うと「推定の不確かさ」が加わり、端の確率が少し増えます。これが t 分布です。n が増えて V が σ に近づくほど t 分布は正規分布に近づき、n → ∞ でほぼ一致します。
統計家 William Gosset がギネスビール社に勤務しながら “Student” のペンネームで発表した分布。”Student’s t 分布” と呼ばれ、記号 t は Student のイニシャルから。
u₀ と同じ命名ルール。₀=「H₀ の下で計算した値」。
英語の degrees of freedom(自由度)に対応するギリシャ文字として日本の教科書で定着。欧米では ν(ニュー)や df と書くことも多い。「自由に動けるデータの数」= n 個中 1 個は x̄ が決まると自動的に定まるため n − 1 になる。
V = S ÷ (n−1) S(平方和)= Σxᵢ² − (Σxᵢ)²/n
棄却限界値 t(11, 0.05) = 2.201 → 2.44 ≥ 2.201 → 有意差あり(H₀ 棄却)
結論:「新素材品の強度の母平均は従来品と変わった」
| 比較項目 | u 検定 | t 検定 |
|---|---|---|
| σ の状態 | 既知(問題文に与えられている) | 未知(サンプルから V を計算) |
| 使う分布 | 標準正規分布(u 表) | t 分布(t 表) |
| 自由度 | 不要 | φ = n − 1 |
| 棄却限界値(α=0.05両側) | 1.96(固定) | t(φ, 0.05)(φによって変わる) |
| 共通点 | 手順は同じ5ステップ。式の構造も同じ(分子:差、分母:標準誤差) | |
6χ²検定 ― 母分散の検定
- 「平均」ではなく「ばらつき(分散)が変わったか」を検定したいときに使う。
- χ²分布は左右非対称(0 以上の値しか取らない)ので棄却域の方向に注意。
- χ²(φ, α) の α は「右側(大きい側)にある確率」=上側確率。
正規分布に従うデータを2乗して足し合わせると χ²分布に従います。分散 V は「データと平均の差の2乗の合計」から作られるので、χ²分布と相性がよく、母分散の検定に使えます。t 分布と同様に自由度 φ = n − 1 で形が変わり、φ が大きくなるほど正規分布に近い形になります。
χ(カイ)はギリシャ文字。「chi-square」は Karl Pearson が1900年に命名。χ を2乗(²)した形の分布という意味。
u₀・t₀ と同じ命名ルール。₀=「H₀ の下で計算した検定統計量」。
σ²(母分散)に ₀ を添えて「H₀ の基準値」であることを示す。μ₀ と同じ命名パターン。例:標準偏差 σ₀=4N が与えられたなら σ₀²= 16。
V(サンプルの分散)が σ₀²(基準の分散)より小さければ χ₀² は小さくなり、「ばらつきが減った(改善した)」方向へ動きます。片側検定か両側検定かによって棄却域の位置が変わります。
| 対立仮説 | 検定の種類 | 棄却域 | 使う場面 |
|---|---|---|---|
| σ² ≠ σ₀² | 両側検定 | χ₀² ≤ χ²(φ, 1−α/2) または χ₀² ≥ χ²(φ, α/2) | ばらつきが増えたか減ったか不明 |
| σ² > σ₀² | 右片側検定 | χ₀² ≥ χ²(φ, α) | ばらつきが増えたか確認 |
| σ² < σ₀² | 左片側検定 | χ₀² ≤ χ²(φ, 1−α) | 改善でばらつきが減ったか確認 |
χ²(11, 0.95) = 4.57 → 3.56 < 4.57 → 棄却域に入る → 有意(ばらつきが小さくなった)
結論:「新素材品の強度のばらつきは従来品より小さくなった(精度が向上した)」
| 比較項目 | χ²検定 | F 検定 |
|---|---|---|
| 目的 | 1つの母分散が基準値と違うか | 2つの母分散が互いに等しいか |
| 使う分布 | χ²分布(1つの自由度) | F 分布(分子・分母の2つの自由度) |
| 統計量 | χ₀² = S ÷ σ₀² | F₀ = V₁ ÷ V₂(大きい方が分子) |
| 自由度 | φ = n − 1 | φ₁ = n₁ − 1 φ₂ = n₂ − 1 |
| 使い分け | 「従来品の σ=4N と比べてどうか」など、基準値がある場合 | 「グループAとBのばらつきは同じか」など、2グループを比べる場合 |
7F 検定 ― 2つの母分散の比の検定
- 2標本 t 検定の前に「両グループの分散は等しいか(等分散か)」を確認するために行う。
- 大きい方の分散を分子に置くことで F₀ ≥ 1 に統一し、F 表の上側だけで判定できる。
- 両側検定でも棄却限界値は F(φ₁, φ₂; α/2) で読む。
2つの独立した χ²分布の比から生まれる分布です。F 値は「2つの分散の比」なので、両者が等しければ F ≈ 1、大きく異なれば F が極端に大きくなります。F 分布は「分子の自由度 φ₁」と「分母の自由度 φ₂」の2つを持ちます。
なぜ平均の t 検定の前に F 検定が必要?:2標本 t 検定のプーリング公式は「両グループの σ² が等しい(等分散)」前提で設計されています。等分散でない場合は別の方法(ウェルチの検定)が必要なため、先に確認します。
統計学の巨人 Ronald A. Fisher(フィッシャー)の頭文字 F をとって命名された。分散分析(ANOVA)など幅広い検定で使われる。
u₀・t₀・χ₀² と同じ命名ルール。₀=「H₀ の下で計算した検定統計量」。
- 分子に大きい方の分散を置く → F₀ は必ず 1 以上になる
- 両側検定でも棄却限界値は F(φ₁, φ₂; α/2)(片側で見ればよいため)
- 自由度の順番:分子の φ が先、分母の φ が後。逆に引くと全く違う値になるので要注意
棄却限界値 F(9, 8; 0.025) = 4.36 → 1.95 < 4.36 → 棄却域に入らない → 有意差なし(等分散と見なせる)
結論:「2種のポリマーの引張強度のばらつきは等しいと見なせる → 次の t 検定へ進む」
- 有意差なし(等分散)→ 2つの分散をプーリングして t 検定へ
- 有意差あり(不等分散)→ ウェルチの検定(QC 2級では詳細は省略可)
82つの母平均の差の t 検定
- F 検定で等分散を確認してから行う(等分散が前提)。
- 2つの分散を合算したプーリング分散 V を使って t₀ を計算する。
- 片側検定の棄却限界値は t 表で「2α」の列を参照する(例:α=0.05 → 0.10 の列)。
「プーリング(pooling)」=合わせること。2グループの分散が等しいと確認できたなら、両グループのデータをまとめて1つの分散推定値を作れます。1グループだけのデータよりサンプル数が増えるので、より精度の高い推定ができます。
棄却限界値 t(17, 0.10) = 1.740 → 1.79 ≥ 1.740 → 有意(H₀ 棄却)
結論:「ポリマーAの引張強度の母平均はポリマーBより大きいといえる」
9対応があるデータの t 検定
- 同一対象(地域・製品・人)で2条件を測定したデータは「対応あり」。
- 差 d = A − B を計算することで、共通要因(地域差など)を消去できる。
- 自由度は「対の数 − 1」。F 検定(等分散の確認)は不要。
対応ない例:工場 A の製品10個 vs 工場 B の別の製品10個 → 独立した2標本 → セクション8の方法
対応ある例:同じ9地区で塗料 A と B を試験 → 地区1の A と地区1の B がペア → 地域差というノイズが d = A − B で消える → このセクションの方法
対応があるデータを無視して独立2標本の t 検定を使うと、地域差が「誤差」に混入して検定の精度が下がります。
difference(差)の頭文字 d をそのまま使う。
x̄(x の平均)と同じ命名ルール。バー(上線)=「平均」を意味する。
difference の d に対応するギリシャ文字。母集団の値にはギリシャ文字を使う慣習(μ, σ と同じルール)。
t₀ = d̄ ÷ (√V_d ÷ √n)
t₀ = 8.4 ÷ (√98.3 ÷ √9) = 8.4 ÷ 3.30 ≈ 2.54
棄却限界値 t(8, 0.05) = 2.306 → 2.54 ≥ 2.306 → 有意差あり(H₀ 棄却)
結論:「塗料AとBの耐候性の母平均は異なるといえる」
10推定(点推定・区間推定)
- 点推定=1つの値で答える(「μ ≈ 81.6」)。母平均は x̄、母分散は V で推定。
- 区間推定=「○○〜○○の間に95%の確率で含まれる」と幅で答える。
- 信頼区間は狭いほど良い推定(広いほど良い、は誤り)。
「母平均は81.6です」と1点で答えると(点推定)、サンプルが変わるたびにズレます。そこで「80.2〜83.0 の間に 95% の確率で含まれる」と区間で答えることで推定の信頼性も一緒に伝えます(区間推定)。この 95% を信頼率、区間を信頼区間と言います。
U は Upper(上)の頭文字。μ の推定区間の上限なので μ_U。分散なら σ_U²。
L は Lower(下)の頭文字。分散なら σ_L²。
正規分布では平均 ±1.96σ の範囲に全体の 95% が収まります。サンプル平均 x̄ の分布も同様で、幅は σ/√n(標準誤差)です。α=0.05 なら u(0.05)=1.96 を使います。
μ_U = 42.2 + 1.55 = 43.75N μ_L = 42.2 − 1.55 = 40.65N
結論:「真の母平均は 40.65N〜43.75N の間に 95% の確率で存在する」
幅 = 2.201 × 0.657 ≈ 1.45
μ_U = 81.6 + 1.45 = 83.05N μ_L = 81.6 − 1.45 = 80.15N
χ₀² = S/σ² が χ²分布に従うことを利用して、σ²(未知)の範囲を求めます。χ²分布は左右非対称なので、上限と下限で別々の χ²値を使います。
- n が大きくなる → 分母 √n が増える → 幅が狭くなる(精度アップ)
- σ が小さくなる → そもそものばらつきが小さい → 幅が狭くなる
- 信頼率を 95% → 99% に上げる → 棄却限界値が 1.96 → 2.576 に増える → 幅が広くなる
11試験直前チートシート
| 状況 | 使う検定 | 分布 | 自由度 |
|---|---|---|---|
| 1つの母平均を検定・σ 既知 | u 検定 | 標準正規分布 | 不要 |
| 1つの母平均を検定・σ 未知 | t 検定 | t 分布 | φ = n − 1 |
| 1つの母分散を検定 | χ²検定 | χ²分布 | φ = n − 1 |
| 2つの母分散の比を検定(等分散確認) | F 検定 | F 分布 | φ₁=n₁−1, φ₂=n₂−1 |
| 2つの母平均の差を検定(σ² 等しい) | 2標本 t 検定 | t 分布 | φ = φ_A + φ_B |
| 対応があるデータの平均の差を検定 | 対応あり t 検定 | t 分布 | φ = 対の数 − 1 |
棄却限界値(α=0.05)
- u(両側) ±1.96
- u(片側) 1.645
- t(10, 0.05) 2.228
- t(11, 0.05) 2.201
- t(16, 0.05) 2.120
- t(17, 0.10) 1.740
記号の命名ルール
- 母集団の値 ギリシャ文字(μ, σ, φ…)
- 基準値の添え字 ₀(μ₀, σ₀²)
- 検定統計量の添え字 ₀(u₀, t₀, F₀…)
- 信頼上限 U(μ_U, σ_U²)
- 信頼下限 L(μ_L, σ_L²)
- 差・平均の差 d, d̄, δ
2標本検定の手順
- ① F 検定 等分散を確認
- ② 等分散なら 分散をプーリング
- ③ t 検定 平均の差を判定
- 等分散でなければ ウェルチの検定
- 対応ありなら F 検定スキップ
区間推定のポイント
- n ↑ → 幅 狭くなる ✅
- σ ↓ → 幅 狭くなる ✅
- 信頼率 ↑ → 幅 広くなる
- 狭い方が 精度が高い
- H₀ が棄却できない ≠「等しい」→「差があるとはいえない(証拠不十分)」
- β は検定前に指定しない(指定するのは α だけ)
- 有意でなくても推定は行える(検定と推定は独立)
- 信頼区間は「幅が狭いほど精度が高い良い推定」(広いほど、は誤り)
- 対応ありデータの自由度 = 対の数 − 1(各グループの自由度の和ではない)
- 対応ありデータでは F 検定(等分散確認)は不要
- F 検定では大きい方の分散を分子に置く(分母ではない)
12練習問題でチェック
〇✕クイズ:正しければ〇、誤りなら✕
Q1. H₀ が採択されたとき「μ = μ₀ と等しい」と積極的に断言できる。
Q2. 有意水準 α を小さくすると、第2種の誤りを犯す確率 β は大きくなる。
Q3. 検定で有意にならなかった場合、推定を行っても意味がない。
Q4. 95% 信頼区間が 80.2〜83.0 であることは「真の値がこの区間内にある確率が 95% である」ことを意味する。
Q5. 対応があるデータの t 検定では、等分散の検定(F 検定)を先に行う必要がある。
Q6. 信頼区間の幅は n(サンプルサイズ)が大きいほど狭くなる。
Q7. F 検定では、分散の大きい方を分母にして F₀ を計算する。
Q8. 対応ありデータで n_A=n_B=9 のとき、t 検定の自由度は 8+8=16 である。
Q9. t 検定(α=0.05, 右片側)の棄却限界値は t(φ, 0.05) の列から読む。
Q10. u 検定と t 検定の最大の違いは、σ(母標準偏差)が既知か未知かである。

