品質管理の現場では、日々大量のデータが生まれています。しかし、そのデータをただ集めるだけでは、製品の品質向上や問題解決には繋がりません。データに「なぜ?」と問いかけ、その背景にある因果関係や関連性を読み解くことが、プロセスの改善には不可欠です。
そこで、強力なツールとなるのが相関分析です。相関分析とは、2つの測定値(変数)の間に、どのような関係性があるかを調べる統計的な手法です。品質管理の「七つ道具」にも数えられるこの手法をマスターすることで、データからより多くの価値を引き出すことができます。
散布図で関係性を「見て」みよう!👀
相関分析の第一歩は、データを散布図(Scatter Plot)で視覚化することです。散布図は、x軸とy軸にそれぞれ異なるデータをプロットし、データの分布を点として表します。これにより、2つの変数の関係性を直感的に捉えることができます。
- 正の相関:散布図の点が右上がりの傾向にある場合です。一方の数値が増加すると、もう一方の数値も増加する傾向があります。たとえば、「製造温度が高いほど、製品の強度も上がる」といった関係がこれにあたります。
- 負の相関:散布図の点が右下がりの傾向にある場合です。一方の数値が増加すると、もう一方の数値は減少する傾向があります。「作業時間が長いほど、不良品の発生率が下がる」といったケースが考えられます。
- 無相関:点の分布に特定の傾向が見られない場合です。2つの変数の間には、ほとんど関係性がないと考えられます。
相関係数rで関係性を「数値化」する!🔢
散布図で関係性の傾向を掴んだら、次にその関係の強さと方向を数値で表してみましょう。そのための指標が相関係数rです。
相関係数rは、-1から1までの範囲をとる値で、その数値が何を示すかは以下の通りです。
- r≈1:非常に強い正の相関があることを示します。
- r≈−1:非常に強い負の相関があることを示します。
- r≈0:無相関、つまりほとんど関係がないことを示します。
相関係数の計算方法
相関係数の計算には、次の3つの要素が必要です。
- 共分散(Cov(x,y)) 2つのデータが「一緒にどう動くか」を表す値です。
- 共分散が正:Xが増加するとYも増加する傾向
- 共分散が負:Xが増加するとYは減少する傾向
- 標準偏差(σx,σy) それぞれのデータが平均値からどれくらいばらついているかを表します。
相関係数は、この共分散を2つの標準偏差で割ることで求められます。r=σxσyCov(x,y)
💡計算ステップ
具体的に、以下のテストの点数データを使って計算してみましょう。
| 名前 | 国語(X) | 数学(Y) |
| Aさん | 80 | 70 |
| Bさん | 60 | 50 |
| Cさん | 90 | 95 |
| Dさん | 50 | 60 |
| Eさん | 75 | 80 |
- 各データの平均値を出す
- 国語(X)の平均:(80+60+90+50+75)/5=71
- 数学(Y)の平均:(70+50+95+60+80)/5=71
- 各データの共分散を計算する 共分散は「それぞれのデータと平均値の差」を掛け合わせて、その合計をデータの数で割ることで求められます。
- (80−71)(70−71)+(60−71)(50−71)+(90−71)(95−71)+(50−71)(60−71)+(75−71)(80−71)=(−9)(−1)+(−11)(−21)+(19)(24)+(−21)(−11)+(4)(9)=9+231+456+231+36=963
- 共分散:963/5=192.6
- それぞれの標準偏差を計算する 標準偏差は「それぞれのデータと平均値の差の2乗」の平均の平方根です。
- 国語(X)の標準偏差:[(80−71)2+(60−71)2+(90−71)2+(50−71)2+(75−71)2]/5
=[81+121+361+441+16]/5
=204
≈14.28
- 数学(Y)の標準偏差:[(70−71)2+(50−71)2+(95−71)2+(60−71)2+(80−71)2]/5
=[1+441+576+121+81]/5
=244
≈15.62
- 国語(X)の標準偏差:[(80−71)2+(60−71)2+(90−71)2+(50−71)2+(75−71)2]/5
- 相関係数を計算する
- r=14.28×15.62192.6≈223.08192.6≈0.86
相関係数**0.86**は、国語の点数と数学の点数には強い正の相関があることを示しています。つまり、国語の点数が高い人は数学の点数も高い傾向がある、と言えますね。
💻Excelで相関係数を出す方法
手計算だと面倒…そんな時はExcelを使いましょう!
- データが入力されたセルを選択します。
- 空いているセルに
=CORREL(範囲1, 範囲2)と入力します。- 例:
=CORREL(B2:B6, C2:C6) - これだけで、さきほどの計算結果と同じ**0.86**という値がすぐに表示されます。
- 例:
品質管理の現場での活用術💡
相関分析は、品質管理の様々なシーンで役立ちます。
- 原因の特定:製品に不具合が発生したとき、「どの製造条件が原因か?」を突き止めるのに役立ちます。例えば、製造温度、圧力、原材料のロット番号など、複数の要因と不良率との相関を分析することで、問題の根本原因を特定できます。
- プロセスの最適化:製品の品質特性に影響を与える変数を特定し、最適な運転条件を見つけ出すのに役立ちます。これにより、歩留まりを向上させたり、エネルギー消費を抑えたりといった改善が可能になります。
- 予測:ある変数の値から、関連する別の変数の値を予測するために使われます。たとえば、ある原料の純度と最終製品の性能に強い相関がある場合、原料の純度を測定することで、最終製品の性能をおおよそ予測することが可能になります。
相関係数は、あくまでも「関係の強さ」を示すもので、「因果関係」を表すものではない点に注意が必要です。たとえば、「アイスの売上」と「水難事故の件数」には正の相関がある、なんて話を聞いたことがあるかもしれません。これは、どちらも「気温が高い」という原因から発生しているだけで、アイスが売れることで事故が増えるわけではありません。
このように、相関係数を正しく理解して活用することで、より深いデータ分析ができるようになりますよ!
まとめ:データは語る、その声を聴こう!🗣️
相関分析は、単にデータを見るだけでなく、データに隠された「声」を聴き、その背後にある真実を明らかにするための不可欠な手法です。散布図と相関係数という二つのツールを使いこなすことで、勘や経験に頼るだけでなく、データに基づいた客観的な品質改善が可能になります。
さあ、あなたの職場のデータも、相関分析で新しい視点から見てみませんか?きっと、今まで気づかなかった発見があるはずです。
