事業

「原因と結果」を視覚化せよ:データ解析に必須の「散布図」の作り方と読み解き方

散布図の定義と作成の基本

軸の設定とプロット

散布図は、二つの変数間の関係を見るためのプロット図です。

  • 横軸(X軸): 原因と思われる要素(例:製造温度、時間)のデータが配置されます。これは結果に影響を与える側と推定される変数です。
  • 縦軸(Y軸): 結果として得られたデータ(例:製品の強度、不良率)が配置されます。これは横軸の影響を受ける側と推定される変数です。
  • プロット: 原因と結果のデータペアを座標上に点として配置(プロット)します。

目的

この視覚化の主な目的は、製品の特性(結果)に影響を与えている可能性のある要因(原因)を推定することです。点がどのように集まり、どのように並んでいるかを一目で確認できます。


相関関係の見方と種類

A. 正の相関(Positive Correlation)

  • 並び方: 点が右上がりの傾向を示します。
  • 関係: 横軸の値が増えるにつれて、縦軸の値も増える関係です。
  • 解釈: 原因が増加すると、結果も良くなる(または悪くなる)という、両者が同じ方向に動く影響を示します(例: 温度が高いほど製品の強度も高い)。

B. 負の相関(Negative Correlation)

  • 並び方: 点が右下がりの傾向を示します。
  • 関係: 横軸の値が増えるにつれて、縦軸の値が減る関係です。
  • 解釈: 原因が増加すると、結果は減少するという、両者が逆の方向に動く影響を示します(例: 温度が高くなるにつれて製品の強度が低くなる)。

C. 相関なし(No Correlation)

  • 並び方: 点が座標上にバラバラに散らばって分布し、特定の傾向が見られません。
  • 解釈: 検討している横軸の要因は、縦軸の結果に明確な影響を与えていないと判断されます。データ解析者は、この要因を一度除外し、他の原因を検討する必要があります。

散布図の活用事例とより深い分析

原因の特定と改善活動

散布図は、データ解析が最終的に目指す具体的な改善活動に直結します。

  • 例えば、製品の強度のばらつきという問題に対し、製造温度を原因として散布図を作成し、「正の相関」を発見した場合、工場は「温度管理を徹底する」という具体的な改善策の方向性を得られます。
  • このように、散布図は「どの要因に注目すべきか」を絞り込み、改善の優先順位を決める上で不可欠な役割を果たします。

複合分析(層別との組み合わせ)

単一の散布図で相関が見られない場合でも、データが二つ以上のグループに分かれてプロットされている(二つの「山」がある)ように見えることがあります。

  • これは異質なデータが混在している、すなわち異なる群(例:ロット、作業者、機械)が混ざり合っていることを示唆します。
  • このような場合、層別という手法(ロットごとや機械ごとにデータを分けて調べること)を組み合わせることで、各群の中での真の相関関係や、群ごとの違いという真の原因を発見できる可能性が高まります。

これらの情報から、散布図は、データ解析において**「結果と要因の間の関係を素早く・正確に把握し、問題解決の方向性を定める」**ための基本的ながら強力な基盤となるツールであることがわかります。

タイトルとURLをコピーしました