混同行列(Confusion Matrix)は、分類モデルの予測結果を詳細に分析するための基本的な評価手法です。
単なる「正解率」だけでは見えない、モデルの誤りの傾向や改善すべきポイントを明確にしてくれるため、実務でも非常に重要な役割を持ちます。
ここでは、混同行列の構造や読み取り方、主要な評価指標、実務での活用方法までを体系的に解説します。
混同行列とは何か
混同行列とは、実際のクラス(正解)とモデルの予測クラスを比較して、その一致・不一致を整理した表です。
分類タスクにおいて、モデルが「どのクラスを正しく予測できたか」「どんな誤分類をしたか」を明確に視覚化できます。
2値分類の例では、次の4つの要素から成り立ちます。
- 真陽性(True Positive):実際に陽性で、予測も陽性だったケース
- 真陰性(True Negative):実際に陰性で、予測も陰性だったケース
- 偽陽性(False Positive):実際は陰性なのに、誤って陽性と予測したケース
- 偽陰性(False Negative):実際は陽性なのに、誤って陰性と予測したケース
この4つの要素をもとに、さまざまな評価指標が導き出されます。
混同行列から得られる主要な指標
混同行列は単なる表ではなく、モデルの性能を多面的に評価する基盤になります。
代表的な指標を整理してみましょう。
正解率(Accuracy)
全体のうち、正しく分類できた割合を示します。
ただし、データのクラス分布が大きく偏っている場合(たとえば陽性がごく少ない場合)には、正解率だけで性能を判断すると誤解を招くことがあります。
適合率(Precision)
モデルが「陽性」と判断したもののうち、実際に陽性だった割合を示します。
たとえばスパム検出モデルなら、「スパムと判断したメールの中で、本当にスパムだった割合」です。
誤検出(偽陽性)を減らすことを重視する場合に重要な指標です。
再現率(Recall)
実際に陽性だったもののうち、どれだけを正しく陽性と予測できたかを示します。
病気の診断モデルなど、見逃しを最小限にしたいケースでは特に重視されます。
F1スコア
適合率と再現率のバランスを表す指標です。
どちらか一方が高くても、もう一方が低ければスコアは上がりません。
精度と網羅性の両立を図るためのバランス指標として有効です。
特異度(Specificity)
実際に陰性だったものを、どれだけ正しく陰性と判断できたかを表します。
医療分野などでは、再現率(感度)と特異度をセットで確認することが多いです。
多クラス分類の場合
2クラスではなく、たとえば「猫・犬・鳥」のように3つ以上のクラスがある場合にも混同行列は有効です。
この場合、表の行と列の両方がクラス名になり、対角線上の値が「正しく分類できた件数」、対角線以外の値が「誤って他のクラスに分類された件数」を示します。
この形式により、「犬を猫と間違える傾向がある」といった誤分類のパターンを具体的に分析できます。
実務での活用と読み解き方
混同行列は単に評価指標を算出するためのものではなく、モデル改善の方針を立てるための分析ツールとして活用されます。
- 偽陽性が多い場合:誤検出が多い → 適合率を高める方向で調整が必要
- 偽陰性が多い場合:見逃しが多い → 再現率を高める方向で調整が必要
また、ビジネス領域によって重視すべき指標が異なります。
- 医療・セキュリティ分野:見逃し(偽陰性)を最小限にすることが最優先
- マーケティング・広告分野:誤検出(偽陽性)を抑え、無駄なコストを避けることが重要
- レコメンドや検索分野:適合率と再現率のバランス(F1スコア)を重視
このように、混同行列は「何をどのくらい間違えているのか」を把握し、目的に応じた改善を行うための羅針盤となります。
クラス不均衡への注意
クラスの分布に偏りがある場合、正解率が高く見えても実際には性能が低いことがあります。
たとえば、陽性が1%しかないデータで、すべてを陰性と予測すれば99%の正解率になりますが、実際には役に立たないモデルです。
このような場合は、必ず混同行列を確認し、適合率や再現率などの補助指標を併用して評価することが重要です。
まとめ
混同行列は、分類モデルの結果を深く理解するための最も基本かつ強力なツールです。
正解率だけでは見えない「誤分類の傾向」や「改善の方向性」を明らかにしてくれます。
要点を整理すると次の通りです。
- 混同行列は、モデルの予測と実際の結果の対応を表形式で可視化するもの
- 適合率・再現率・F1スコアなど、多様な評価指標を導き出せる
- 分野や目的によって重視すべき誤りのタイプ(偽陽性/偽陰性)は異なる
- 不均衡データでは混同行列を必ず併用し、精度を正しく評価することが重要
混同行列を活用することで、モデルの「数字の裏側」にある振る舞いを見極め、より実用的なAIシステムを構築する道が開けます。
以上、機械学習の混同行列についてでした。
最後までお読みいただき、ありがとうございました。
