機械学習モデルの性能を評価する際、多くの人が最初に気にするのが 正解率(Accuracy) という指標です。
どれだけ正しく予測できたのかを一目で理解できるため、もっとも直感的で扱いやすい指標のひとつです。
しかし、実務レベルでは Accuracy をそのまま信じると、重大な判断ミスにつながることもあります。
ここでは Accuracy の本質、注意点、補助指標の現場での使い方まで詳しく解説します。
正解率(Accuracy)とは?
Accuracy とは、ざっくり言えば「全体のうち、どれくらい正しく予測できたか」を表す指標です。
100 件中 95 件を当てたなら Accuracy は 95%。非常に分かりやすく、入門としては最適な指標です。
Accuracy の最大の落とし穴:不均衡データに弱すぎる
Accuracy が誤解を生みやすい原因のひとつが、データの偏り(クラス不均衡)に極端に弱いこと です。
スパム検知の典型例
- 全 1000 通のメールのうち、スパムはたった 10 通
- モデルが「すべてスパムではない」と予測したとする
この場合、スパムを1通も見つけられていなくても、スパム以外の 990 通は「正しく非スパム」と予測したことになります。
結果として Accuracy は ほぼ 99% に迫る高数値 になり、一見すると優秀なモデルのように見えてしまいます。
しかし実際には「スパムを1通も検出できていない、完全に役に立たないモデル」です。
このように、Accuracy は 多数派のクラスに引きずられて高く見える性質 を持っています。
Accuracy を補うために欠かせない4つの指標
Accuracy だけでは不十分なため、実務では必ず次の指標が使われます。
Precision(適合率)
予測した “ポジティブ” のうち、実際に正しかった割合。
誤検出を避けたい場合に重視されます。
例:不正ではないユーザーを誤って「不正」と判定したくない場合
Recall(再現率)
実際にはポジティブであるものを、どれだけ見逃さずに検出できたか。
見逃しが致命的なケースに必須です。
例:スパム、詐欺、不良品などは見逃すリスクが大きい
F1-score(バランス指標)
Precision と Recall のバランスを測る指標。
片方だけでは評価しきれないときに役立ちます。
混同行列(Confusion Matrix)
モデルの予測を「正しく当てたもの」「誤って当てたもの」「見逃したもの」といった形で分類した表。
Accuracy では見えない「どの部分が弱点なのか」を理解できるため、実務では最重要の可視化ツール とされています。
Accuracy が役に立つケース
Accuracy が完全にダメなわけではありません。
以下のような状況では有力な指標になります。
- クラス分布がほぼ均等
- 誤検出と見逃しのコスト差が小さい
- モデル性能の“大まかな傾向”を知りたい
画像分類(犬 vs 猫など)、カテゴリ分類などでは Accuracy がメイン指標として働くことが多いです。
Webマーケティングの実務では Accuracy は危険なことが多い
マーケティング領域は不均衡データの宝庫です。
そのため Accuracy をうのみにすると、大きく性能を勘違いすることがあります。
CV(コンバージョン)予測
CV 率は多くのサイトで 1〜3%程度。
つまり 97〜99%は「非CV」 です。
この場合、「全員を非CVと判定しただけ」でAccuracyは驚くほど高くなります。
実際には「CV を1件も当てられないスコアリング」でも高数値になる可能性があります。
リードスコアリング
高品質リードは全体の一部。
Accuracy だけではモデルの得意・不得意が見えません。
不正クリック・bot 検知
不正の割合は非常に少ないため、Accuracy は役に立ちません。
- 見逃しを避ける → Recall が重要
- 誤検出を避ける → Precision が重要
Accuracy はどちらも反映しないため、実務判断には使えません。
Accuracy 含むモデル性能を高めるための主要アプローチ
実務における性能改善の手段を整理すると次の通りです。
データ前処理の最適化
- ノイズ除去
- 正規化・標準化
- 欠損値の適切な扱い
- カテゴリ変数のエンコード
特徴量エンジニアリング
- 新しい特徴量の作成
- 不要な特徴量の削除
- 次元削減
モデル選択とチューニング
- ロジスティック回帰
- 決定木
- ランダムフォレスト
- XGBoost
- ニューラルネット
さらに、
- グリッドサーチ
- ベイズ最適化
などでハイパーパラメータを調整することで性能が向上します。
データ拡張・サンプリング
- 学習データを増やす
- 少数クラスを人工的に増やす(SMOTEなど)
- バランス調整
不均衡データで特に重要です。
Accuracy を使うときに絶対に気をつけるべきポイント
| 注意点 | 内容 |
|---|---|
| 不均衡データで高く見えがち | 少数クラスを無視しても高い数値になる |
| 誤検出と見逃しのコストを反映できない | 特にマーケ・セキュリティ系で致命的 |
| 誤りの内訳が見えない | 混同行列なしでは判断できない |
| 表面上は優秀でも実務では役に立たないことがある | 高 Accuracy ≠ 高性能 |
Accuracy は「ざっくり状況を見るための入口」であって、最終判断に使う指標ではありません。
まとめ:Accuracy の正しい付き合い方
- Accuracy は分かりやすく便利な評価指標
- ただし、不均衡データではほとんど役に立たない
- 実務では Precision・Recall・F1、そして混同行列が不可欠
- Webマーケ領域では Accuracy の“見かけ倒し”が特に起きやすい
正しく理解して使い分ければ、Accuracy は強力な「補助指標」に変わります。
しかし、これだけでモデルの良し悪しを判断するのは避けるべきです。
