機械学習の正解率について

AI実装検定のご案内

機械学習モデルの性能を評価する際、多くの人が最初に気にするのが 正解率(Accuracy) という指標です。

どれだけ正しく予測できたのかを一目で理解できるため、もっとも直感的で扱いやすい指標のひとつです。

しかし、実務レベルでは Accuracy をそのまま信じると、重大な判断ミスにつながることもあります。

ここでは Accuracy の本質、注意点、補助指標の現場での使い方まで詳しく解説します。

目次

正解率(Accuracy)とは?

Accuracy とは、ざっくり言えば「全体のうち、どれくらい正しく予測できたか」を表す指標です。

100 件中 95 件を当てたなら Accuracy は 95%。非常に分かりやすく、入門としては最適な指標です。

Accuracy の最大の落とし穴:不均衡データに弱すぎる

Accuracy が誤解を生みやすい原因のひとつが、データの偏り(クラス不均衡)に極端に弱いこと です。

スパム検知の典型例

  • 全 1000 通のメールのうち、スパムはたった 10 通
  • モデルが「すべてスパムではない」と予測したとする

この場合、スパムを1通も見つけられていなくても、スパム以外の 990 通は「正しく非スパム」と予測したことになります。

結果として Accuracy は ほぼ 99% に迫る高数値 になり、一見すると優秀なモデルのように見えてしまいます。

しかし実際には「スパムを1通も検出できていない、完全に役に立たないモデル」です。

このように、Accuracy は 多数派のクラスに引きずられて高く見える性質 を持っています。

Accuracy を補うために欠かせない4つの指標

Accuracy だけでは不十分なため、実務では必ず次の指標が使われます。

Precision(適合率)

予測した “ポジティブ” のうち、実際に正しかった割合。

誤検出を避けたい場合に重視されます。

例:不正ではないユーザーを誤って「不正」と判定したくない場合

Recall(再現率)

実際にはポジティブであるものを、どれだけ見逃さずに検出できたか。

見逃しが致命的なケースに必須です。

例:スパム、詐欺、不良品などは見逃すリスクが大きい

F1-score(バランス指標)

Precision と Recall のバランスを測る指標。

片方だけでは評価しきれないときに役立ちます。

混同行列(Confusion Matrix)

モデルの予測を「正しく当てたもの」「誤って当てたもの」「見逃したもの」といった形で分類した表。

Accuracy では見えない「どの部分が弱点なのか」を理解できるため、実務では最重要の可視化ツール とされています。

Accuracy が役に立つケース

Accuracy が完全にダメなわけではありません。

以下のような状況では有力な指標になります。

  • クラス分布がほぼ均等
  • 誤検出と見逃しのコスト差が小さい
  • モデル性能の“大まかな傾向”を知りたい

画像分類(犬 vs 猫など)、カテゴリ分類などでは Accuracy がメイン指標として働くことが多いです。

Webマーケティングの実務では Accuracy は危険なことが多い

マーケティング領域は不均衡データの宝庫です。

そのため Accuracy をうのみにすると、大きく性能を勘違いすることがあります。

CV(コンバージョン)予測

CV 率は多くのサイトで 1〜3%程度。

つまり 97〜99%は「非CV」 です。

この場合、「全員を非CVと判定しただけ」でAccuracyは驚くほど高くなります。

実際には「CV を1件も当てられないスコアリング」でも高数値になる可能性があります。

リードスコアリング

高品質リードは全体の一部。

Accuracy だけではモデルの得意・不得意が見えません。

不正クリック・bot 検知

不正の割合は非常に少ないため、Accuracy は役に立ちません。

  • 見逃しを避ける → Recall が重要
  • 誤検出を避ける → Precision が重要

Accuracy はどちらも反映しないため、実務判断には使えません。

Accuracy 含むモデル性能を高めるための主要アプローチ

実務における性能改善の手段を整理すると次の通りです。

データ前処理の最適化

  • ノイズ除去
  • 正規化・標準化
  • 欠損値の適切な扱い
  • カテゴリ変数のエンコード

特徴量エンジニアリング

  • 新しい特徴量の作成
  • 不要な特徴量の削除
  • 次元削減

モデル選択とチューニング

  • ロジスティック回帰
  • 決定木
  • ランダムフォレスト
  • XGBoost
  • ニューラルネット

さらに、

  • グリッドサーチ
  • ベイズ最適化
    などでハイパーパラメータを調整することで性能が向上します。

データ拡張・サンプリング

  • 学習データを増やす
  • 少数クラスを人工的に増やす(SMOTEなど)
  • バランス調整

不均衡データで特に重要です。

Accuracy を使うときに絶対に気をつけるべきポイント

注意点内容
不均衡データで高く見えがち少数クラスを無視しても高い数値になる
誤検出と見逃しのコストを反映できない特にマーケ・セキュリティ系で致命的
誤りの内訳が見えない混同行列なしでは判断できない
表面上は優秀でも実務では役に立たないことがある高 Accuracy ≠ 高性能

Accuracy は「ざっくり状況を見るための入口」であって、最終判断に使う指標ではありません。

まとめ:Accuracy の正しい付き合い方

  • Accuracy は分かりやすく便利な評価指標
  • ただし、不均衡データではほとんど役に立たない
  • 実務では Precision・Recall・F1、そして混同行列が不可欠
  • Webマーケ領域では Accuracy の“見かけ倒し”が特に起きやすい

正しく理解して使い分ければ、Accuracy は強力な「補助指標」に変わります。

しかし、これだけでモデルの良し悪しを判断するのは避けるべきです。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次