機械学習の正解率について

2025年11月13日

機械学習モデルの性能を評価する際、多くの人が最初に気にするのが 正解率（Accuracy） という指標です。

どれだけ正しく予測できたのかを一目で理解できるため、もっとも直感的で扱いやすい指標のひとつです。

しかし、実務レベルでは Accuracy をそのまま信じると、重大な判断ミスにつながることもあります。

ここでは Accuracy の本質、注意点、補助指標の現場での使い方まで詳しく解説します。

正解率（Accuracy）とは？

Accuracy とは、ざっくり言えば「全体のうち、どれくらい正しく予測できたか」を表す指標です。

100 件中 95 件を当てたなら Accuracy は 95%。非常に分かりやすく、入門としては最適な指標です。

Accuracy の最大の落とし穴：不均衡データに弱すぎる

Accuracy が誤解を生みやすい原因のひとつが、データの偏り（クラス不均衡）に極端に弱いこと です。

スパム検知の典型例

全 1000 通のメールのうち、スパムはたった 10 通
モデルが「すべてスパムではない」と予測したとする

この場合、スパムを1通も見つけられていなくても、スパム以外の 990 通は「正しく非スパム」と予測したことになります。

結果として Accuracy は ほぼ 99% に迫る高数値 になり、一見すると優秀なモデルのように見えてしまいます。

しかし実際には「スパムを1通も検出できていない、完全に役に立たないモデル」です。

このように、Accuracy は 多数派のクラスに引きずられて高く見える性質 を持っています。

Accuracy を補うために欠かせない４つの指標

Accuracy だけでは不十分なため、実務では必ず次の指標が使われます。

Precision（適合率）

予測した “ポジティブ” のうち、実際に正しかった割合。

誤検出を避けたい場合に重視されます。

例：不正ではないユーザーを誤って「不正」と判定したくない場合

Recall（再現率）

実際にはポジティブであるものを、どれだけ見逃さずに検出できたか。

見逃しが致命的なケースに必須です。

例：スパム、詐欺、不良品などは見逃すリスクが大きい

F1-score（バランス指標）

Precision と Recall のバランスを測る指標。

片方だけでは評価しきれないときに役立ちます。

混同行列（Confusion Matrix）

モデルの予測を「正しく当てたもの」「誤って当てたもの」「見逃したもの」といった形で分類した表。

Accuracy では見えない「どの部分が弱点なのか」を理解できるため、実務では最重要の可視化ツール とされています。

Accuracy が役に立つケース

Accuracy が完全にダメなわけではありません。

以下のような状況では有力な指標になります。

クラス分布がほぼ均等
誤検出と見逃しのコスト差が小さい
モデル性能の“大まかな傾向”を知りたい

画像分類（犬 vs 猫など）、カテゴリ分類などでは Accuracy がメイン指標として働くことが多いです。

Webマーケティングの実務では Accuracy は危険なことが多い

マーケティング領域は不均衡データの宝庫です。

そのため Accuracy をうのみにすると、大きく性能を勘違いすることがあります。

CV（コンバージョン）予測

CV 率は多くのサイトで 1〜3％程度。

つまり 97〜99％は「非CV」 です。

この場合、「全員を非CVと判定しただけ」でAccuracyは驚くほど高くなります。

実際には「CV を1件も当てられないスコアリング」でも高数値になる可能性があります。

リードスコアリング

高品質リードは全体の一部。

Accuracy だけではモデルの得意・不得意が見えません。

不正クリック・bot 検知

不正の割合は非常に少ないため、Accuracy は役に立ちません。

見逃しを避ける → Recall が重要
誤検出を避ける → Precision が重要

Accuracy はどちらも反映しないため、実務判断には使えません。

Accuracy 含むモデル性能を高めるための主要アプローチ

実務における性能改善の手段を整理すると次の通りです。

データ前処理の最適化

ノイズ除去
正規化・標準化
欠損値の適切な扱い
カテゴリ変数のエンコード

特徴量エンジニアリング

新しい特徴量の作成
不要な特徴量の削除
次元削減

モデル選択とチューニング

ロジスティック回帰
決定木
ランダムフォレスト
XGBoost
ニューラルネット

さらに、

グリッドサーチ
ベイズ最適化
などでハイパーパラメータを調整することで性能が向上します。

データ拡張・サンプリング

学習データを増やす
少数クラスを人工的に増やす（SMOTEなど）
バランス調整

不均衡データで特に重要です。

Accuracy を使うときに絶対に気をつけるべきポイント

注意点	内容
不均衡データで高く見えがち	少数クラスを無視しても高い数値になる
誤検出と見逃しのコストを反映できない	特にマーケ・セキュリティ系で致命的
誤りの内訳が見えない	混同行列なしでは判断できない
表面上は優秀でも実務では役に立たないことがある	高 Accuracy ≠ 高性能

Accuracy は「ざっくり状況を見るための入口」であって、最終判断に使う指標ではありません。