機械学習の回帰と分類について

2025年11月12日

近年、AIやデータサイエンスという言葉が身近になり、ビジネスや研究の現場で「機械学習」を活用するケースが急増しています。

その中心的な技術のひとつが「教師あり学習」です。これは、過去のデータ（入力）とその結果（正解）をセットで与え、新しいデータが来たときに結果を予測できるように学習するという考え方です。

教師あり学習の中でも最も基本であり、かつ応用範囲が広いのが「回帰」と「分類」の2種類です

この2つは、どちらも「入力から出力を予測する」点では共通していますが、予測したいものが数値か、カテゴリーかによってアプローチが異なります。

以下では、両者の考え方・代表的な手法・評価方法などを、数式を使わずに丁寧に解説します。

回帰（Regression）とは

回帰とは、連続的な数値を予測するタスクです。

わかりやすく言うと、「どれくらいの値になるか」を予測する問題です。

たとえば

このように、結果が数値で表せる問題を扱うときに回帰が使われます。

線形回帰
最も基本的な方法で、入力データと結果の間に直線的な関係があると仮定します。解釈しやすく、予測の仕組みが透明なのが特徴です。
リッジ回帰・ラッソ回帰
線形回帰の発展形で、不要な特徴量を抑制したり、過学習を防いだりするために「制約」を加えたものです。データが多いときや複雑なときに安定した性能を発揮します。
ランダムフォレスト回帰
多数の決定木（if-thenルールの集合）を組み合わせて予測する手法。直線的な関係に限らず、複雑なパターンも捉えることができ、外れ値にも比較的強い傾向があります。
サポートベクター回帰（SVR）
データのばらつきの中で「誤差を一定範囲に抑える」ような線や曲線を探す手法。外れ値に敏感すぎないよう設計されています。
ニューラルネットワーク回帰
多層構造を持つモデルで、複雑な非線形関係を学習できます。データが多く、特徴量同士の関係が複雑なときに真価を発揮します。

回帰では、どれだけ実際の値に近い数値を出せたかで性能を評価します。

主な指標は次の通りです。

分類は、データを特定のカテゴリ（クラス）に分類するタスクです。

こちらは「どのタイプに当てはまるか」を予測する問題で、数値ではなくラベル（文字やクラス名）を出力します。

たとえば

結果がカテゴリ分けできるときは、この分類の手法を用います。

ロジスティック回帰
もっとも基本的な分類モデル。入力データから、あるクラスに属する「確率」を出します。シンプルながら多くの実務で使われています。
k近傍法（k-NN）
新しいデータが、学習データのどのあたりに位置しているかを見て、近くのデータの多数決で分類します。直感的でわかりやすい方法です。
決定木・ランダムフォレスト
「条件分岐」を繰り返して分類するルールベースの手法です。ランダムフォレストは複数の木を組み合わせることで精度を高め、過学習を抑えます。
サポートベクターマシン（SVM）
異なるクラスをできるだけ広く分ける境界線を見つける手法です。少ないデータでも比較的精度を出しやすいのが特徴です。
ニューラルネットワーク（ディープラーニング）
多層構造を持つモデルで、画像認識や音声認識などの複雑な分類に使われます。大量のデータから高次の特徴を自動的に学習します。

分類では、「どれだけ正しくクラスを当てられたか」を様々な角度から測定します。

観点	回帰	分類
予測対象	連続値（数値）	カテゴリ（ラベル）
目的	数値の予測	クラスの識別
出力例	価格・気温・生産量など	スパム／非スパム、犬／猫など
代表的手法	線形回帰、ランダムフォレスト回帰など	ロジスティック回帰、SVM、決定木など
主な評価指標	MAE、RMSE、R²など	Accuracy、Precision、Recall、F1、AUCなど

データの分割と検証設計
モデルを評価する際は、データを学習用と検証用に分け、未知データに対してどれほど正確に予測できるかを確かめます。時系列データでは、時間順を守って分割することが重要です。
データの前処理
特徴量のスケール（数値の大きさ）に差がある場合、正規化や標準化を行うことで学習の安定性を保てます。特にSVMやk-NNでは必須です。
クラスの不均衡問題
あるクラスが極端に少ない場合、正解率だけで評価すると誤った印象を与えることがあります。その場合は、Precision・Recall・AUCなどを重視します。
しきい値の最適化
分類モデルは通常「確率」を出すため、どの確率を境にクラスを分けるか（しきい値）を調整することで、誤検知と見逃しのバランスをコントロールできます。
過学習への注意
学習データに過剰に適応してしまうと、実際の運用で精度が下がります。正則化、特徴量選択、交差検証などを活用して過学習を防ぎましょう。