強化学習は英語でなんというのか

2025年12月13日

強化学習の英語表現

強化学習は英語で Reinforcement Learning といいます。

この表現は和製英語ではなく、機械学習・AI分野において国際的に正式な用語として定着しています。

正式名称：Reinforcement Learning
一般的な略称：RL

学術論文、大学講義、企業の技術資料、研究者同士の会話においても、ほぼ例外なく Reinforcement Learning または RL が使われます。

「Reinforcement Learning」という言葉の意味構造

Reinforcement（強化）とは何か

Reinforcement という単語は、もともと心理学・行動科学の分野で使われてきた用語です。

意味としては、

報酬や刺激によって行動を強めること
望ましい行動が繰り返されるようにする仕組み

を指します。

この考え方を計算機上に形式化したものが強化学習であり、行動の結果として得られる報酬（reward）を学習信号として利用する点が最大の特徴です。

なぜ「Reinforcement Learning」と呼ばれるのか

直訳すると Reinforcement Learning は「強化による学習」です。

ただし意味として重要なのは単なる「行動の強化」ではなく、

環境との相互作用を通じて、将来も含めた累積報酬（expected return）を最大化する方策（policy）を学習する枠組み

という点です。

このため、強化学習は以下のような特徴を持ちます。

正解ラベルが事前に与えられない
試行錯誤（trial and error）を通じて学習する
短期的な報酬だけでなく、長期的な利益を重視する

他の機械学習手法との英語名称の違い

強化学習の英語名を正しく理解するために、他の代表的な学習手法と比較します。

日本語	英語
教師あり学習	Supervised Learning
教師なし学習	Unsupervised Learning
半教師あり学習	Semi-supervised Learning
強化学習	Reinforcement Learning

なお、略称としては RL（Reinforcement Learning） や SSL（Semi-supervised Learning） はよく使われますが、
Unsupervised Learning を UL と略すことは一般的ではありません。多くの場合、略さずに表記されます。