統計記号/機械学習記号の表記一覧

Numbers and Arrays

表記 意味(英語) 意味(日本語) LaTeX
{\it a} A scalar (integer or real) スカラー(整数又は実数) {\it a} Italic体
\mbox{\boldmath\it $a$} A vector ベクター {\bf a} Italic体/bold体
$A A matrix 行列 $A 大文字(斜体)
{\sf A} A tensor テンソル {\sf A} SansSerif体
$I_{n} Identity matrix with n rows and n columns n×nの単位行列 $I_{n}
$I Identity matrix with dimensionality implied bycontext 単位行列(次元は文脈に準ずる) $I
$e^{(i)} Standard basis vector [0, . . . ,0,1,0, . . . ,0] with a 1 at position i i番目の要素が1である標準規定ベクトル $e^{(i)}
diag(\mbox{\boldmath\it $a$}) A square, diagonal matrix with diagonal entriesgiven by a 対角成分がベクトルaである対角行列 diag(\mbox{\boldmath\it $a$})
a A scalar random variable 確率変数のスカラー表現 a 通常の文字
\begin{eqnarray} \mbox{\boldmath $a$} A vector-valued random variable 確率変数のベクトル表現 {\bf a} 通常の文字・bold体
A A matrix-valued random variable 確率変数の行列表現 A 通常の文字

 

Sets and Graphs

$\mathbb{A}$ A set 一般的な集合 $\mathbb{A}$ 白抜き文字
$\mathbb{R}$ The set of real numbers 実数の集合 $\mathbb{R}$ 白抜き文字
\{0,1\} The set containing 0 and 1 0と1からなる集合 \{0,1\}
\{0,1, \ldots, n\} The set of all integers between 0 and n 0からnまでの整数からなる集合 \{0,1, \ldots, n\}
[a, b] The real interval including a and b a,bを含むaからbまでの実区間 [a, b]
(a, b] The real interval excluding a but including b aを含まず,bを含むaからbまでの実区間 (a, b]
 $\mathbb{A} \backslash \mathbb{B}$
Set subtraction, i.e., the set containing the elements of A that are not in B
差集合.集合Aのうち集合Bに含まれる要素を除いたもの. $\mathbb{A} \backslash \mathbb{B}$
$\mathcal{G} A graph グラフ $\mathcal{G} カリグラフィーフォント
${Pa}_\mathcal{G}(\mathrm{x}_i)$
The parents of xi in G
グラフにおけるxiの親要素 $Pa_\mathcal{G}(\mathrm{x}_i)

Indexing

$a_i$
Element i of vector a , with indexing starting at 1
ベクトルaのインデックスが1から始まるときのi番目の要素. $a_i
$a_{-i}$ All elements of vector a except for element i ベクトルaのうちi番目の要素を除いたもの $a_{-i}
$A_{i,j} Element i, j of matrix A 行列Aの(i,j)要素 $A_{i,j}
$A_{i,:} Row i of matrix A 行列Aのi行目 $A_{i,:}
$A_{:,j} Column i of matrix A 行列Aのj列目 $A_{:,j}
{\sf A_{i,j,k}} Element (i, j, k) of a 3-D tensor A 三次元テンソルAの(i,j,k)要素 {\sf A_{i,j,k}}
{\sf A_{:,:,i}} 2-D slice of a 3-D tensor 三次元テンソルAを二次元にスライスしたもの {\sf A_{:,:,i}}
a_i Element i of the random vector a 確率ベクトルaのi番目の要素 a_i

Linear Algebra Operations

$A^\top Transpose of matrix A Aの転置行列 $A^\top 添え字が斜体は変数と混合するのでNG
$A^+ Moore-Penrose pseudoinverse of A ムーア-ペンローズの疑似逆行列 $A^+
$A \odot B Element-wise (Hadamard) product of A and B 行列Aと行列Bのアダマール積 $A \odot B
$\mathrm{det}(A) Determinant of A Aの行列式 $\mathrm{det}(A) detは立体

 

Calculus

\[ \frac{dy}{dx} \] Derivative of y with respect to x xに関するyの導関数 \[
\frac{dy}{dx}
\]
\[\frac{\partial y} {\partial x}\] Partial derivative of y with respect to x xに関するyの偏微分 \[\frac{\partial y} {\partial x}\]
$\nabla_{\v x} y Gradient of y with respect to x xに関するyの勾配 \nabla_{\v x} y ここでxにチェックがついてるものはベクトルを表している
$\nabla_{\m X} y Matrix derivatives of y with respect to X 行列Xに関するyの行列導関数 \nabla_{\m X} y
$\nabla_{\sf X} y
Tensor containing derivatives of y with respect to X
テンソルXに関するyの導関数 \nabla_{\sf X} y
\[\frac{\partial f} {\partial \v x}\] \text { Jacobian matrix } \boldsymbol{J} \in \mathbb{R}^{m \times n} \text { of } f: \mathbb{R}^{n} \rightarrow \mathbb{R}^{m} ヤコビアン行列 \[\frac{\partial f} {\partial \v x}\]
$\nabla_{\v x}^2 f(\v x)}\text { or } {\bf H}(f)(\v x) The Hessian matrix of f at input point x xを引数とする関数fのヘッセ行列 \nabla_{\v x}^2 f(\v x)}または {\bf H}(f)(\v x)
\[ \int f(x) dx \] Definite integral over the entire domain of x f(x)の領域xにおける全区間積分 \[
\int f(x) dx
\]
\[\int_\mathbb{S} f(x) dx\] Definite integral with respect to x over the set S f(x)の領域xにおけるS区間での積分 \[\int_\mathbb{S} f(x) dx\]

Probability and Information Theory

$a\bot b The random variables a and b are independent 互いに独立である確率変数a,b $a \bot b
$a \bot b \mid c They are conditionally independent given c cの条件のもとa,bが独立である $a \bot b \mid c
$P(a) A probability distribution over a discrete variable 離散確率分布 $P(a)
$p(a)
A probability distribution over a continuous variable, or over a variable whose type has not been specified
連続確率分布.もしくは,離散か連続かわからないときの確率分布 $p(a)
$a \sim P Random variable a has distribution P Pという分布をもつ確率変数a $a \sim P
$\mathbb E_{{\rm x} \sim P} [ f(x) ]\text{ or } \mathbb E f(x) Expectation of f(x) with respect to P(x) P(x)に対するf(x)の期待値 \mathbb E_{{\rm x} \sim P} [ f(x) ] または\mathbb E f(x) Eは白抜き文字
${\rm Var}(f(x)) Variance of f(x) under P(x) f(x)の分散 ${\rm Var}(f(x)) Varは立体
${\rm Cov}(f(x),g(x)) Covariance of f(x) and g(x) under P(x) f(x)とg(x)の共分散 ${\rm Cov}(f(x),g(x)) Covは立体
$H(\rm x) Shannon entropy of the random variable x 確率変数xのエントロピー $H(\rm x)
$D_{\rm KL} ( P \Vert Q ) Kullback-Leibler divergence of P and Q PのQに対するカルバックライブラー情報量 $D_{\rm KL} ( P \Vert Q )
$\mathcal {N} (\bf{x} ; \bf {\mu} ,\Sigma)
Gaussian distribution over x with mean µ and covariance Σ
確率変数xは平均μと分散Σの正規分布に従う. $\mathcal {N} (\bf{x} ; \bf {\mu} ,\Sigma) Nはカリグラフィーフォント

Functions

$f: \mathbb A \rightarrow \mathbb B The function f with domain A and range B 領域AからBの写像f $f: \mathbb A \rightarrow \mathbb B A,Bは集合を表すので白抜き文字
$f \circ g Composition of the functions f and g fとgの合成関数 $f \circ g
$f(x ;\theta) A function of x parametrized by θ. (Sometimes we write f(x) and omit the argument θ to lighten notation) θによって決定されるxの関数.省略してf(x)と書かれることもある. $f(x ;\theta)
$ \mathrm{log} x Natural logarithm of x xの自然対数 $ \mathrm{log} x
\sigma(x) Logistic sigmoid, $\displaystyle \frac{1} {1 + \exp(-x)}$ シグモイド関数 \sigma(x) シグマ
\zeta(x) Softplus, $\log(1 + \exp(x))$ ソフトプラス関数 \zeta(x) ゼータ
$|| x ||_p $L^p$ norm of $x$ xのp-ノルム $|| x ||_p
$|| x || $L^2$ norm of $x$ xの2-ノルム $|| x ||
$x^+ Positive part of x, i.e., max(0, x) xの正成分.xが0以下の場合は0をxが0以上の場合はxとなる. $x^+
1_{\rm conditioin} is 1 if the condition is true, 0 otherwise 条件が真のときに1を返しそれ以外は0を返す 1_{\rm conditioin}

 

Datasets and Distributions

$p_{\rm data} The data generating distribution データによる分布 $p_{\rm data}
$p_{\rm train} The empirical distribution defined by the training set 訓練データセットから得られた経験分布 $p_{\rm train}
$\mathbb{X} A set of training examples トレーニングデータセット $\mathbb{X}
$x^{(i)} The i-th example (input) from a dataset データセットの中のi番目のデータ $x^{(i)}
$y^{(i)}\text{ or } \mbox{\boldmath\it $y$}^{(i)} The target associated with $x^{(i)}$ for supervised learning 教師あり学習におけるx^iの教師データ $y^{(i)}\text または \mbox{\boldmath\it $y$}^{(i)}
$X The $m \times n$ matrix with input example $x^{(i)}$ in row $X_{i,:}$ 入力データxを行方向に並べた行列 $X

 

統計記号表記のルール

①基本とする表
http://www.deeplearningbook.org/contents/notation.html

②基本ルール
1. 変数・関数は斜体, その他(添字集合を持たない添字等)は立体で表す.
2. ベクトルはbold体, 行列・集合はcapital(upper) case, スカラー・集合の要素はlower case, 集合族はカリグラフィーで表す.
※集合の中でも特に実数全体や整数全体の集合は白抜き文字で表す. また, 汎関数のうち期待値や分散も白抜き文字で表されることが多い.
3. 数式は文の一部であり, 必要に応じで句読点が必要.