【備忘】Optimization of conditional value-at-risk

論文の概要

 本論文は、関数$F_{\beta}(x, \alpha)$の$\alpha$について最小値を達成する解がVaRであり、その最適値がCVaRであることを示した論文である。CVaRの定義はVaRに基づいているが、その関数に着目することでVaRを計算することなく、CVaRの最小値を求めることができる。最小値を求めるには、CVaRに含まれる期待値積分を経験近似して、線形計画問題として解けば良い。

定理

本論文において、確率分布は連続であると仮定しており、累積密度関数は連続となる。

Lemma 1

 固定した$x$ に対して、$G(\alpha) = \int_{y \in \mathbb{R}^m} g(\alpha, y) p(y) \mathrm{d} y$ とし、 $g(\alpha, y) = [f(x, y) - \alpha]^+$ であるとする。このとき、$G$ は凸で連続微分可能な関数であり、その導関数は$G’(\alpha) = \Psi(x, \alpha) - 1$となる。

証明 $G(\alpha)$が凸関数であるかどうかを確認する。
$g(\alpha, y)$は$\alpha$に対して凸関数で、$p(y) \le 0$であるから、$\alpha, \beta \in [0,1], \lambda \in (0,1)$に対して、


\begin{aligned}
G(\lambda \alpha + (1-\alpha)\beta) 
& = \int_{y \in \mathbb{R}^{m}} g(\lambda \alpha + (1-\lambda)\beta) p(y)dy \\
& \le \int_{y \in \mathbb{R}^{m}} \big( \lambda g(\alpha) + (1-\lambda)g(\beta) \big) p(y)dy \\
& = \lambda G(\alpha) + (1 - \lambda) G(\beta)
\end{aligned}

が成立するため、$G(\alpha)$は凸関数であることが示された。
よって、Proposition 2.1(Shapiro, et al., 1994)より$G(\alpha)$は方向微分可能であり、$f(x,y) - \alpha$は$\alpha$について微分可能であることから、


\begin{aligned}
\nabla_{\alpha}G(\alpha) 
&= \nabla_{\alpha}\big( \int_{y \in \mathbb{R}^m} g(\alpha, y) p(y) \mathrm{d} y \big) \\
&= \int_{f(x,y) \ge \alpha} \nabla_{\alpha}(f(x,y) - \alpha) p(y) dy \\
&= - \int_{f(x,y) \ge \alpha} p(y) dy \\
& = \Psi(x, \alpha) - 1.
\end{aligned}

となる。また仮定より$\Psi(x, \alpha)$は連続であるため、$G$ は凸で連続微分可能な関数であることが示された。

Theorem 1

 $F_{\beta}(x, \alpha) = \alpha + (1 - \beta)^{-1} \int_{y \in \mathbb{R}^m} [f(x, y) - \alpha]^+ p(y)dy$は$\alpha$について、凸で連続微分可能である。 このとき、$\operatorname{CVaR}_{\beta}(x) = \min_{\alpha \in \mathbb{R}} F_\beta(x, \alpha)$と記述でき、$A_\beta(x) = \operatorname{argmin}_{\alpha \in \mathbb{R}} F_\beta(x, \alpha)$は非空で有界区間となる。
 また、$\operatorname{VaR}_{\beta}(x) = \min A_\beta(x)$となる。$\operatorname{VaR}_{\beta}(x) \in \operatorname{argmin}_{\alpha \in \mathbb{R}} F_\beta(x, \alpha)$と$\operatorname{CVaR}_{\beta}(x) = F_\beta(x, \operatorname{VaR}_\beta(x))$は常に成立する。

証明  Lemma 1(Rockafellar et al. 2000)を用いると、$F_{\beta}(x, \alpha)$が凸で連続微分可能であることことは証明できる。また、$\frac{\partial}{\partial \alpha} F_{\beta}(x, \alpha) = 1 + (1 - \beta)^{-1} [\Psi(x, \alpha) - 1] = (1 - \beta)^{-1} [\Psi(x, \alpha) - \beta]$となる。

 $\Psi(x, \alpha)$は単調非減少な連続関数で、$\alpha \rightarrow -\infty$のとき$\Psi(x, \alpha) \rightarrow 0$、$\alpha \rightarrow \infty$のとき$\Psi(x, \alpha) \rightarrow 1$ あるため、$\Psi(x, \alpha) = \beta$となる$\alpha$が存在し、その$\alpha$において$F_{\beta}(x, \alpha)$は最小値となる。したがって、$A_{\beta}(x)$は非空で有界区間である。

 また、$\operatorname{VaR}_{\beta}(x) = \min \lbrace \alpha \in \mathbb{R} \mid \Psi(x, \alpha) \ge \beta \rbrace$であることから、$\operatorname{VaR}_{\beta}(x) = \min A_\beta(x)$となる。

 $\alpha_{\beta} \in \operatorname{argmin}_{\alpha \in \mathbb{R}} F_{\beta}(x, \alpha)$に対して、


\begin{aligned}
\min_{\alpha \in \mathbb{R}} F_{\beta}(x, \alpha) 
& = \alpha_{\beta} +  (1 - \beta)^{-1} \int_{y \in \mathbb{R}^{m}}  [ f(x, y) - {\alpha}_{\beta} ]^{+}  p(y) dy  \\
& = \alpha_{\beta} +  (1 - \beta)^{-1} \big( \int_{f(x,y) \ge \alpha_{\beta}} f(x, y) p(y) dy  -  \alpha_{\beta} \int_{f(x,y) \ge \alpha_{\beta}} p(y) dy \big) \\
& = \alpha_{\beta} + (1 - \beta)^{-1} \int_{f(x,y) \ge \alpha_{\beta}} f(x, y) p(y) dy  -  (1 - \beta)^{-1}\alpha_{\beta}(1-\Psi(x,\alpha_{\beta})) \\
& = (1 - \beta)^{-1} \int_{f(x,y) \ge \alpha_{\beta}} f(x, y) p(y) dy
\end{aligned}

最後の等式は仮定より、$\int_{f(x,y) = \alpha_{\beta}} p(y) dy = 0$となることから成立する。 $\alpha_{\beta} = \operatorname{VaR}_\beta(x)$が右辺の最小値であるから、定義より、$\min_{\alpha \in \mathbb{R}} F_\beta(x, \alpha) = \operatorname{CVaR}_{\beta}(x)$が成立する。 よって、示された。

Theorem2

 $\forall x \in X$ について $\operatorname{CVaR}_{\beta}(x)$ を最小化することは、$\forall (x, \alpha) \in X \times \mathbb{R}$ について $F_{\beta}(x, \alpha)$ を最小化することと同じであり、以下で表される。


\begin{aligned}
\min_{x \in X} \operatorname{CVaR}_{\beta}(x) = \min_{(x, \alpha) \in X \times \mathbb{R}} F_{\beta}(x, \alpha),
\end{aligned}

 さらに$f(x, y)$ が $x$ に関して凸ならば、$F_{\beta}(x, \alpha)$ は $(x, \alpha)$ に関して凸であり、$\operatorname{CVaR}_{\beta}(x)$ は $x$ に関して凸である。

証明  Theorem 1より、$\operatorname{CVaR} _{\beta}(x) = \min_{\alpha \in \mathbb{R}} F_\beta(x, \alpha)$が成立する。
これは任意の$x$に対して成立するから、両辺を$x$について最小値を取ることで、題意は示される。

$f(x,y)$が$x$について凸関数であるならば、$f(x,y)-\alpha$は$(x, \alpha)$に対して凸関数である。
また、$[\cdot]^{+} : \mathbb{R} \rightarrow \mathbb{R}_{++}$であることからTheorem 5.1(Rockafellar 1970)より、$[f(x,y)-\alpha]^{+}$ は $(x, \alpha)$ に関して凸関数となる。$p(y) \ge 0$で積分演算が線形であることより$F_{\beta}(x, \alpha)$ は凸関数となる。

また$\operatorname{CVaR}_{\beta}(x)$の凸性について考える。$F_{\beta}(x, \alpha)$が凸関数であるため、Proposition 3.3.1(Bertsekas 2009)より$\alpha$について最小化した関数も凸関数となる。

Proposition 1

 $f(x,y), y$が正規分布に従うとし、$\beta \ge 0.5$とする。このとき、$\mathbb{E}_{y}[f(x,y)] \le \text{Constant}$という制約条件が、$\operatorname{VaR}_{\beta}(x), \operatorname{CVaR}_{\beta}(x), \sigma(x)^{2}$の3つの最小化問題のいずれか2つにおいて有効制約となるならば、その2つの問題の最適解は一致する。

証明  $f(x,y)$の平均値、標準偏差を$\mu(x), \sigma(x)$とする。 $\operatorname{VaR}_{\beta}(x) = \min \lbrace \alpha \in \mathbb{R} \mid\int_{f(x,y) \le \alpha} p(y) dy \ge \beta \rbrace$で、$f(x,y)$が正規分布に従うことにより、


\begin{aligned}
\operatorname{Pr} \big( f(x,y) \le \alpha  \big) \ge \beta \\
\operatorname{Pr} \big( \frac{f(x,y) - \mu(x)}{\sigma(x)} \le \frac{\alpha - \mu(x)}{\sigma(x)}  \big) \ge \beta\\
\frac{1}{2} [ 1 + \operatorname{erf} \big( \frac{1}{\sqrt{2}} (\frac{\alpha - \mu(x)}{\sigma(x)} ) \big) ] \ge \beta \\
\alpha \ge \mu(x) + [ \sqrt{2} \operatorname{elf}^{-1}(2 \beta -1) ] \sigma(x)
\end{aligned}

よって、$\operatorname{VaR}_{\beta} = \mu(x) + [\sqrt{2} \operatorname{elf}^{-1}(2 \beta -1)]\sigma(x)$となる。
 また、$\operatorname{CVaR}_{\beta}(x) = \mu(x) + \frac{1}{\sqrt{2\pi} \exp [ \text{erf}^{-1}(2\beta - 1)]^2 (1 - \beta)} \sigma(x)$となる。
($\operatorname{CVaR}_{\beta}(x)$が上記のように表せる証明方法は不明。)

($\operatorname{VaR}_{\beta}(x), \operatorname{CVaR}_{\beta}(x)$の場合)
 ともに係数が正の$\sigma(x)$の最小化問題となるため、解は一致する。

($\sigma(x)^{2}$と$\operatorname{VaR}_{\beta}(x), \operatorname{CVaR}_{\beta}(x)$の場合)
 $\sigma(x)$が正であり、二乗関数は単調増加関数であるため、それぞれの最適解は一致する。

参考文献

Rockafellar, R. Tyrrell, and Stanislav Uryasev. "Optimization of conditional value-at-risk." Journal of risk 2 (2000): 21-42.