クオンツトピックス

No.33
ランダム行列理論を用いた市場構造分析

2026年01月13日号

写真(木村)

ファイナンシャル
テクノロジー運用部
木村 嘉明

ニッセイアセット入社後、リスク管理、国内外株式領域のリサーチ・運用業務等に従事。2025年よりファイナンシャルテクノロジー運用部にて、主に計量的手法・AIを活用したクオンツリサーチおよび投資戦略の開発を担当。

写真(塚本)

ファイナンシャル
テクノロジー運用部
塚本 恵

ニッセイアセット入社後、ファイナンシャルテクノロジー運用部にて主に機械学習を含む数理的な定量的手法、オルタナティブデータを活用した新たな投資戦略の研究開発を担当。

共分散行列の固有値分布の特徴を調べてみよう

  • 共分散行列を固有値分解することの意味について
  • 市場構造分析から見た実務活用の可能性について

0. 予備知識、キーワード

基本的な金融工学、線形代数、ランダム行列理論の知識を仮定します。

キーワード
ランダム行列理論、固有値分布、共分散行列、シミュレーション

1. イントロダクション

ファイナンスにおける共分散行列は、ポートフォリオ最適化、リスク推定、回帰問題、次元削減等、あらゆる分野で登場します。では、線形関数の枠組みで共分散行列を見た場合、この行列の固有値とは何を意味するでしょうか?今回は、共分散行列の固有値の特徴、その応用例としての市場構造の分析について紹介します。

2. ランダム行列とWishart分布

まず、\(N\)個の銘柄それぞれの\(T\)月分の時系列リターンを用意します。つまり、\((t, i)\)成分が\(t\)月目の銘柄\(i\)のリターンを表しています。

\( X = \pmatrix { x_{11} & \ldots & x_{1N} \cr \vdots & \ddots & \vdots \cr x_{T1} & \ldots & x_{TN} \cr } \) (1)

銘柄リターンは確率的に揺らぐため、(1)をランダム行列と呼びます。ここから計算される標本共分散行列(2)もランダム行列です。ただし、\(X^′\)は\(X\)の転置行列を表します。

\(\displaystyle S = \frac{1}{T} X^{'}X \) (2)

このことを直感的に説明すると、推定された共分散行列\(S\)はサンプルを取り直す度に変わるため、母共分散行列\(Σ\)と異なり、確率変数とみなせるからです。つまり、このような場合は「行列の確率分布」が必要となります。ランダム行列理論において、標本共分散行列\(S\)が従う確率分布をWishart分布と呼びます。

\(\displaystyle S \sim W_{N} \left(T, \frac{1}{T}\Sigma \right) \) (3)

(3)は、\(Σ\)を母共分散に持つ\(N\)次元ベクトルを\(T\)回サンプリングして得られた\(S\)が従う分布を表しています。また、理論上は逆行列を持つための正則性条件\(T≥N\)を仮定します。

一方、金融データでは上記の仮定が崩れることが多々あります。例えばTOPIX銘柄を分析の対象にした場合、必要な時系列データは2,000ほどになり、日次ベースで8年分が必要です。月次ベースでは用意することは不可能です。この仮定が崩れることで有効自由度が不足し、推定のノイズが発生します。次節以降では、解決策の1つとして共分散行列\(S\)のノイズ・シグナルの判別を行い、さらにノイズ除去の手法を行うことで実際のポートフォリオ戦略にどう活用できるかについて紹介します。

固有値分布とMarčenko–Pastur定理

3. 共分散行列の固有値分布と、Marčenko–Pastur 定理

本節では、ノイズとシグナルの判別を行うために、ランダム行列理論における以下の極限定理を使います。

Marčenko–Pastur定理

\(X \in \mathbb{R}^{(T×N)}\)を、各成分が平均0、分散有限で独立同分布のランダム行列とする。このとき、極限を以下の形で取ると、標本共分散行列\(S=\frac{1}{T} X^{′} X\)の固有値分布\(𝑝(𝜆)\)は以下の分布に確率1で収束(概収束)する。

\(\displaystyle p(\lambda) \stackrel {a.s.}{\to} MP(q, \sigma^2),\quad T,N \to \infty \left(q = \frac{N}{T} \lt \infty \right) \) (4)

確率密度関数で表すと(5)のようになります。ただし、\(\lambda_{\pm} = \sigma^2(1 \pm \sqrt{q})^2 \)です。

\(\displaystyle f(\lambda) = \begin{cases} \displaystyle\frac{\sqrt{(\lambda_+ - \lambda)(\lambda - \lambda_-)}}{2\pi q \sigma^2 \lambda}, & \lambda \in [\lambda_-, \lambda_+] \cr 0, & \lambda \notin [\lambda_-, \lambda_+] \end{cases} \) (5)

この定理で重要なことは、ノイズだけで共分散行列を構成した場合、固有値が区間[\(\lambda_-, \lambda_+\)]から外れることは確率的には100%起こらない。つまり 外側に出た固有値はノイズでは説明できず、シグナル(共通因子・市場構造等)が存在する証拠になるということです。また、ノイズとシグナルの判別においては、\(N\)と\(T\)の大小関係の制約が無い点も重要です。そのため、高次元・小標本な金融データに対しても適用可能です。

ノイズ・シグナルの判別

4.共分散行列のノイズ・シグナル成分の特定

実際に、まず過去25年分のTOPIX構成銘柄の月次リターンデータを用いて、全期間の標本共分散行列\(S\)を計算し、これを固有値分解します。

\(\displaystyle S = P ・ diag(\lambda_1, \cdots , \lambda_N) ・ P^{-1} \) (6)

固有値は、 \(\lambda_1 \gt \cdots \gt \lambda_N \)と大きい順に並べ替えていると仮定します。固有値のヒストグラムが(4)の分布に従うことが分かります(図表1)。

図表1:固有値のヒストグラムとMarčenko-Pastur分布の比較

Marčenko-Pastur分布の確率密度関数が非ゼロとなる右端(赤線)を閾値として、それより右側にある12個の固有値がシグナルに該当します。一般的には、第1固有値(\(\lambda_1\) =1.63)が市場因子、つまり景気、金利、マクロ要因の影響で市場全体の変動因子に相当します。その他(\(\lambda_2\) =0.31,\(\cdots\),\(\lambda_{12}\)= 0.07)は「製造業か非製造業か」、「輸出企業か内需企業か」、「バリューかグロースか」といった、市場とは別の集団行動を示す潜在因子となります。

実際、第1固有値から累積させた寄与度が(図表2)であり、第1固有値だけで全体の26%、シグナルとなる第12固有値までで全体の47%を説明できることが分かります(その他はノイズとして扱う)。

図表2:固有値の累積寄与率

同じ固有値分解を行う主成分分析(PCA)と比較しても、「落とした後の次元数を裁量で決める」主成分分析と、「使うべきでないノイズ部分が分かる」Marčenko-Pastur定理では明確な違いがあります。最後に、ノイズとシグナルに関して処理前後のバックテスト結果を紹介します。

最小分散ポートフォリオによるバックテスト

5. 最小分散ポートフォリオでの比較

本節では、共分散行列の推定の差が分かりやすい最小分散ポートフォリオの構築を行い、バックテスト結果を比較します。便宜上、投資対象は各月のTOPIXの時価総額上位100銘柄(TOPIX100)とし、毎月リバランスを実施、取引コストは一律0.1%と仮定します。まず、ローリング共分散行列に対して以下の前処理をします。

\(\displaystyle \tilde{\lambda_i} = \begin{cases} \lambda_i, & \lambda_i \gt \lambda_+ \cr \lambda_+, & \lambda_i \le \lambda_+ \end{cases}, \quad \tilde{S} = P ・ diag(\widetilde{\lambda_1}, \cdots , \widetilde{\lambda_N}) ・ P^{-1} \) (7)

(7)は固有値のノイズ部分を\(\lambda_+\)に引き上げているノイズ除去であり、固有値クリッピングと呼びます。固有値クリッピング後に共分散行列\(\tilde{S}\)を再構築し、(6)と(7)の共分散行列をそれぞれMP補正前後の共分散行列とします。

MP補正前後の共分散行列それぞれを使った最小分散ポートフォリオのバックテスト結果は以下の通りです。

図表3:累積リターン比較(全期間)

期間 年率リターン:
MP補正後(改善率)
シャープレシオ:
MP補正後(改善率)
過去1年 24.2%(+42.0%) 4.1(+33.9%)
過去3年 19.9%(+19.1%) 2.6(+24.1%)
過去5年 15.8%(+6.7%) 1.8(+17.1%)
過去10年 10.8%(+2.8%) 1.0(+3.7%)
全期間 11.7%(+9.5%)) 0.9(+9.6%))

図表4:ドローダウン比較(全期間)

出所:東京証券取引所のデータを基に、ニッセイアセットマネジメント作成

期間 最大ドローダウン:MP補正後(改善率)
過去1年 ▲2.0%(改善効果無し)
過去3年 ▲2.0%(+23.0%)
過去5年 ▲8.6%(+13.3%)
過去10年 ▲14.5%(+16.2%)
全期間 ▲22.0%(+24.2%)

MP補正効果(MP補正前後の比較)を見ていくと、累積リターンやシャープレシオといったパフォーマンスは安定して上振れ、ドローダウンも抑制されていることが分かります。また、ターンオーバー削減の影響でより安定したウェイトが実現し、過度なリバランスが不要、つまり取引コストの削減効果も見られます。

MP補正効果をまとめたものが(図表5)です。

図表5:MP補正の効果(全期間)

パフォーマンス指標 MP補正前 MP補正後 改善率
年率リターン 10.7% 11.7% +9.5%
シャープレシオ 0.8 0.9 +9.6%
リスク指標 MP補正前 MP補正後 改善率
年率ボラティリティ 12.8% 12.8% +0.1%
最大ドローダウン ▲29.0% ▲22.0% +24.2%
取引効率 MP補正前 MP補正後 改善率
平均ターンオーバー 31.0% 10.8% ▲65.0%
勝率 64.4% 65.4% +1.6%

まとめ

6. まとめ

今回は、ランダム行列理論のMarčenko-Pastur定理を用いた共分散行列のノイズ除去手法について、理論から実証まで一貫した検証を行いました。全体を通した運用実務への示唆は以下の通りです。
第一に、MP補正により、限られたデータからでもノイズとシグナルを統計的に判別し、頑健な共分散行列を構築できることが示されました。これは特に、新興市場や短期間での戦略構築において有用です。
第二に、ターンオーバーが約65%削減されたことで、頻繁なリバランスに伴うスプレッドコストや市場インパクトが大幅に抑制され、特に流動性の低い銘柄を含むポートフォリオでは、この効果は実現リターンに直接反映されます。

本手法は、最小分散戦略に限らず、リスクパリティ、ブラック・リッターマン・モデル、多因子モデル等、共分散行列を用いるあらゆる運用戦略に適用可能です。実装も固有値クリッピングという単純な操作で実現でき、運用現場への応用可能性は高いと言えます。

参考文献

  • [Kanokogi]マルコス・ロペス・デ・プラド著 ; 鹿子木亨紀訳,アセットマネージャーのためのファイナンス機械学習,金融財政事情研究会,(2020)
  • [Tao] Terence Tao, Topics in random matrix theory, Graduate Studies in Mathematics(2012)

クオンツトピックス一覧へ

「クオンツトピックス」ご利用にあたっての留意点

当資料は、市場環境に関する情報の提供を目的として、ニッセイアセットマネジメントが作成したものであり、特定の有価証券等の勧誘を目的とするものではありません。

【当資料に関する留意点】

  • 当資料は、信頼できると考えられる情報に基づいて作成しておりますが、情報の正確性、完全性を保証するものではありません。
  • 当資料のグラフ・数値等はあくまでも過去の実績であり、将来の投資収益を示唆あるいは保証するものではありません。また税金・手数料等を考慮しておりませんので、実質的な投資成果を示すものではありません。
  • 当資料のいかなる内容も、将来の市場環境の変動等を保証するものではありません。
  • 手数料や報酬等の種類ごとの金額及びその合計額については、具体的な商品を勧誘するものではないので、表示することができません。
  • 投資する有価証券の価格の変動等により損失を生じるおそれがあります。