skip to content

多数の弱いシグナルを活用する方が有効か

/ 5 min read

Table of Contents

Denseな予測モデルという考え方

機械学習のモデル設計には、大きく分けて Sparse(少数精鋭)Dense(弱いシグナルの積み上げ) の考え方がある。

Sparseは少数の特徴量だけを利用する考え方であり、Denseは多数の特徴量を活用する考え方である。

Sparseなアプローチ

Sparseなモデルでは、

  • 重要な特徴量は少数である
  • 不要な特徴量は削除した方がよい
  • モデルはシンプルであるべき

という前提を置く。

代表例はLasso(L1正則化)である。

Lassoは重要でない特徴量の係数をゼロにし、少数の特徴量だけを残そうとする。

つまり、

少ない特徴量で一般化を目指す

アプローチである。

金融市場では強い特徴量が見つかりにくい

短期の金融予測では、単独で高い予測力を持つ特徴量はほとんど存在しない。

例えば、

  • RSI
  • モメンタム
  • ボラティリティ
  • 高値・安値との距離
  • ローリング統計量

などは、それぞれわずかな情報しか持たない。

説明力は小さく、ノイズも多い。

しかし完全なノイズではなく、微弱な予測情報を含んでいる場合がある。

弱いシグナルを集める

金融市場では、

少数の強いシグナル

よりも、

多数の弱いシグナル

が存在していると考える方が自然かもしれない。

個々の特徴量は予測力が小さくても、複数を組み合わせることで予測力が生まれる。

重要なのは一つ一つの特徴量ではなく、全体として現れるわずかな偏りである。

Denseなアプローチ

Denseなモデルでは、

  • 特徴量を積極的に削らない
  • 弱いシグナルも保持する
  • 集合的な予測力を利用する

ことを重視する。

個々の特徴量の寄与は小さくても、全体では意味のあるシグナルになる可能性がある。

つまり、

多数の特徴量を利用して一般化を目指す

アプローチである。

金融市場のような低S/N比の問題とは相性が良い。

Ridgeとニューラルネット

Denseなモデリングでは、L1正則化よりもL2正則化が使われることが多い。

Ridge回帰は係数をゼロにせず、全体を縮小することで多数の特徴量を活用する。

ニューラルネットでも同様に、L2正則化(Weight Decay)がよく利用される。

L2正則化は弱いシグナルを保持したまま、過学習を抑える働きを持つ。

考え方を単純化すると、

  • L1:不要な特徴量を消す
  • L2:すべて残したまま弱める

という違いになる。

まとめ

金融市場では、強力な予測変数を少数見つけるよりも、

多数の弱いシグナルを統合する

方が現実に近い場合がある。

Denseなモデルは、個々の特徴量の強さではなく、集合として現れるわずかな優位性を利用するアプローチである。

市場が無数の小さな要因によって動いていると考えるなら、Denseな発想は自然な選択肢の一つと言える。