機械学習か線型モデルか

バイサイドのクオンツでは、機械学習に肯定的な人もいれば否定的な人もいる。リスクマガジンの記事では、その両者の意見が紹介されている。

バイサイドで機械学習がよく用いられているのは、大量の取引を執行する際にマーケットインパクトを抑えるという、最良執行の分野だが、リスクマガジンの記事では、株価予測の分野に焦点を当てている。

ゴールドマンのクオンツは、機械学習が古典的な線型モデルをアウトパフォームしていると言っているが、

一方で、UBSのクオンツは、シャープレシオで見ると、ニューラルネットワークなどの機械学習モデルは、線型モデルを下回っていると言っている。

近年は、機械学習関連で、リスクマガジンにその他にも多くの記事が出ているが、必ずと言っていいほど話題にあがっているのが、その弱点である。特に、interpretabilityやexplainabilityの問題と、データ不足の問題の２つだ。

前者は、バイサイドであれば資産を預けてくれている顧客、セルサイドであれば規制当局に、機械学習モデルの挙動とそのアウトプットを、簡潔に説明するのが困難である、という問題だ。

バイサイドの顧客であれば、わかりやすいファクターのうち、どのファクターにウェイトをかけたから勝った、もしくは負けたのか、が知りたいだけだろう。そこで機械学習による銘柄選択について説明を受けても、直観的に理解するのが難しい。

後者は、日中のティックデータを用いるような分野であれば問題ないが、企業の財務情報を用いるようなファンダメンタル分析においては、四半期ごとしかデータがないため、さかのぼれてもせいぜい1企業につきデータは200個くらいだ。

この程度のデータでは、機械学習モデルを回して統計的に意味のあるアウトプットを得るのは難しい。

—–