Risk.net Updates: Bloombergが独自の大規模言語モデルBloombergGPTを発表

BloombergGPT

BloombergGPT: Terminal giant enters the LLM race – Risk.net

arXivにBloombergGPTの論文が公開された。
GPTといえば最近話題のチャットボット”ChatGPT”のベースとなっている自然言語処理のモデルだが、BloombergGPTもGPTをベースに開発されている。

BloombergGPTはChatGPTのようなチャットボットを目指して開発されているものではない、とのことである。また、Bloombergのターミナル上で具体的に何か新機能がリリースされたということでもないらしい。

Bloombergによると、BloombergGPTの用途としては、ターミナル上の膨大な情報から、ユーザーが欲しい情報だけを抽出することである。
BloombergGPTは、金融データに特化した自然言語処理のモデルであり、ターミナル上のセンチメント分析、ニュース分類、チャート作成、質問応答機能などを幅広く支援する、ということのようだ。

例えば、「A社の株価の終値と時価総額を知りたい」と入力すると、BloombergGPTは具体的にそれらを取得するためのBloomberg関数 (BQL) の記述を出力する。Bloombergには以前から、BQL (Bloomberg Query Language) と呼ばれる、データ取得用言語があるが、その使い方を隅々まで覚えている人は少ない。また、取得するデータのティッカーを調べるのも面倒である。取得したいデータを伝えると具体的なBQL出力を返してくれる、というだけでも有用だろう。

BloombergGPTを訓練するために、金融に関する大量のテキストデータを食わせたようだ。ニュース、プレスリリース、ウェブスクレイピングで取得した金融関連のテキスト、Bloombergアーカイブから収集したSNSなどである。これらを集積した英文テキストのデータセット(FinPileと名付けられた)を構築し、教師データとしてGPTに食わせている。

ターミナルに既に実装されている機能の多くは、たいていのユーザーにとってそれほど不便に感じてはいないだろう。したがって既存の機能を高度化するというよりはむしろ、ユーザーが欲しい情報だけを便利に取得できるような、新たな機能が今後、ターミナルに追加されていくものと思われる。