生成 AI の嵐が近づいています。ChatGPT は金融アナリストの仕事を奪うでしょうか?
良いニュースは、ChatGPT のような製品は CFA 試験に合格して大手金融機関のドアをノックすることはできない可能性が高いということですが、悪いニュースは、経済学と法律を専門とする若手のセルサイド アナリストをある程度置き換えることができるということです。度です。
最新の証拠は、最近発表された2つの学術論文から得られたもので、研究者らはChatGPTを使用して、FRB声明の「タカ派・ハト派」の内容と、そのニュースが株価にとって良いのか悪いのかを解釈した。
結果は、ChatGPT が非常に優れたパフォーマンスを示し、従来の分析手法を上回っただけでなく、他の既存の生成 AI モデルの敵対者にも勝利したことを示しています。
ChatGPT は連邦準備制度の「謎」を解く上ではるかに先を行っています
4月10日、リッチモンド連銀の定量的監視研究グループのメンバー2名が「ChatGPTは連銀の演説を解読できるか」と題する論文を発表し、演説から連銀の態度を判断するGPT-3モデルの能力をテストした。
2人の研究者がFOMC発表から無作為に500文を選択し、それが「ハト派」、「基本的にハト派」、「中立」、「基本的にタカ派」、または「タカ派」のいずれであるかを人間に判断させた。対応する数値は-1、-0.5であった。 、0、0.5、1。
ここで言及する価値があるのは、GPTがFRBの声明のニュアンスを識別できるかどうかをテストするために、研究者らが3つのカテゴリー(「ハト派」、中立的、「タカ派」)ではなく5つのカテゴリーを使用したことである。
人間の参照グループの精度を向上させるために、これらの文は 3 人の人間のレビュー担当者によって個別にラベル付けされ、各ラベルの下に対応する文の数が数えられ、3 つの結果が平均されました。
ChatGPT では、Google Bert ラージ モデル、金融センチメント辞書の Loughran & McDonald (LM)、Henry、日常言語センチメント辞書の Mohammad および Turney など、他のニューラル ネットワーク言語モデル (NLP) が試験に参加しています。
テストは 2 つの部分に分かれています。研究者らはまず、機械候補者にサンプルから学習せずにテストを受けるよう依頼し、次に残りの 100 文を処理する前に 400 文の分類を学習するように依頼しました。
その結果、「裸のテスト」であるかどうかに関係なく、ChatGPTによるFRBの演説の解釈は、すべてのマシン受験者の中で最も人間に近いことが示された。
まずは「全裸検査」の結果を見てみましょう。
GPT-3 によって生成されるラベルは、特に「Dove」、「Basic Hawk」、および「Hawk」ラベルなど、人間に最もよく一致します。
バートは「ハト」文の数を大幅に過大評価し、感情辞書は「ハト」または「基本的なタカ」および「ハト」文の数を大幅に過小評価しました。
研究結果の誤差を減らすために、研究者らは結果の平均絶対誤差(MAE)、二乗平均平方根誤差(RMSE)、比較精度、カッパ係数(一貫性テストに使用される指標)も計算しました。
研究者らは、研究の精度をさらに向上させるために、F1 スコアとバランスの取れた精度 (どちらも機械学習モデルの評価指標) も使用しました。
結果は、GPT-3 スコアが他のマシンよりもはるかに優れていることを示しています。
MAE および RMSE エラー値が最小であり、精度とカッパ係数が最高であり、F1 スコアとバランスのとれた精度さえも、他のマシンよりもほぼ高くなっています。
Bert モデルのパフォーマンスは GPT-3 ほどではありませんが、感情辞書よりは優れています。
次に、十分な勉強をした後のテストの点数を見てみましょう。
予想通り、GPT-3 が再び 1 位となり、パフォーマンスが大幅に向上しました。
最も目を引くのは、MAEエラー値が「裸のテスト」スコアのほぼ半分になり、精度が1.5倍近く向上し、カッパ係数が2倍以上になったことです。
GPT-3の性能は本当にすごいです。
たとえば、連邦準備制度による2013年5月の声明の文言を考えてみましょう。
FRBは「全体的に労働市場の状況はここ数カ月で改善したが、失業率は依然として高水準にある」と述べた。
ChatGPT の分類は「基本的にハト派」であり、アナリストの結果と完全に一致しています。
研究者たちは次のように驚きました。
分類はともかく、GPT モデルは、特定の文に特定の方法でタグが付けられている理由を説明することができ、これは既存の NLP モデルを超える能力であり、研究者にとって非常に重要です。
研究者らは報告書の最後でGPT-4とGPT-3を比較し、ほとんどの場合、前者のほうがFRBの演説を「解読」する能力が強いことを発見した。
たとえば、連邦準備制度による次の文を考えてみましょう。
現在のインフレ率は2%を下回っており、委員会はインフレ目標に向けた進捗状況を注意深く監視していく。
GPT-3は「中立」と評価したが、GPT-4はアナリストが示した「ハト派」の分類に近い「基本的にハト派」と評価した。
まだ株価を予測できますか?
フロリダ大学の 2 人の研究者は最近、「ChatGPT は株価の傾向を予測できますか?」というタイトルの記事を発表しました。予測可能性と大規模言語モデルを返す」の論文。
この調査は基本的にChatGPTにそのニュースが良いか悪いか、あるいは株価と無関係であるかを判断してもらい、ChatGPTが解釈した結果に基づいて企業の株価の動向を予測します。
これは実際、FRBの声明を解読する研究とほぼ同じです。
研究者はChatGPTにヒントを与える:
あなたは株式を推奨した経験を持つ金融の専門家であると想定してください。次のニュースが良いニュースであれば「はい」、悪いニュースであれば「いいえ」、よくわからない場合は「不明」と答えてください。
次に研究者らは、ChatGPTに対し、そのニュースが短期的/長期的に企業の株価にとって良いのか悪いのかを一文で簡潔に説明するよう依頼した。
研究者らは、ChatGPT の回答を対応する数値に変換し、「はい」、「いいえ」、「不明」がそれぞれ 1、-1、0 に対応します。ある企業が特定の日に複数の大きなニュースを報道した場合、研究者はその数値を平均しました。
最後に、研究者らは、ChatGPT によってスコア化されたスコアを通じて翌日の株式収益を分析し、そのスコアに対して線形回帰分析を実行しました。
この期間のデータは ChatGPT ビッグ データ トレーニングに含まれていないため、研究で使用されるデータは 2021 年後半以降であることに注意してください。
Oracle からのニュースを例に挙げます。
エンタープライズソフトウェア製品およびサービスのプロバイダーであるリミニストリートは、Oracle の訴訟で 63 万ドルの罰金を科されました。
このニュースはオラクルにとって良いことですか、それとも悪いことですか?
ChatGPT の応答:
はい(対応する数字は1)、リミニストリートに対する罰金は、オラクルが知的財産を保護し、その製品とサービスに対する需要を増加させるという投資家の信頼を高める可能性があります。
したがって、ChatGPT は、このニュースが Oracle の株価にとって有益であると考えています。
これと比較して、レイブンパックは株価にマイナス感情スコア -0.52 を与え、このニュースがネガティブであると考えられることを示しました。
この研究では最終的に、ChatGPT によって生成されたセンチメント スコアが株価動向と強い統計的相関関係があることが判明しました。ただし、GPT-1、GPT-2、Bert などのより基本的なモデルは正確に予測できません。
この結果は、ChatGPT モデルが株式市場のリターンの予測において RavenPack などの既存のセンチメント分析手法よりも優れていることも示しています。
この結果に基づいて、研究者らは、今後の研究は大規模言語モデル (LLM) が予測機能を獲得するメカニズムの理解に焦点を当てる必要があると考えています。
ChatGPT のようなモデルが株式リターンの予測に成功する要因を特定することで、研究者はこれらのモデルを改善し、金融における有用性を最大化するための、より的を絞った戦略を開発できます。
ウォール街の洞察
Wall Street News App は、中国の金融情報とビジネス情報を提供する大手プロバイダーであり、24 時間年中無休でユーザーにとって重要な国内および世界の情報を厳選しています。
2890のオリジナルコンテンツ
一般公開なし