「金融分野における生成型AI:FinGPT、BloombergGPT そしてその先へ」

「金融業界の進化する生成型AI:FinGPT、BloombergGPT そして新たなフロンティアへ」

生成AIは、入力データに似ている新しいデータサンプルを生成できるモデルを指します。ChatGPTの成功により、多くの業界で様々な機会が開かれ、企業は独自の大規模言語モデルを設計することにインスピレーションを受けました。データによって推進される金融セクターは、今や以前よりもよりデータ集約的なものとなっています。

私はフランスの金融サービス会社でデータサイエンティストとして働いています。1年以上そこに勤務してきましたが、最近、タスクの自動化や堅牢で安全なAIシステムの構築のためのLLMの使用例が全ての部門で大幅に増加していることを観察しました。

すべての金融サービスは、LLAMA 2Falconなどのオープンソースモデルを使用して独自の微調整済みLLMを作成することを目指しています。特に、数十年分の金融データを持つ従来の銀行での使用が多いです。

これまでは、限られた計算リソースと複雑性の低いモデルのために、この膨大なデータ量を単一のモデルに組み込むことは実現不可能でした。しかし、これらの数十億のパラメータを持つオープンソースモデルは、大量のテキストデータセットに対して微調整が可能です。データはこれらのモデルにとって燃料のような存在であり、データが多ければ多いほど結果は良くなります。

データとLLMモデルの両方が自動化、効率性、正確性などを高めることで、銀行や他の金融サービスに数百万ドルの節約をもたらすことができます。

McKinseyによる最新の推定では、この生成AIは銀行業界だけで年間3400億ドルの節約をもたらす可能性があるとされています。

BloombergGPTと生成AIの経済学

2023年3月、BloombergはBloombergGPTを披露しました。これは金融データに特化した500億のパラメータで構築された言語モデルです。

お金を節約するためには、時にはお金を費やす必要があります。BloombergGPTやMetaのLlama 2などのモデルのトレーニングは安くありません。

Llama 2の700億パラメータモデルのトレーニングには170万GPU時間が必要でした。商用クラウドサービスでNvidia A100 GPU(Llama 2用)を使用すると、1つのGPU時間あたり1ドルから2ドルの費用がかかります。計算してみると、100億パラメータモデルのコストは約15万ドル、1000億パラメータモデルのコストは150万ドル以上になる可能性があります。

もしレンタルせずにGPUを購入する場合、1000個のA100 GPUをクラスタに組み込むためには1000万ドル以上の費用がかかるかもしれません。

Bloombergが100万ドル以上の投資をしたことは、AIの急速な進歩と対比すると特に注目に値します。驚くべきことに、たった100ドルのモデルが半年でBloombergGPTの性能を上回ることができました。BloombergGPTのトレーニングには独自のデータが組み込まれていましたが、データセットの大部分(99.30%)は公にアクセス可能でした。そこにFinGPTが登場します。

FinGPT

FinGPTは、最先端の金融用微調整言語モデル(FinLLM)です。AI4Finance-Foundationによって開発され、FinGPTは一般的なコスト効率と精度の面で他のモデルを上回っています。

現在3つのバージョンがあり、FinGPT v3シリーズはLoRAメソッドを使用して改良されたモデルで、ニュースやツイートを分析するためにトレーニングされています。多くの金融感情テストで最も優れた結果を示します。FinGPT v3.1はchatglm2-6Bモデルに基づいており、FinGPT v3.2はLlama2-7bモデルに基づいています。

 

FINGPT

FINGPT

FinGPTの操作:

  1. データの取得とエンジニアリング:
    • データの取得: Yahoo、Reutersなどの信頼性のあるソースからデータを使用し、FinGPTは米国株から中国株まで幅広い金融ニュースを統合します。
    • データの処理: この生データは多くの段階を経て、関連性と精度を確保するためのクリーニング、トークン化、プロンプトエンジニアリングが行われます。
  2. 大規模言語モデル(LLM):
    • トレーニング: キュレーションされたデータを使用することで、LLMは特定のニーズに合わせた軽量モデルの作成だけでなく、既存のモデルやAPIをサポートするように適応させることもできます。
    • 微調整戦略:
      • テンソル層(LoRA%20LoRA%20(Low%2DRank%20Adaptation))): FinGPTのようなモデルを開発する際の主要な課題の1つは、高品質のラベル付きデータを取得することです。この課題に対して、FinGPTは革新的なアプローチを採用しています。従来のラベリングにのみ頼るのではなく、市場駆動の株価の変動をラベルとして利用し、ニュースの感情を肯定的、否定的、または中立といった具体的なラベルに翻訳します。これにより、モデルの予測能力が大幅に向上し、特に肯定的な感情と否定的な感情を識別する能力が向上します。LoRAなどの微調整技術を使用することで、FinGPT v3は性能を最適化しながら計算オーバーヘッドを削減しました。
      • 人間のフィードバックからの強化学習: FinGPTは「RLHF(人間のフィードバックからの強化学習)」を使用しています。BloombergGPTにはないこの機能により

        FinGPT comparision with GPT-4 LLAMA 2 bloomberg gpt

        ChatGLM、LLAMA 2、BloombergGPTとのFinGPTの比較

        FinGPTの現在の軌道と将来について:2023年7月はFinGPTにとって興奮するマイルストーンとなります。チームは「Instruct-FinGPT: Finance Sentiment Analysis by Instruction Tuning of General-Purpose Large Language Models」と題した研究論文を発表しました。この論文の中心には、FinGPTが複雑な金融センチメント分析を実行できるようにするためのテクニックであるinstruction tuningの探求があります。

        しかし、FinGPTはセンチメント分析に限定されていません。実際、19の他の多様なアプリケーションが利用可能であり、それぞれがLLMsを新しい方法で活用することを約束しています。プロンプトの設計から複雑な金融コンテキストの理解まで、FinGPTは金融領域において多目的なGenAIモデルとして確立しています。

        グローバル銀行が生成型AIを受け入れる方法

        2023年の始まりには、Bank of America、Citigroup、Goldman Sachsなどの主要な金融プレーヤーが従業員のOpenAI’s ChatGPTの使用に制約を課した一方で、業界の他の対応策はより受容的な姿勢を選んでいます。

        たとえば、Morgan Stanleyでは、OpenAIのパワードチャットボットを彼らのファイナンシャルアドバイザーのツールとして統合しています。同社の広範な内部調査とデータにアクセスすることで、これらのチャットボットは豊富な知識リソースとして機能し、ファイナンシャルアドバイザーの効率と正確性を高めます。

        今年3月、ヘッジファンドのシタデルは、エンタープライズ全体にわたるChatGPTライセンスを確保するためのナビゲーションを行っていました。将来の実施では、ソフトウェア開発や複雑な情報分析などの領域の強化が予想されています。

        JPモルガン・チェースは、大規模な言語モデルを詐欺検出に活用するための努力もしています。彼らの手法は、電子メールのパターンを活用して潜在的な妥協点を特定することに焦点を当てています。そして、彼らはさらなる目標を設定しています:AIを利用して< a href=”https://www.voagi.com/amazon-to-invest-up-to-4-billion-into-ai-startup-anthropic.html”>年末までに最大15億ドルの価値を追加するという野心的な目標です。

        Goldman Sachsに関しては、彼らは完全にAIの魅力に抵抗しないわけではありません。同行は生成型AIの力を活用してソフトウェアエンジニアリングの領域を強化しています。ゴールドマン・サックスのマルコ・アルジェンティ最高情報責任者は、その統合が彼らの労働力を「超人的なもの」に変える可能性を持つと述べています。

        銀行および金融業界における生成型AIの使用例

        Generative AI in Finance USE CASES

        金融における生成型AIの使用例

        生成型AIは、金融のオペレーション、意思決定、および顧客とのインタラクションを根本的に変えています。以下では、そのアプリケーションの詳細な探索を行います:

        1. 不正防止: 生成型AIは、先進的な不正検出メカニズムの開発の最前線にいます。広範なデータプールを分析することで、緻密なパターンや異常を見分け出し、より積極的なアプローチを提供します。伝統的なシステムは、データの量に圧倒されることがあり、誤検知を生み出すかもしれません。これに対して、生成型AIは理解を継続的に洗練し、エラーを減らし、より安全な金融取引を確保します。

        2. 信用リスク評価: 借り手の信用力を評価する伝統的な方法は、信頼性がありながらも時代遅れになりつつあります。生成型AIモデルは、信用履歴から微妙な行動パターンまで、多様なパラメータを通じて包括的なリスクプロファイルを提供します。これにより、より安全な貸し出しを確保するだけでなく、伝統的な指標では十分にサービスの提供を受けていない顧客を含めた幅広い顧客層に対応することができます。

        3. 顧客との相互作用の強化: 金融界では、生成型AIを搭載したNLPモデルによる顧客サービスの革新が起こっています。これらのモデルは、さまざまな顧客の問い合わせを理解し、迅速に個別の解決策を提供することに長けています。ルーティンタスクの自動化により、金融機関は経費を削減し、業務を効率化し、何よりも顧客の満足度を高めることができます。

        4. さまざまな要素に合わせた財務: ワンサイズフィットオールは過去の遺物です。現代の顧客は、自分たちの独自のニーズと目標に合わせた財務計画を要求しています。生成型AIはここで優れています。支出パターンから投資の嗜好までのデータを分析し、個別に合わせた財務ロードマップを作成します。このホリスティックなアプローチにより、顧客はよりよく情報を得て、将来の財務状況をよりうまく対処することができます。

        5. アルゴリズムトレーディング: 生成型AIの分析力は、アルゴリズムトレーディングの変動の激しい世界で非常に貴重です。市場のトレンドからニュースの感情までのデータを分析し、独自の洞察を提供することで、金融の専門家は戦略を最適化し、市場の変動を予測し、潜在的なリスクを軽減することができます。

        6. コンプライアンスフレームワークの強化: 反マネーロンダリング(AML)規制は、金融システムの完全性を維持するために重要です。生成型AIは、複雑な取引データを分析して不審な活動を特定することで、コンプライアンスを簡素化します。これにより、金融機関はグローバルスタンダードに準拠するだけでなく、誤検知の可能性を大幅に減らし、業務を効率化することができます。

        7. サイバーセキュリティ: サイバー脅威は絶えず進化しているため、金融部門は迅速な解決策が必要です。生成型AIはまさにその解決策を提供します。動的な予測モデルを実装することで、脅威の迅速な検出を可能にし、金融のインフラストラクチャを潜在的な侵害から守ります。

        ただし、どの進化しているテクノロジーでも、金融業界においては生成型AIに特有の一連の課題があります。

        課題

        1. バイアスの増幅: AIモデルは洗練されていても、依然として人間によるトレーニングデータに頼っています。意図的であろうとなかろうと、このデータにはバイアスがあり、結果に偏りが生じる可能性があります。たとえば、特定の人口集団がトレーニングセットで過小評価されている場合、AIの出力にもその見落としが反映される可能性があります。公平さと公正さが重要な金融のような分野では、このようなバイアスは重大な結果をもたらす可能性があります。金融のリーダーは、これらのバイアスを積極的に特定し、データセットができるだけ包括的かつ代表的であることを確保する必要があります。
        2. 出力の信頼性と意思決定: 生成型AIは、時に間違った情報や誤解を生むことがあります。これは「幻覚」とも呼ばれます。 AIモデルが磨かれて学んでいくうちに、これらの誤りはある程度予測されますが、精度が妥協できない金融業界では、その影響は深刻です。ローンの承認などの重要な決定において、AIに完全に依存することは危険です。代わりに、AIは金融の専門家を補完する洗練されたツールとして捉えるべきです。 AIは計算の重みを担当し、人間の専門家が最終的かつ情報を元にした意思決定を行うための洞察を提供すべきです。
        3. データプライバシーとコンプライアンス: 機密性の高い顧客データの保護は、生成型AIの利用において重要な関心事です。一般データ保護規則(GDPR)やカリフォルニア消費者プライバシー法(CCPA)など、グローバルスタンダードに準拠することが重要です。AIはこれらの境界を本質的に知らないか尊重しない場合があるため、金融業界では機密性が極めて重要です。データ保護ガイドラインに厳格に準拠することで、AIの使用を調整する必要があります。
        4. 入力データの品質: 生成型AIは与えられたデータの質によって決まります。不正確または不完全なデータは、単に劣った財務アドバイスや意思決定につながる可能性があります。

        結論

        取引戦略の強化からセキュリティの強化まで、生成型AIの適用範囲は広範で変革的です。ただし、他のどの技術と同様に、倫理的なおよびプライバシー上の問題を考慮しながら採用することが重要です。

        生成型AIの潜在能力を成功裏に活かし、同時にその制約と潜在的な落とし穴を尊重する機関こそ、確実に世界の金融業界の将来的な軌道を築くことができるでしょう。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

「Prolificの機械学習エンジニア兼AIコンサルタント、ノラ・ペトロヴァ – インタビューシリーズ」

『Nora Petrovaは、Prolificの機械学習エンジニア兼AIコンサルタントですProlificは2014年に設立され、既にGoogle、スタンフ...

機械学習

3つの質問:大規模言語モデルについて、Jacob Andreasに聞く

CSAILの科学者は、最新の機械学習モデルを通じた自然言語処理の研究と、言語が他の種類の人工知能をどのように高めるかの調査...

AIニュース

Q&A:ブラジルの政治、アマゾンの人権、AIについてのGabriela Sá Pessoaの見解

ブラジルの社会正義のジャーナリストは、MIT国際研究センターのフェローです

人工知能

「マーク・A・レムリー教授による生成AIと法律について」

データサイエンス内で新しい分野が現れ、研究内容が理解しにくい場合は、専門家やパイオニアと話すことが最善です最近、私た...

人工知能

ディープAIの共同創業者兼CEO、ケビン・バラゴナ氏- インタビューシリーズ

ディープAIの創設者であるケビン・バラゴナは、10年以上の経験を持つプロのソフトウェアエンジニア兼製品開発者です彼の目標...

機械学習

もし芸術が私たちの人間性を表現する方法であるなら、人工知能はどこに適合するのでしょうか?

MITのポストドクターであるジヴ・エプスタイン氏(SM '19、PhD '23)は、芸術やその他のメディアを作成するために生成的AIを...