「AIの進化と生成AIへの道のりとその仕組み」
AIの進化と生成AIへの道のりとその仕組み
過去数年間、最先端の技術とサービスは、その方向性、ダイナミクス、使用例を大幅に変えてきました。最近の産業におけるグローバル技術の採用の波は、人工知能(AI)とそのさまざまなバリエーションに圧倒されていることは明らかです。AIは私たちの日常生活の一部にますます組み込まれ、私たちの生活や仕事のあり方を変えています。本記事では、AI/MLの基礎、その使用方法、生成AI、プロンプトエンジニアリング、およびLangChainの進化について説明します。
AIとは何ですか?
AIは、学習や問題解決などの人間の知能や思考プロセスを模倣する能力です。かつては人間しかできなかった複雑なタスクを実行することができます。AIを通じて、非人間のシステムが数学的および論理的なアプローチを使用して、人々が新しい情報を学び、意思決定をするために使用する推論をシミュレートします。
人工知能には幅広い能力があり、多くの現実世界の応用が可能です。現在、よく使用されるAIの能力には、パターン認識、予測モデリング、自動化、画像認識、個別化などがあります。一部の高度なAIでは、車の運転やチェスや囲碁などの複雑なゲームをプレイすることさえ可能です。
機械学習はAIのサブセットであり、データを訓練に使用して複雑なタスクを実行するモデルを生成するためのアルゴリズムを使用します。現在、ほとんどのAIは機械学習を使用して行われるため、AIとMLはしばしば同義語として使用されます。微妙な違いは、AIはコンピューターソフトウェアやシステムを使用して人間のような認識を作成する一般的な概念を指し、MLはそれを行うための一つの方法を指します。MLは、経験に基づいてコンピューターシステムが自己学習し、改善を続けることを可能にします。
- 「火星のためのモルフォボット:カリフォルニア工科大学がNASAのミッション候補として全地形ロボットを開発」
- 「アフリカと中東で5人の生成型AIイノベーターに会おう」
- 「Rust言語を使う開発者が増えています」
利点
AIとMLは、ビジネスと消費者の両方にさまざまな利点をもたらします。ビジネスはコスト削減とより高い業務効率を期待することができ、消費者はより個別化されたサービスと提案を期待することができます。いくつかの主な利点は以下の通りです。
- 大規模で多様なデータを処理し、数学モデルを使用して分析し、具体的な洞察を予測することで、業務およびサポートコストを削減することができます。
- MTTR(修復までの平均時間)の改善とRTO目標の改善/達成。
- 顧客満足度の向上と、個別の顧客ニーズに合わせたサービスや提案の提供。
生成AIとは何ですか?
生成AI(GenAIとも呼ばれます)は、さまざまな入力に基づいてユーザーが新しいコンテンツを迅速に生成できるようにするためのアルゴリズムのセットを使用します。生成されるコンテンツには、テキスト、画像、サウンドトラック、ビデオなどが含まれます。これらのアルゴリズムは、巨大なラベル付けされていないデータをトレーニングに使用した大規模な言語モデルの上に構築されています。生成AIモデルの一つの突破口は、教師なし学習または半教師あり学習を含む異なる学習アプローチを活用できる能力です。
従来のAIとの違い
従来のAIと生成AIの主な違いは、それらの能力と応用にあります。従来のAIはパターン認識に優れていますが、生成AIはパターンの作成に優れています。従来のAIはデータを分析し、見えるものを伝えることができますが、生成AIは同じデータを使用してまったく新しいものを作成することができます。GenAIと人工知能の両方は、それぞれの結果を得るために機械学習アルゴリズムを使用します。ただし、それらには目標と目的が異なります。
FMとLLM
Foundation Model(FM)
Foundationモデルは、より特定のアプリケーションの基盤となるAIモデルです。これらのモデルは、テキスト、画像、音声の生成など、さまざまな可能なタスクとアプリケーションを実行するために設計されています。言い換えれば、元のモデルは他のものを構築するための基盤(したがって「foundation」)を提供します。Foundationモデルの典型的な例には、LLMとしてリストされている多くのシステムが含まれます。
Large Language Model(LLM)
大規模言語モデル(LLM)は、自然言語を処理して理解するために、ディープラーニングアルゴリズムとニューラルネットワーク技術を使用する機械学習モデルです。これらのモデルは、大量のテキストデータでトレーニングされ、言語内のパターンやエンティティの関係を学習します。これらのモデルは、自己教師あり学習と半教師あり学習を使用して数十億のデータで事前にトレーニングされます。これらのモデルは、手元のテキストの複雑なエンティティの関係を捉え、その特定の言語の意味論と構文を使用してテキストを生成することができます。LLMの一般的な使用例には、テキスト生成、機械翻訳、要約作成、テキストからの画像生成、機械コーディング、チャットボット、または対話型AIなどがあります。
大規模言語モデル(LLM)は、Foundationモデルというカテゴリに属しています。言語モデルは言語の入力を取り、合成された出力を生成しますが、Foundationモデルは言語以外の複数のデータ型でも動作します。つまり、マルチモーダルです。
多くの場合、「基礎モデル(FM)」は「大規模言語モデル(LLM)」と同義語として使用されます。なぜなら、言語モデルは現在、特定の目的に適応できる広範な能力を持つシステムの最も明確な例だからです。これらの用語の関連する違いは、「大規模言語モデル」が特に言語に焦点を当てたシステムを指すのに対し、「基礎モデル」は将来的に新しいタイプのシステムを収容するために広範な機能ベースの概念を確立しようとするものです。
GenAIの動作原理
生成AIは、LLM(大規模言語モデル)とデータ量によって学習が行われた機械学習モデルである基礎モデル(FM)によって動作します。
注意:この記事はLLMと生成AIの関連性に特化しています。
「大規模」という用語は、モデルが学習する際に自律的に変更できる値(パラメータ)の数を指します。成功したLLMのいくつかは数兆のパラメータを持っています。
LLMは、自己教師ありおよび/または教師なし学習を使用して、周囲の文脈に基づいて文の次のトークンを予測するために使用されます。LLMモデルは通常、トランスフォーマーベースのアーキテクチャに従い、入力シーケンスの重み付け合計を計算し、シーケンス内のトークン同士の関連性を動的に決定するための自己注意メカニズムを使用します。これにより、テキストシーケンス/文内の単語間の関係を位置に関係なく特定することができます。
LLMは、フューショット(非常に限られたラベル付きデータ)およびゼロショット(ラベル付きデータなし)のシナリオに使用されます。フューショットとゼロショットのアプローチの両方は、AIモデルが良好な帰納バイアスを持ち、限られた(またはない)データから有用な表現を学習する能力を持つことを必要とします。
LLMの価格設定
生成AIおよびそのサポートモデルの使用料は、受信する入力のボリュームと生成する出力のボリュームに基づいて請求されます。異なるLLMプロバイダは、モデルとボリュームを異なる方法で価格設定していますが、概念的には関連しています。トークンは、おおよそ4文字を表す測定単位です。文字は、単一の文字、数字、または記号です。たとえば、「footballer」という単語は8文字であり、2つのトークンよりもやや大きいです。一般的に、価格設定は1Kトークンまたは文字ごとに行われます。
LLMの主要コンポーネント
- 入力データ:大量の非構造化データ
- トークン化:トークン化は、テキスト文書をトークンと呼ばれるより小さい単位に分割します。トークナイザはテキストと整数のリストの間のマッピングを行います。目標は、予測的および/または規範的分析に適した数値データに非構造化テキスト文書を変換することです。トークナイザは通常、範囲{0、1、2、..V}の整数のみを出力し、Vは語彙サイズと呼ばれます。トークナイザの別の機能はテキストの圧縮であり、これにより計算時間を節約できます。
- 埋め込み:埋め込みは、モデルが処理および生成するトークンの意味と文脈を表す数値または配列です。埋め込みは、NLPモデルに入力として使用され、モデルがテキスト内の単語の意味を理解できるようにします。
- トランスフォーマー:トランスフォーマーは、自己注意メカニズムを使用して、LLMが単語や概念間の関係や接続を理解することを可能にします。このメカニズムは、特定のアイテム(トークンと呼ばれる)にスコア(一般的には重みと呼ばれる)を割り当てて関係を決定できます。トランスフォーマーにはエンコーダとデコーダの2つの部分があります。これらの2つの部分は独立してまたは一緒に使用できます。エンコーダのみ、デコーダのみ、エンコーダ-デコーダのいずれかです。トランスフォーマーは、エンコーダ側で自己注意、デコーダ側で注意を使用します。
産業における生成AI
産業の各ユースケースでの生成AIの実装には、さまざまなLLM/FMと基礎となるモデルの組み合わせが必要です。以下にいくつかのユースケースを示します:
- メディアとエンターテイメント:ビデオゲームから映画、アニメーション、ワールドビルディング、仮想現実まで、さまざまな範囲でより多くの創造性をもたらします。
- 自動車産業:設計者が与えたテキストの説明に基づいて車の3Dモデルを作成します。また、生成AIは自動運転車を訓練するための合成データを作成することもできます。
- 医療産業:生成モデルは、新しいタンパク質配列を開発して薬剤探索に役立つことで医学研究を支援することができます。また、医療記録の作成、医療コーディング、医療画像、ゲノム解析などのタスクの自動化も医療従事者に利益をもたらすことができます。
- 画像生成:テキストを画像に変換し、指定された設定、主題、スタイル、場所に基づいてリアルな画像を生成します。
- 意味的な画像から写真への変換:意味的な画像またはスケッチに基づいて、リアルなバージョンの画像を生成することができます。
- 音楽生成:生成AIは音楽制作にも役立ちます。音楽生成ツールを使用して広告やその他の創造的な目的のために新しい音楽素材を生成することができます。
- 個別のコンテンツ作成:個人の好み、興味、または思い出に基づいて個別のコンテンツ(テキスト、画像、音楽など)を生成します。
- 感情分析/テキスト分類:感情分析(意見マイニングとも呼ばれる)は、自然言語処理とテキストマイニングを使用して、書かれた材料の感情的な文脈を解読します。
- コード生成:手動でコーディングする必要なしにコードを生成します。コードを展開するために非常に少な
人気のあるLLM
以下に、最も人気のあるLLMの一部を示します:
プロンプトエンジニアリング
プロンプトエンジニアリングとは、専門タスクをより正確に実行するためにLLMをガイドするためのプロンプト(たとえば、質問)を開発する技術です。これには、所望の出力を達成するためにLLMに渡される指示とコンテキストが含まれます。これは、特定のプロンプトと推奨される出力に基づいてLLMを洗練させるAIエンジニアリングの技術であり、また、テキストや画像を生成するための様々な生成型AIサービスへの入力を洗練させるプロセスでもあります。
プロンプトは、次の2つのタイプに分けることができます:
- ハードプロンプト: 人間によってハードコーディングされ、手作りされたもの
- ソフトプロンプト: AIによって生成/構築されたもの
ソフトプロンプトは、複雑な質問をするのに適しています。プロンプト自体は、AIモデルを使用して生成することができます。プロンプトエンジニアリングは、AIエンジニアが言語モデルを効率的に使用するための有用なスキルとなっています。
プロンプトエンジニアリングと作業方法
ビジネスユーザーやオペレーションSMEがFAQ/トラブルシューティングを作成するために広く採用しているスキルは、プロンプト(関連する質問)の作成です。一方、GenAIとLLMは、これらのプロンプトに正確な回答を導き出すために一緒に使用されています。これを行う主な方法は2つあります。
まず、プロンプトの質問を特定のLLMモデルに送信し、モデルを実行して回答を取得します。LLMは、モデルを使用して利用可能なデータ(インターネットから収集されたデータ)を実行して、最良の回答を提供します。ただし、これは幻覚やバイアスの発生の原因となり、LLMが関連するデータ/入力/質問のコンテキストでトレーニングされていない可能性があります。
次に、LLMモデルをコンテキストに合わせて調整します。ここでの「コンテキスト」という言葉は、ユーザーが取り扱っている製品/ドメインの特定の情報をLLMが参照する必要があることを意味します。LLMモデル全体を調整することは、複雑で費用のかかる作業です。別の方法は、特定のコンテキストをLLMに外部から供給(埋め込み)し、その埋め込まれたデータに基づいて推論を行うための特定のモデルを使用することです。
埋め込みを使用したプロンプトエンジニアリングの全体的なワークフローは、以下に示されています:
LangChainを使用したプロンプトエンジニアリングの例
LangChainは、堅牢なLLMパワードアプリケーションを構築するためのオープンソースフレームワークです。LLMモデルへのAPI経由でのコーディングと統合を支援する一連のライブラリを提供しています。プロンプトテンプレートと環境設定のためのさまざまなクラスを提供します。LangChain自体はモデルを提供していませんが、他のLLMプロバイダのモデルを統合することができます。LangChainは、スキーマ、モデル、プロンプト、インデックス、メモリ、チェーン、およびエージェントの7つのコンポーネントへの開発者のアクセスを提供することで、LLMの機能を強化します。
以下は、LangChainとプロンプトのコードスニペットです。
IBMとGenAI Space
生成型AIの進化とその適用範囲の急速な拡大により、ITリーダーはAIと生成型AIを基にしたエンタープライズクライアント向けのソリューションを提供しようとしています。市場調査とアンケートに基づいて、クライアントが最も好ましい領域(GenAIの適用性)の1つはITSM(ITサービスマネジメント)であり、重要な問題/課題の予測、インシデントの回避、OpExの最適化/削減、MTTRおよび生産性の向上を目指しています。
生成型AIは、特にインシデント、問題、変更、および構成管理のコンテキストにおいて、ITオペレーションとサービスマネジメント(ITSM)の能力を向上させることができます。生成型AIの成功は、ビジネスコンテキスト、管理されるITサービス、ITSMプロセス、およびそれらの間の相互作用に対する強力な理解にかかっています。この理解は、AIシステムの設計と実装に反映されるべきです。適切なプラットフォームとAIモデルの選択に加えて、生成型AIの成功は、クリーンで高品質なデータと、AIモデルの管理、トレーニング/調整、および保守のスキルを持つことにも依存しています。
IBMは、WatsonxをバックエンドにしたAIベースのオペレーション管理に関する複数のアセットを開発しています。これらのアセットは、ITSMツール、パフォーマンスモニタリングツール、DevSecOps、ALMツール、WatsonxによってカスタムビルドされたAI/MLモデル、および視覚化のためのデータ収集ツールの組み合わせであるIBM Control Towerと共に、複数のクライアントに展開されています。以下に、いくつかのユースケースを示します:
- インシデント管理:生成型AIを使用して、インシデントの説明やその他の属性に基づいてインシデントの優先順位付けとルーティングを自動的に行います。また、過去のインシデントとの類似点を引きながら、潜在的な解決策を提案することもできます。
- インシデントの分類と優先順位付け:インシデントの性質と過去のデータを分析して、インシデントを正確に分類し優先順位付けします。これにより、重要なインシデントの迅速な解決とリソースの効果的な割り当てが可能となり、MTTRの改善に役立ちます。
- 予測的なインシデント管理:過去のデータと現在のシステムの状態を分析することで、生成型AIは潜在的なインシデントを予測し、予防策を提案することができます。これにより、システムのダウンタイムを減らし、サービスの可用性を向上させることができます。
- 問題管理:複数のインシデントのパターンを分析して、潜在的な問題を特定します。問題のデータに基づいて問題の仮説を生成し、さまざまなシナリオをシミュレートすることで、ITSMチームの原因分析と問題解決を支援します。これは、ITオペレーションのためのChatOps /バーチャル戦闘室での広範な使用ができます。そこでは、SMEs/SREs/サポートチームが自動的に参加し、予測分析と解決策を提供されます。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles