ETHチューリッヒの研究者たちは、LMQLという言語モデルとの相互作用のためのプログラミング言語を紹介しました

ETHチューリッヒの研究者たちは、LMQLという言語モデルとの相互作用のためのプログラミング言語を紹介しました' can be condensed to 'ETHチューリッヒの研究者は、LMQL言語モデルとの相互作用のためのプログラミング言語を紹介しました

大規模な言語モデルの性能は、質問応答やコード生成などのさまざまなタスクで印象的でした。言語モデルは、入力に基づいてシーケンスの統計的に妥当な結論を自動的に生成することができます。ユーザーは、話し言葉の指示や例を通じてこれらのモデルを訓練し、さまざまな後続の活動を行うことができます。より複雑なプロンプティング技術には、言語モデル、ユーザー、電卓などのサードパーティアプリケーションとの協力が含まれる場合もあります。最新のパフォーマンスを達成するためには、複雑なタスクおよびモデル固有のプログラムを実装する際に、アドホックなインタラクションが依然として必要な場合もあります。

これを踏まえ、スイスの研究者たちは、言語モデルプログラミング(LMP)という最先端の概念を紹介しました。LMPは、単純なテキストプロンプトを超えて言語モデルプロンプティングの範囲を拡大し、これらの2つの方法の自然なハイブリッドを提供します。さらに、LMPでは言語モデルが生成する結果を制限することができます。これにより、言語モデルの高い抽象度が実現され、さまざまな活動に容易に適応できます。研究者はLMPを実装するためにLMQL(Language Model Query Language)を使用しており、LMPプロンプトからの制約と制御フローを使用して、基礎となる言語モデルへのコストのかかる呼び出しの数を削減する効率的な推論技術を生成します。彼らは、既存のハイレベルAPIでは実装が難しい対話型フローを容易にするさまざまな先端プロンプティングメカニズムをLMQLがどのように捉えるかを示しています。この調査では、計算時間または使用料(有料APIの場合)を劇的に削減しながら、さまざまな下流の活動で精度を維持または向上させることを実証しています。

それはどのように機能しますか?

LMQLは、その宣言的な性質から、タスクの望ましい結果を指定するだけで、ロジックの制御フローの詳細を別の言語に任せます。それはSQLのアイデアを借りてPythonの上に構築されています。ユーザーは、モデルにテキストとプログラム可能な質問の両方を与えることができます。

このレポートでは、言語の文法の5つの主要なコンポーネントが特定されています。デコーダの役割は、テキスト生成アルゴリズムの秘密を解明することです。これは、データをより有用なもの、つまりより高品質でさまざまな表現方法に変換するコードの一部です。

言語モデルとの対話の基本的なツールは、Python構文で記述されたクエリブロックです。クエリブロックのトップレベルの各文字列は、個別のクエリを表します。クエリの対象モデルは、Model/from句で識別されます。これは、テキストが生成される言語的基盤を指定します。一方、Where句では結果を制御するパラメータを設定することができます。必要なプロパティを維持するために言語モデルが生成する必要がある内容を指定します。

LMQLのユーザーは、言語モデルによって生成される結果に洗練された論理的な制約を設定することができます。これらの制約からは、トークンレベルの予測マスクが自動的に生成されるため、テキストの生成の初めに厳格に強制されることができます。その結果、さまざまな制約を慎重に強制することができ、モデルは基準を満たすコンテンツのみを生成します。出力形式の保証が改善されたことにより、マルチパートのプロンプティングと統合がより簡単になりました。

主な貢献

  • この研究の著者たちが特定し、解決した現在のLMプロンプティング方法のいくつかの問題に対して、革新的な言語モデルプログラミングのパラダイムを紹介しています。
  • LMQLは、LM向けの高レベルクエリ言語であるため、スクリプトによるプロンプティングと出力の制限という2つの機能を提供しています。
  • 熱心な部分評価セマンティクスの最終的な抽象化と後続の抽象化の形式的な説明。これにより、一般的なガイドラインのみが与えられた場合でも、モデル固有のトークンマスクがLMデコーディングのために自動的に生成されます。
  • LMQLの徹底的な分析により、短く理解しやすいLMQLプログラムとしてさまざまな基本的および洗練されたプロンプティングアプローチを表現する方法が示され、LMQLの推論コストと実行時間を最大80%削減することができます。

研究者による事例研究によると:

  • LMQLの高い表現能力により、多くの最新の先端技術を、比較可能なPythonベースのものよりもはるかに少ない行数で実装することができます。
  • LMQLを使用することで、モデルクエリの数、効率性、実行時間が大幅に改善されます。トークンレベルの検証を可能にするLMQLの能力により、チャンク単位のデコーディングやバックトラッキングに頼らずに制約を動的に強制することができます。
  • LMQLはモデルの精度に影響しません。設定された制約によるわずかな精度向上が見られる場合もあります。

さらに、研究者たちは、有料のAPIゲートモデルの文脈で使用される場合、LMQLが請求可能なトークンの削減による著しい費用削減を提供することを実証しています。最後に、彼らはこれらのケーススタディが、LMQLの実用性に関する主張の信憑性を脅かす、実世界のプロンプトエンジニアとの並行して評価される包括的なユーザー調査とは別であることを指摘しています。このような研究の不足は、実用性に関する主張の信憑性を脅かすものであることを忘れてはなりません。

結論として、専門家は、(巨大な)言語モデルとの対話の新しいアプローチとして、言語モデルプログラミングを提案しています。直感的な構文を持つ高レベルのクエリ言語であるLMQLが導入されました。LMQLの評価セマンティクスは効率的に開発され、迅速なクエリ処理が可能となりました。彼らはケーススタディを通じて、高度なプロンプト方法を簡単で明確かつ高速なLMQLコードに変換することで、計算費用を最大80%削減することができることを証明しています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

MITの研究者が新しいAIツール「PhotoGuard」を導入し、不正な画像の操作を防止すると発表しました

AIパワードのテクノロジーが現実と製作物の境界をぼやかす画像を作り出す世界において、誤用のリスクが迫っています。DALL-E...

機械学習

「GoogleのDeblur AI:画像をシャープにする」

「私たちの常に進化するデジタル時代において、写真を通じて瞬間を捉えて共有することが私たちの生活の重要な一部となった中...

データサイエンス

AIフロンティアシリーズ:人材

私が初めて参加した「多業種のブレストセッション」から約3年が経ち、かつて野心的だと考えられていた機械学習の概念が、今で...

機械学習

「TADAをご紹介します 口述された説明を表現豊かな3Dアバターに変換するための強力なAI手法」

大規模言語モデルと拡散モデルの開発により、テキストから画像へのモデルを異なる可能性のあるニューラル3Dシーン表現と統合...

AI研究

「EPFLとAppleの研究者が4Mをオープンソース化:数十のモダリティとタスクにわたるマルチモーダルな基盤モデルの訓練のための人工知能フレームワーク」

大量の自然言語処理(NLP)タスクを広範に扱える大型言語モデル(LLM)をトレーニングすることは、より人気があります。NLPで...

機械学習

「40歳以上の方におすすめのクールなAIツール(2023年12月版)」

DeepSwap DeepSwapは、説得力のあるディープフェイクの動画や画像を作成したい人向けのAIベースのツールです。動画、写真、ミ...