Learn more about Search Results ランキング - Page 9

イェール大学とGoogle DeepMindの研究者は、大規模な言語モデルに対する高度な微調整技術を使用して数学の問題解決の成功を解き明かしました

“`html 最も先進的な大型言語モデル(LLMs)であるGPT-4やPaLM 2でも、数学の問題を解くのは困難です。なぜなら、それには想像力、数理的推論、計算が必要だからです。問題に複数回取り組むことが許可されると、LLMsが正しい答えを見つける可能性はかなり高くなります。したがって、LLMsはすでにこの数学の問題解決の課題を改善する可能性を示しています。例えば、事前学習済みのPaLM 2-Lは、greedy decodingを使用した場合に約33.4%の正確さを達成することができます。しかし、temperature samplingを使用して64の解をサンプリングすると、少なくとも1つの正解(pass@64)が79.4%の確率で得られます(表1)。 表1:教師あり解の微調整の結果。トレーニングデータの2つの異なるソースであるMATHデータセットとPRM800Kデータセットを比較しています。 この大きな性能の差は、LLMsが正確な答えを生成できる一方で、正しい解と誤った解を区別することが困難であることを示しています。したがって、上記の性能差を縮小するために、彼らはタスク固有の微調整技術を調査して、LLMの解決力と評価力を向上させようとしています。 彼らは3つの微調整技術を検討しています: (1)SSFT、教師あり段階的解の微調整。事前学習済みLLMsが出発点として教師あり微調整ステップを受けることで利益を得られるかどうかを調査します。 LLMsを調整して、完全な解答を提供するようにします。 (2)解クラスタ再順位付け(SCR)。候補解の再順位付けのための解評価器として生成器を改善し、LLMの解評価能力を向上させます。以前の研究では解のサンプル順位付けまたは再順位付けが行われてきましたが、彼らは多数決の利点と再順位付けを組み合わせる新しい手法を提案し、ランキングのコストを削減します。より具体的には、多数決の初期段階で、数学的等価性に基づいて候補解をいくつかのグループに分類します。さらに多数決の結果をさらに向上させるために、最頻クラスタの解に解評価器を適用します。 (3)シーケンシャルマルチタスク微調整。解評価タスクに加えて、LLMの解生成タスクの性能向上にも関心があり、解評価タスクのトレーニング目標がモデルの解生成に役立つかどうかを判断します。 これを実現するために、解評価タスクを自然言語生成問題としてフレーム化し、そのトレーニング目標が解生成モデルに有益な監督信号を提供できるようにします。さらに具体的には、モデルを3つのステージで調整します:(1)生成器として(SSFT)、(2)解評価器として(SCR)、および(3)再び生成器として(SSFT)。 彼らは、難しいMATHデータセット上でPaLM 2-S*とPaLM 2-LのようなPaLM 2の小さな形式と大きな形式を使用して包括的な研究を行い、以下の結論を示しています: • 微細な、適切なフォーマットの解答によっては、SSFTがより良いパフォーマンスを発揮するため、ステップバイステップの解の品質とスタイルは洗練されたモデルに大きな影響を与えることがあります。 • 最も一般的な解クラスタのみを再順位付けすることで、すべての解を再順位付けするよりも性能が向上し、演算効率も向上します。これが将来の作業におけるより良い標準的な方法であると考えられます。 • 解生成モデルの性能を向上させるために、解生成と評価の両方のタスクでモデルをトレーニングする利点を示し、評価タスクの学習信号が生成モデルにとって有益であるという成功した試みを示しています。教師あり解微調整のみよりも、彼らの提案するマルチタスクシーケンシャル微調整は解生成モデルのパフォーマンスをより効果的に向上させることができます。…

「機械学習をマスターするための5つの無料の本」

機械学習は、現在コンピュータ科学の中でも最もエキサイティングな分野の一つですこの記事では、2023年に機械学習を学ぶための最高かつ無料の5冊の書籍を紹介します

「人気コンテストをごまかすためのGitHubのブラックマーケット」

「GitHubでの人気は、開発者やスタートアップにとって貴重なチャンスを提供しますアングラストアではプラットフォーム上で「スター」を売っており、コーダーには、本当に成功するまでそれを偽り続ける方法があります」

『Talent.com』において

この投稿は、アナトリー・ホメンコ(機械学習エンジニア)とアブデノール・ベズーウ(テクノロジー担当最高技術責任者)によって共同執筆されました2011年に設立されたTalent.comは、世界最大級の雇用情報のソースの一つです同社は、クライアントの有料求人リストと公開求人リストを統合し、1つの検索可能なプラットフォームにまとめています登録されている求人は3,000万件以上あります[…]

「RAGの語義における課題に取り組む ドメイン固有の検索の見落とされがちな面について」

数千のドメイン固有ドキュメントが類似点を持ち、埋め込みでは関連するドキュメントを検索する際に一部不足がある場合、ハイブリッド検索、階層的ドキュメント順位付け、指導者埋め込みを利用して、コモン・レトリーバル・オーグメンテッド・ジェネレーション(RAG)セットアップに対処します

「Seabornを使用してネストされた棒グラフを作成する」

ネストされた棒グラフは、カテゴリ内の複数の測定値を比較する視覚化手法ですこれらの測定値のうちの1つは、ターゲットや背景メジャーなどのセカンダリメジャーを表します

Amazon PersonalizeとAmazon OpenSearch Serviceの統合により、検索結果をパーソナライズします

アマゾンパーソナライズは、Amazon OpenSearch Serviceとの新しい統合を開始し、それにより各ユーザーの検索結果を個別にパーソナライズし、彼らの検索ニーズを予測することができますOpenSearch Service内のAmazon Personalize Search Rankingプラグインを使用すると、ウェブサイトとアプリの検索からエンドユーザーの関与度とコンバージョンを向上させることができます

「ウォルマート、よりパーソナライズされたショッピング体験を提供するためにAIを活用」

小売りの巨人ウォルマートは、顧客により個人に合わせたショッピング体験を提供するためにAIを活用しようとしています同社がAIを使ったプログラムを利用するのは初めてではありません今年早くも、ウォルマートはAIパワードのアプリを本社の従業員向けに作成しましたフォックスニュースの報道によれば...

RAGアプリケーションデザインにおける実用的な考慮事項

「RAG(Retrieval Augmented Generation)アーキテクチャは、LLMの入力長制限と知識切り上げの問題を効率的に克服することが証明されています現在のLLMテクニカルスタックでは、RAGが…」

テキストをベクトルに変換する:TSDAEによる強化埋め込みの非教示アプローチ

TSDAEの事前学習を対象ドメインで行い、汎用コーパスでの教師付き微調整と組み合わせることで、特化ドメインの埋め込みの品質を向上させる埋め込みはテキストをエンコードする...

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us