Search Results OPT

ディープラーニングライブラリーの紹介：PyTorchとLightning AI

PyTorchとLightning AIの簡単な説明

Machine learning

分岐と限定法 -アルゴリズムをスクラッチからコーディングする前の導入

整数計画（IP）は、決定変数が整数値に制約される線形計画（LP）の特殊なケースですつまり、2.5や4.2のような値は解として考えられません

「Matplotlibのマスタリング：データ可視化の包括的なガイド」

こんにちは、データ愛好家👋 データはビジュアライゼーションを通じてより理解しやすくなることを知っていますそれは洞察を得るのに役立つだけでなく、ビジュアライゼーションはクライアントに洞察を説明するのも簡単にします...

大規模言語モデル：RoBERTa — ロバストに最適化されたBERTアプローチ

BERTモデルの登場は、自然言語処理（NLP）の大きな進歩をもたらしましたBERTはTransformerからアーキテクチャを派生させ、言語モデリングなどのさまざまな下流タスクで最先端の結果を達成しています

「Hugging FaceはLLMのための新しいGitHubです」

ハギングフェイスは、大規模言語モデル（LLM）のための「GitHub」となりつつありますハギングフェイスは、LLMの開発と展開を簡素化するツールを提供しています

「Amazon SageMakerを使用したRLHFによるLLMsの改善」

このブログ投稿では、人気のあるオープンソースのRLHFリポTrlxを使用して、Amazon SageMaker上でRLHFを実行する方法を説明します私たちの実験を通じて、Anthropicが提供する公開可能なHelpfulness and Harmlessness（HH）データセットを使用して、大規模な言語モデルの役立ち度または無害性を向上させるためにRLHFを使用する方法を示しますこのデータセットを使用して、ml.p4d.24xlargeインスタンスで実行されているAmazon SageMaker Studioノートブックを使用して実験を行います最後に、私たちの実験を再現するためのJupyterノートブックを提供します

「自分の武器を選ぶ：うつ病AIコンサルタントの生存戦略」

最新のターミネーターの映画が最近公開されましたこの新しいエピソードでは、未来の人間の抵抗組織がロボットを過去に送り、OpenAIのサーバーファームを破壊し、それによって…の出現を防ぎます

データストレージの最適化：SQLにおけるデータ型と正規化の探索

SQLにおけるデータ型と正規化の技術について学び、データストレージの最適化に非常に役立ちます

SQL

「ゼロからLLMを構築する方法」

「これは、大規模言語モデル（LLM）を実践的に使用するシリーズの6番目の記事です以前の記事では、プロンプトエンジニアリングとファインチューニングを通じて事前学習済みのLLMを活用する方法について詳しく調査しましたこれらに対して…」

MAmmoTHとは、一般的な数学問題解決に特化したオープンソースの大規模言語モデル（LLM）シリーズです

現代の大規模言語モデル（LLM）は、数学的な推論に大きく依存しており、それがこの研究の主な焦点です。最近の進歩にもかかわらず、クローズドソースのモデル（GPT-4、PaLM-2、Claude 2など）は、GSM8KやMATHなどの人気のある数学的な推論のベンチマークを支配しており、オープンソースのモデル（Llama、Falcon、OPTなど）は遠く及ばない状況があります。このギャップを埋めるためには、2つの主要なアプローチがあります： GalacticaやMINERVAなどの継続的な事前学習：この方法では、数学に関連するウェブデータの100Bトークン以上を用いてLLMをトレーニングしています。計算コストが高いですが、この方法によりモデルの科学的推論能力が一般的に向上します。 RFT（rejection sampling fine-tuning）やWizardMathなどのデータセットごとに特化したファインチューニング手法：これらの手法は、それぞれのドメイン内では効果的ですが、推論が必要な数学の他の領域には適用できません。ウォータールー大学、オハイオ州立大学、HKUST、エディンバラ大学、IN.AIの最近の研究は、軽量かつ汎用性のある数学の指導調整技術を採用し、LLMの数学的推論能力を向上させる方法を模索しています（ファインチューニングタスクだけでなく一般的に）。現在のアプローチは、Chain-of-Thought（CoT）の方法論に大いに依存しており、数学の問題を自然言語のステップで解決する方法を説明しています。しかし、この方法は計算精度や難しい数学的・アルゴリズム的推論手法には対応しきれません。PoTやPALのようなコードベースの手法では、数学問題の解決手順を効率化するためにサードパーティのリソースを使用します。この方法では、計算量の多いタスク（例：sympyを使用した二次方程式の解法やnumpyを使用した行列の固有値の計算など）を別のPythonインタプリタに委任することが推奨されます。一方、PoTはより抽象的な推論シナリオ（常識的な推論、形式論理、抽象代数など）を扱う際にはいくつかの制限があります、特に事前存在しないAPIの場合には。 CoTとPoTの両方の利点を活かすために、研究チームは数学のための新しいハイブリッドな指導調整データセット「MathInstruct」を提案しています。その主な特徴は次のとおりです：さまざまな数学的領域と複雑度レベルの包括的なカバレッジハイブリッドなCoT＆PoTの根拠 6つの新たに選択されたデータセットと7つの既存のデータセットがMathInstructの数学的な正当化の基盤を提供しています。モデリングの観点から、研究者たちは入出力形式とデータソースの変動の影響を調べるために、約50のユニークなモデルをトレーニングおよび評価しています。結果として得られたモデルは数学的な一般化能力において非常に優れています。研究者たちは、MAmmoTHをGSM8K、MATH、AQuA-RAT、NumGLUEなどの様々なデータセットに対してテストしました。これらのモデルは、オープンソースのLLMの数学的な推論の効率を大幅に向上させ、最新のアプローチよりもOOD（ドメイン外）データセットに対してより一般化された性能を示します。人気のあるコンペティションレベルのMATHデータセットでの7Bモデルの結果は、WizardMath（オープンソースのMATHの最先端技術）よりも3.5倍（35.2％対10.7％）優れており、34BのMAmmoTH-Coder（Code Llamaで調整）の結果はCoTを使用したGPT-4よりも優れています。MAmmoTHとMAmmoTH-Coderの両方のモデルは、以前のオープンソースモデルよりも大幅に精度が向上しています。

Learn more about Search Results OPT - Page 63