無料のフルスタックLLMブートキャンプ

Free Full-Stack LLM Bootcamp

大規模言語モデル(LLM)やLLMアプリケーションは話題の中心です!個人のプロジェクトでそれらを探求する、生産性を最大限に高めるために仕事で使用する、または検索結果や研究論文を素早く要約する—LLMはスペクトル全体にわたって誰にでも何かを提供します。

これは素晴らしいことです!ただこれらのアプリを使用するだけでなく、それ以上にLLMを使用することを改善して自分自身のアプリを構築するには、無料のLLM BootcampがFull Stackチームから提供されています。

プロンプトエンジニアリングからLLMを効果的に使用するための基本事項、自分自身のアプリを構築し、LLMアプリの最適なユーザーインターフェイスを設計するまで、このブートキャンプでは全てをカバーしています。ブートキャンプが提供するものについて詳しく学びましょう。

Full Stack LLM Bootcampとは何ですか?

Full Stack LLM Bootcampは、2023年4月にサンフランシスコで対面講義として行われたものです。現在、ブートキャンプの資料—講義、スライド、プロジェクトのソースコード—がすべて無料でアクセス可能になっています。

LLMブートキャンプは、幅広いアプローチを提供することを目的としています。プロンプトエンジニアリングの技術、LLMの基礎、LLMアプリを製造して出荷することをカバーしています。

このブートキャンプは、UCバークレー出身の講師、Charles Frye、Josh Torbin、Sergey Karayevによって教えられています。彼らの目標は、機械学習に関するあなたの経験レベルに関係なく、最新のLLMの進歩に100%追いつくことであります。

“私たちの目標は、あなたを最新の状態に100%追いつかせ、機械学習に関するあなたの経験レベルに関係なく、LLMアプリを構築して展開できるようにすることです。” – Full Stack Team

Full Stack LLM Bootcampを詳しく見てみましょう

LLMブートキャンプが何であるかを知ったので、コース内容について詳しく見ていきましょう。

前提条件

強制的な前提条件はありませんが、LLMについて学ぶことに真剣な興味があること以外に、関連するプログラミングの経験があると、旅がより簡単になります。以下はそのような前提条件のいくつかです:

  • Pythonでのプログラミングの経験
  • 機械学習、フロントエンド、またはバックエンドの開発についての理解が役立ちます

スペルを学ぶ:プロンプトエンジニアリング

言語モデルが望ましい結果を生成するためには、プロンプトの改善が重要です。

スペルを学ぶ:プロンプトエンジニアリングモジュールでは、以下がカバーされます:

  • LLM出力について確率的に考える
  • GPT-3やLLaMaのような事前学習済みモデル、チャットGPTなどの指示調整モデル、パーソナを模倣するエージェントなど、既存のモデルでのプロンプトの基本
  • プロンプトエンジニアリングの技術とベストプラクティス、分解、異なるLLMからのアンサンブル出力、ランダム性の使用など

LLMOps

単純な機械学習アプリケーションでさえ、モデルの作成はアイスバーグの一角に過ぎません。本当の課題は、モデルを本番環境にデプロイし、時間の経過とともにパフォーマンスを監視して維持することです。

ブートキャンプのLLMOpsモジュールでは、以下がカバーされます:

  • 速度、コスト、カスタマイズ可能性、オープンソースおよび制限付きライセンスの利用可能性を考慮して、最適なLLMを選択する
  • プロンプトトラッキングをワークフローに統合して(Gitや他のバージョン管理システムを使用して)プロンプトをよりよく管理する
  • LLMのテスト
  • LLMアプリでテスト駆動開発(TDD)を実装する際の課題
  • LLMの評価メトリック
  • パフォーマンスメトリックの監視、ユーザーフィードバックの収集、必要な更新の実施

言語ユーザーインターフェイスのUX

インフラの考慮に加えて、アプリケーションの成功はユーザーエクスペリエンスに依存します。

言語ユーザーインターフェイスのUXモジュールでは、以下がカバーされます:

  • 人間中心の思考と共感的な設計のための設計原則
  • オートコンプリート、低レイテンシーなどの利便性要因の考慮
  • 何がうまくいくか(うまくいかないか)を深く掘り下げるための事例研究
  • UXリサーチの重要性

拡張言語モデル

拡張言語モデルは、すべてのLLM(Large Language Model)を使用したアプリケーションの中核です。しばしば、言語モデルがより優れた推論能力を持ち、カスタムデータセットで動作し、最新情報を使用してクエリに答える必要があります。

拡張言語モデルのモジュールでは、以下の概念について説明します:

  • AIによる情報検索
  • 埋め込みに関するすべてのこと
  • 複数の言語モデルへのLLM呼び出しの連鎖
  • LangChainのようなツールの効果的な使用

1時間でLLMアプリを開始

このモジュールでは、以下の項目について、素早くLLMアプリを構築する方法を学びます:

  • MVPアプリケーションを構築するためのプロトタイピング、反復、および展開のプロセス
  • OpenAIの言語モデルからサーバーレスインフラストラクチャを活用するまで、異なるテックスタックを使用して有用な製品を構築する方法

LLMの基礎

LLMの基盤を理解し、過去のブレークスルーを知りたい場合は、LLM基礎モジュールを学習することをお勧めします。以下の項目について理解できます:

  • 機械学習の基礎
  • トランスフォーマーと注意
  • GPT-3ファミリーのLLMやLLaMAの重要なブレークスルー要素など、重要なLLM

プロジェクトの解説: askFSDL

ブートキャンプには、Full Stack Deep Learningコースのコーパスを使用して構築されたLLMアプリケーションであるプロジェクトaskFSDLの解説があります。

チームによるFull Stack Deep Learningコースは、ディープラーニングモデルを構築して本番環境に出荷するためのベストプラクティスを学ぶための優れたリソースです。

データ収集とクリーニング、ETLとデータ処理ステップ、フロントエンドとバックエンドの構築、デプロイとモデル監視まで、このフルスタックプロジェクトを複製して学習することができます。

以下は、プロジェクトで使用される(網羅的ではない)概要です:

  • OpenAIのLLM
  • クリーンドキュメントコーパスを格納するためのMongoDB
  • 高速なコーパス検索のためのFAISSインデックス
  • LLM呼び出しの連鎖とプロンプト管理のためのLangChain
  • Modalでアプリケーションのバックエンドをホスティング
  • Gantryによるモデル監視

まとめ

LLMブートキャンプを通じてLLMについてさらに学び、楽しんでいただけることを願っています。

このDiscordサーバーに参加することで、他の学習者やコミュニティメンバーと交流することもできます。OpenAIやRepl.itなどの業界の専門家や、LLMスペースのツールのクリエイターからの招待講演があります。これらのトークも近日中にブートキャンプのウェブサイトにアップロードされます。

LLMに関する他のコースをチェックアウトしたい場合は、LLMのトップ無料コースのリストをご覧ください。Bala Priya Cは、インド出身の開発者で技術ライターです。彼女は、数学、プログラミング、データサイエンス、コンテンツ作成の交差点で働くことが好きです。彼女の関心と専門分野には、DevOps、データサイエンス、自然言語処理が含まれます。彼女は、読書、書き込み、コーディング、コーヒーを楽しんでいます!現在、彼女は、チュートリアル、ハウツーガイド、意見記事などを執筆して、開発者コミュニティと彼女の知識を共有することに取り組んでいます。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AIニュース

Google Translateが同音異義語を認識する方法を教えた方法

Google Translateのニューラルモデルがベースとベースの違いを理解する方法

機械学習

NLPとAIを利用したPythonにおけるテンプレートベースの文書生成の力

Pythonを利用したテンプレートベースの文書生成の機能をNLPやAIの機能と融合させ、その力を活用してください文書生成の作業フ...

機械学習

赤い猫&アテナAIは夜間視認能力を備えた知能化軍用ドローンを製造する

軍事技術のリーディングカンパニーであるRed Cat Holdings, Inc.は、Athena AIとのパートナーシップにおいて、Teal 2の人工知...

データサイエンス

ビッグデータの力を解放する:グラフ学習の魅力的な世界

大企業は膨大な量のデータを生成し蓄積しています例えば、このデータの90%は最近の数年間に作成されたものですしかし、このう...

データサイエンス

「明日のAIによるサイバーセキュリティの風景に備える」

「AIの能力は二律背反の剣であり、既存のセキュリティ製品の効果を向上させる強力なツールである一方で、より洗練された脅威...

データサイエンス

「Microsoft AIが意図せずに秘密の情報を公開し、3年間にわたって38TBの機密データへのアクセス権を提供しました」

「過剰供給されたSASトークンが、約3年間にわたってGitHub上で38TBもの大量の個人データを公開していた物語」