Search Results ML

「LLMモニタリングと観測性 – 責任あるAIのための手法とアプローチの概要」

対象読者：実践者が利用可能なアプローチと実装の始め方を学びたい方、そして構築する際に可能性を理解したいリーダーたち…

「スノーフレーク vs データブリックス：最高のクラウドデータプラットフォームを作るために競争する」

「最高のクラウドデータプラットフォームの競争に参加したいですか？SnowflakeとData Bricksの違いを見てみてください」

PyCharm vs. Spyder 正しいPython IDEの選択

PyCharmとSpyderはPython開発のための2つの最も人気のあるIDEですでは、PyCharmとSpyderの直接比較を見てみましょう

「ルービックとマルコフ」

ルービックキューブは、巨大な状態空間とただ1つの解を持つ計画問題のプロトタイプですそれはまさに干し草の中の針の定義そのものですガイダンスがない場合（たとえ回すことができるとしても...

「紙からピクセルへ：手書きテキストのデジタル化のための最良の技術の評価」

「組織は、歴史的な手書き文書をデジタル化するという煩雑で高額な作業に長い間取り組んできました以前は、AWS Textractなどの光学文字認識（OCR）技術を使用していましたが…」

「Retrieval Augmented GenerationとLangChain Agentsを使用して、内部情報へのアクセスを簡素化する」

この投稿では、顧客が内部文書を検索する際に直面する最も一般的な課題について説明し、AWSサービスを使用して内部情報をより有用にするための生成型AI対話ボットを作成するための具体的なガイダンスを提供します組織内に存在するデータのうち、非構造化データが全体の80％を占めています[...]

「Amazon Comprehendのカスタム分類を使用して分類パイプラインを構築する（パートI）」

このマルチシリーズのブログ投稿の最初のパートでは、スケーラブルなトレーニングパイプラインの作成方法と、Comprehendカスタム分類モデルのためのトレーニングデータの準備方法について学びます数回のクリックでAWSアカウントにデプロイできるカスタム分類トレーニングパイプラインを紹介します

中国の研究者がImageBind-LLMを紹介：ImageBindを介した大規模言語モデル（LLM）のマルチモダリティインストラクションチューニング方法

研究者は最近、大規模言語モデル（LLM）の指示調整において大きな改善を見ています。ChatGPTとGPT-4は、言語と視覚に従って人間の命令に従う汎用対話システムです。しかし、クローズドソースの制約のため、それらはまだ再現不可能です。Alpaca、LLaMAAdapter、および関連する取り組みは、これに対応するために自己生成されたデータを使用して、公開されているLLaMAを言語指示モデルに変更することを提供します。LLaVA、LLaMA-Adapter、およびその他のモデルは、画像指示のカスタマイズを実現するために、ビジュアル理解能力をLLMに統合します。現在の指示調整技術の成功にもかかわらず、テキスト、画像、音声、3Dポイントクラウド、およびビデオなどの広範な多文化指示のためのLLMを作成するためには、さらなる改良が必要です。上海人工知能研究所、CUHK MMLab、およびvivo AI Labの研究者は、事前学習されたImageBindの結合埋め込み空間の指示に従って、効果的にLLaMAを微調整するImageBind-LLMマルチモーダリティ指示フォローモデルを紹介しています。図1に示すように、彼らのImageBind-LLM（b）は、従来のビジュアル指示モデル（a）とは異なり、画像以外のさまざまなモダリティの入力指示に応答することができます。これは、有望な拡張性と汎化能力を示しています。彼らは、ImageBindの画像に整列したマルチモーダリティ埋め込み空間の指示の微調整に、ビジョン-言語データのみを使用することを提案しています。画像キャプションのペアに対して、彼らはまず、ImageBindの凍結された画像エンコーダを使用してグローバルな画像特徴を抽出し、学習可能なバインドネットワークを使用して埋め込み変換を行います。変換された画像特徴は、LLaMAのすべてのトランスフォーマーレイヤーの単語トークンに適用され、適切なテキストキャプションの生成のためのビジュアルコンテキストを作成します。LLaMA-Adapterシリーズのゼロ初期化されたアテンションとは異なり、彼らのビジュアルインジェクションメカニズムはシンプルであり、訓練可能なゼロ初期化ゲート要素で重み付けされます。この効果的な方法により、訓練が進むにつれて、ImageBindのマルチモーダリティ埋め込みの指示キューがLLaMAに徐々に導入され、元の言語理解に干渉することなく導入されることがあります。テキスト、画像、音声、ビデオなどのモダリティにおけるビジョン-言語エンコーディングにImageBindを使用することで、基本的なビジョン-言語トレーニングの後に、ImageBind-LLMはさまざまなモダリティの指示に従う能力を獲得します。彼らは、3Dドメインの指示のために入力の3Dポイントクラウドをエンコードするために、Point-Bindの事前学習された3Dエンコーダを使用します。また、画像トレーニングとテキスト、音声、3D、またはビデオ条件の制作とのモダリティギャップを解消するために、推論中の埋め込み拡張のためのトレーニングフリーのビジュアルキャッシュアプローチも提供します。図1は、私たちのマルチモーダリティ対ビジュアル指示モデルImageBind-LLMとの比較です。ImageBind-LLMは、画像モダリティに限定された従来の取り組み[1-3]とは異なり、画像、テキスト、音声、ビデオ、および3Dに対して普遍的なマルチモーダリティ指示調整を行います。キャッシュモデルは、ImageBindによって取得されたトレーニングデータセットの数百万の画像特徴で構成されており、テキスト/音声/3D/ビデオの埋め込みを向上させるために比較可能なビジュアル特性（Tip-Adapter）を獲得します。その結果、マルチモーダルな指示に対する口頭の応答は、より高い品質になります。彼らは、ImageBind-LLMのマルチモーダリティ指示に従う能力をさまざまな状況でテストし、一貫して優れたパフォーマンスを発揮することを確認しています。全体として、彼らのImageBind-LLMは以下の4つの特性を示します。 • 多数のモードを持つ指示。ImageBind-LLMは、ImageBindおよびPoint-Bindによって表される画像、テキスト、音声、3Dポイントクラウド、およびビデオなどの一般的なマルチモーダリティ入力に応答するように最適化されています。これは、従来の言語と画像の指示モデルとは異なります。 • 効率のチューニング。トレーニング中に、ImageBindの画像エンコーダーをフリーズし、LoRAやバイアスノームチューニングなどのパラメータ効率の良い手法を使用して、LLaMAの一部の重みを調整します。また、ゼロ初期化されたゲーティングファクターと追加のバインドネットワークもトレーニングします。 • アテンションなしのゼロ初期化インジェクション。彼らは、進行的な知識インジェクションのための学習可能なゲーティング方法を採用し、注意レイヤーを介する追加の命令信号を導入する代わりに、LLaMAのすべての単語トークンを直接使用してマルチモダリティの要件を組み込みます。 • クロスモーダルキャッシュからの検索。彼らは、ImageBindによって抽出された画像特徴に基づく視覚的なキャッシュモデルを提供し、トレーニング（単一の画像）と推論（多くのモダリティ）の間のモダリティの不均衡を解消するための埋め込み補完のためのクロスモーダリティの検索を行います。

ウェブ開発者のためのAI：プロジェクトの紹介とセットアップ

この投稿では、Qwikを使用してウェブ開発プロジェクトをブートストラップし、OpenAIのAIツールを組み込む準備を整えます

「CodiumAIに会ってください：開発者のための究極のAIベースのテストアシスタント」

ソフトウェア開発の快速な世界では、テストの作成はしばしば実際のコーディングから時間を奪う面倒な作業と見なされます。CodiumAIをご紹介します。CodiumAIは、IDE内で意味のあるテストを生成することで、あなたの生活をより簡単にする革命的なツールです。小さなスクリプトから大規模なプロジェクトまで、CodiumAIがサポートします。ほぼすべてのプログラミング言語をサポートしており、スマートにコードを作成し、変更をプッシュする際に自信を持つことができます。CodiumAIを使えば、本当に意図した通りにコーディングできます。 CodiumAIの主な機能テストスイートの生成 CodiumAIはただのテストツールではありません。自動化されたテストアシスタントです。クラス、関数、小さなスニペットなど、さまざまなタイプのコードに対して包括的なテストスイートを生成することができます。自動化プロセスは時間と労力を節約し、あなたが最も得意なこと、つまりコーディングに集中できるように設計されています。特定のクラス、関数、またはコードの一部をテストしたい場合、CodiumAIは意味のあるテストケースを生成する機能を提供しています。これらのテストは、コードの品質と信頼性を確保し、開発プロセスを効率化します。コード解析品質はテストに合格するだけでなく、コードの基本的な構造と動作を理解することでもあります。CodiumAIには、表面を超えた詳細なコード解析機能が備わっています。テストスイートが生成される間、CodiumAIのTestGPTモデルはコードを上から下まで分析し、貴重なインサイトを簡単なテキスト出力で提供します。コード提案 CodiumAIは、「コード提案」機能によりさらに進化します。この高度なツールは、コードを分析し、改善のための貴重なインサイトを提供します。TestGPTによって強化されたこの機能は、パフォーマンスの最適化からベストプラクティスまで、コード品質のさまざまな側面に対してその専門知識を提供します。テストの実行包括的なテストスイートが生成されたら、テストの実行は簡単です。CodiumAIは、パネルを通じてシームレスな体験を提供し、テストを実行して合格または不合格のステータスを確認できます。これにより、問題を素早く特定し、必要な調整を行うことができます。開発環境を離れる必要はありません。コードの動作異なる条件下でコードがどのように動作するかを理解することは、どんな開発者にとっても重要です。CodiumAIを使用すると、生成されたテストを実行し、コードがさまざまな入力や条件にどのように応答するかを観察することができます。この機能はデバッグだけでなく、コード全体の品質向上にも役立ちます。 Codium AIの無料拡張機能のダウンロード方法最良の部分は何でしょうか？CodiumAIをすぐに始めることができます。無料のVSCode拡張機能と/またはJetBrainsプラグインをダウンロードするだけです。CodiumAIは個人開発者向けに無料で提供されており、オープンソース版の公開も計画されています。まとめ CodiumAIは単なるテストツール以上のものであり、高品質なコードを作成することを目指す開発者向けの包括的なソリューションです。意味のあるテストの生成から貴重なコードの提案まで、CodiumAIは究極のテスト補助ツールとして設計されています。なぜ待つ必要があるでしょうか？今日からCodiumAIを開発プロセスに統合し、意図した通りにコードを書きましょう。

Learn more about Search Results ML - Page 267