Learn more about Search Results A - Page 154

『LLMWareの紹介:生成AIアプリケーションの開発を効率化するためのオールインワン人工知能フレームワーク』

昨年以降、大規模な言語モデル(LLM)に対する大きな関心があるにもかかわらず、多くの企業はまだLLMを既存のエンタープライズワークフローに統合することについての課題に苦慮しています。LLMが登場して以降、モデル技術の大幅な飛躍がありながら、開発ツールは追いついていません。現時点では、統一された、オープンな開発フレームワークが不足しており、迅速かつ大規模なエンタープライズLLMアプリケーションを構築するための環境が整っていません。統一された開発フレームワークが存在しないため、ほとんどのエンタープライズ開発チームは、LLMに対応するために、さまざまなカスタムツール、オープンソース、異なるベンダーソリューション、および複数のライブラリを組み合わせて新しいカスタムデータパイプラインやプロセスを構築しようとしており、採用とバリュー実現までの時間がかかっています。 このニーズを認識し、金融サービスや法務業界におけるエンタープライズLLMアプリケーションのプロバイダーであるAi Bloksは、新しいオープンソースライブラリとしてその開発フレームワークをリリースしています。それをLLMWareとブランディングしています。Ai BloksのCEOであるDarren Oberstによれば、「昨年、クライアントやパートナーと話をする中で、ほとんどの事業がリトリーバル増強生成(RAG)のための共通パターンを見つけるのに苦労していることがわかりました。つまり、LLMと埋め込みモデル、ベクトルデータベース、テキスト検索、ドキュメントの解析とチャンキング、ファクトチェックと後処理などを組み合わせることです。このニーズに応えるために、私たちはこのフレームワークを中心にコミュニティを形成し、RAGのベストプラクティスと関連するエンタープライズLLMのパターンを民主化するためのオープンソースプロジェクトとしてLLMWareを立ち上げました。 LLMWareは、以下のようないくつかの重要な要件を満たすエンタープライズLLMアプリケーションの開発をサポートしています: エンドツーエンドの統一されたRAGフレームワーク – モデル、データパイプライン、ワークフローを一つのコードを数分で使ってカスタムLLMアプリケーションを構築するための直感的な手法を提供します。 ワイドなモデル、クラウド、プラットフォームサポートによる真のオープン性 – 核となるアプリケーションロジックの再利用を促し、「ロックイン」を回避するため、APIベースの主要なモデルとオープンソースをサポートします。 エンタープライズでの拡張性のある開発とプライベートクラウドデプロイメントを設計します。 経験レベルに関係なく、さまざまなLLMアプリケーションパターンのサンプルコードの数十を使ってすばやく始めることができます。 llmwareはgithub/llmware-aiで利用でき、標準的なPythonライブラリ(pip install llmware)としてパッケージ化されています。

「ChatGPTとBard AIを活用するために、ソフトウェア開発者はどのように役立つことができるのでしょうか?」

以前は、開発者はコードやデバッグに多くの時間を費やしていましたが、今ではChatGPTやBard AIのおかげで、ソフトウェアエンジニアを簡単かつ効率的に変えることができます

ソフトウェア開発におけるAIの将来:トレンドとイノベーション

「ソフトウェア開発におけるAIの絶え間なく変化する風景を探索してくださいコーディングやプログラミングの未来を形作る新興トレンドや革新を発見してください」

Deep Learningのマスタリング:Piecewise推定による非線形近似の技術 パート2

皆さん、こんにちは!「マスタリング深層学習シリーズ」の第2回目へようこそこの記事は、第1回目の続編であり、タイトルは『非線形の近似の技術』と題しています...

「ハリー・ポッターとは誰なのか?Microsoft ResearchのLLMの概念の忘却を精緻化する方法の内部」

大規模言語モデル(LLM)は、通常、膨大な量の未ラベルデータで定期的にトレーニングされますこれにより、非常に多様な主題の知識を獲得することがよくあります事前学習に使用されるデータセットは…

オープンAIは、開発者のアリーナでより大胆な存在感を目指します

人工知能分野で主要なプレーヤーであるOpenAIは、開発者体験を向上させるための大幅なアップデートを導入する準備を進めていますReutersの情報筋によれば、これらの変更によって、OpenAIのスイートを使用してAIを利用したアプリケーションを開発しマーケティングする際に開発者の負担が軽減され、費用効果も向上すると示唆されています

「AIサイバーセキュリティのスタートアップ企業、ヨーロッパと今度はアメリカからも、参集!」

新しいGoogle for Startups成長アカデミーの開始:ヨーロッパとアメリカに拠点を置く企業のためのAIセキュリティプログラムのローンチ

NVIDIA AIがSteerLMを発表:大規模言語モデル(LLMs)の推論中にユーザーが応答をカスタマイズできる新たな人工知能(AI)メソッド

人工知能の絶えず進化する風景の中で、開発者やユーザーの双方を悩ませる課題があります: 大規模言語モデルからよりカスタマイズされたニュアンス豊かな応答が求められる需要です。Llama 2などのこれらのモデルは、人間のようなテキストを生成できますが、個々のユーザーの固有の要求に対応するために本当に柔軟な回答が必要です。現在のアプローチである教師あり fine-tuning(SFT)や人間のフィードバックからの強化学習(RLHF)には限界があり、機械的で複雑な回答につながる可能性があります。 NVIDIA Researchは、これらの課題に対応する画期的な手法であるSteerLMを発表しました。SteerLMは、大規模言語モデルの応答をカスタマイズする革新的かつユーザーセントリックなアプローチを提供し、ユーザーがモデルの振る舞いを指針とする主要属性を定義することにより、より多くの制御を提供します。 SteerLMは、大規模言語モデルのカスタマイズを簡素化する4段階の教師あり fine-tuningプロセスを介して動作します。まず、人間によって注釈付けされたデータセットを使用してAttribute Prediction Modelをトレーニングし、有用性、ユーモア、創造性などの品質を評価します。次に、このモデルを使用してさまざまなデータセットに注釈を付け、言語モデルがアクセスできるデータのバラエティを向上させます。その後、SteerLMは属性条件付きの教師あり fine-tuningを使用して、指定された属性(品質など)に基づいて応答を生成するようにモデルをトレーニングします。最後に、ブートストラップトレーニングを通じてモデルを洗練し、多様な応答を生成し、最適な合わせに向けて微調整します。 SteerLMの素晴らしい機能の一つは、リアルタイムの調整可能性です。これにより、ユーザーは推論中に属性を微調整し、その場で特定のニーズに合わせることができます。この驚くべき柔軟性により、ゲーミングや教育、アクセシビリティなど、さまざまな潜在的な応用が可能となります。SteerLMにより、企業は1つのモデルから個別のアプリケーションごとにモデルを再構築する必要なく、複数のチームに対してパーソナライズされた機能を提供することができます。 SteerLMのシンプルさとユーザーフレンドリーさは、メトリクスとパフォーマンスにも明らかです。実験では、SteerLM 43BがChatGPT-3.5やLlama 30B RLHFなどの既存のRLHFモデルを凌駕し、Vicunaベンチマークで優れた結果を示しました。インフラやコードの最小限の変更で簡単な fine-tuningプロセスを提供することで、SteerLMは手間をかけずに優れた結果を提供し、AIカスタマイズの分野での重要な進展となっています。 NVIDIAは、SteerLMをNVIDIA NeMoフレームワーク内のオープンソースソフトウェアとして公開することで、高度なカスタマイズを民主化する大きな一歩を踏み出しています。開発者は、コードにアクセスしてこの技術を試す機会を得ることができます。Hugging Faceなどのプラットフォームで利用できるカスタマイズされた13B Llama 2モデルに関しても、詳細な手順が提供されています。 大規模言語モデルが進化し続ける中で、SteerLMのようなソリューションの必要性はますます重要となります。SteerLMを使用することで、よりカスタマイズ可能で適応性のあるAIシステムを提供し、ユーザーの価値観と一致した本当に助けになるAIを実現する方向に、AIコミュニティは大きな一歩を踏み出します。

「ChatGPT 3.5 Turboの微調整方法」

この記事では、GPT 3.5 Turboモデルを微調整する方法を紹介していますデータの準備、ファイルのアップロード、そしてカスタムOpenAIセッションの設定によって、これを行うことができます

「Decafと出会う:顔と手のインタラクションのための革新的な人工知能単眼変形キャプチャフレームワーク」

モノクルARGBビデオからの三次元(3D)トラッキングは、コンピュータビジョンと人工知能の最先端分野です。それは、単一の二次元ビデオフィードのみを使用して、オブジェクトやシーンの三次元位置と動きを推定することに焦点を当てています。 モノクルARGBビデオからの3Dトラッキングの既存の方法は、主に2つの手や人間が剛体環境と対話するなどの人工関節と剛体オブジェクトに焦点を当てています。手と顔の相互作用などの密な非剛体オブジェクト変形のモデリングの課題は、ほとんど見落とされています。しかしこれらの変形は、AR/VR、3D仮想アバターのコミュニケーション、キャラクターアニメーションなどの応用において、そのリアリズムを大幅に向上させることができます。この問題への限られた関心は、単眼ビューセットアップの固有の複雑さや、適切なトレーニングと評価データセットの取得、非一様な変形可能オブジェクトへの合理的な非一様な剛性の決定など、関連する困難に起因しています。 したがって、この記事では上記の基本的な課題に取り組む革新的な手法を紹介します。これにより、単一のモノクルARGBビデオから人間の手と顔の相互作用を3Dでトラッキングすることができます。この手法では、手を関節を持つオブジェクトとしてモデル化し、アクティブな相互作用中に非剛体の顔の変形を引き起こします。この手法の概要は以下の図に示されています。 このアプローチは、手と顔の動きと相互作用、リアルな顔の変形を含む新たに作成したデータセットに依存しています。このデータセットの作成にあたり、著者らは位置ベースのダイナミクスを使用して生の3D形状を処理し、頭組織の非一様な剛性を推定する手法を開発しました。これらのステップにより、表面変形、手と顔の接触領域、および頭と手の位置の信頼性のある注釈が可能となります。 彼らのニューラルアプローチの中心にあるのは、手と顔の相互作用の深度情報を提供するバリアショナルオートエンコーダです。さらに、接触と変形を推定するためのモジュールが3Dトラッキングプロセスをガイドするために使用されます。この方法で生成される手と顔の最終的な3D再構成は、この文脈で適用可能ないくつかのベースライン手法と比較して、定量的および定性的な評価に基づいて、現実的でより信憑性のあるものです。 顔と手を同時に再構築し、相互作用から生じる表面変形を考慮することは、非常に困難な課題です。これは、再構築におけるリアリズムを向上させるために特に重要であり、このような相互作用は日常生活で頻繁に観察され、個人について他の人々が形成する印象に大きく影響を与えます。そのため、手と顔の相互作用の再構築は、アバターコミュニケーション、バーチャル/拡張現実、キャラクターアニメーションなどの応用において重要であり、没入型体験を創造するために不可欠です。また、手話の転写や運転手の眠気の監視などの応用にも影響を与えます。 顔と手の動きを再構築するためのさまざまな研究が存在するにもかかわらず、モノクルARGBビデオからの相互作用と対応する変形を捉えることはほとんど未開拓の領域であると2023年にTretschkらが指摘しています。一方、手と顔の再構築に既存のテンプレートベースの方法を使用しようとすると、衝突や相互作用と変形の省略などのアーティファクトが生じることが多いです。これは、単眼セットアップの固有の深度の曖昧さと、再構築プロセスでの変形モデリングの欠如が主な原因です。 この問題にはいくつかの重要な課題があります。一つの課題(I)は、非剛体変形と相互作用を伴う顔と手のマーカーレスRGBキャプチャデータセットの欠如です。これはモデルのトレーニングと方法の評価において重要であり、非剛体変形が発生する領域での頻繁な手と頭の動きによる遮蔽のため、このようなデータセットの作成は非常に困難です。もう一つの課題(II)は、単眼RGBセットアップの固有の深度の曖昧さから生じるものであり、正確な位置情報を得ることが困難であり、相互作用中に手と頭の接触や衝突の不足などのエラーが発生します。 これらの課題に対処するために、著者らは「Decaf」(頭と手の相互作用の変形キャプチャの略称)という、顔と手の相互作用と顔の変形をキャプチャするために設計されたモノクルRGBの手法を紹介しています。具体的には、複数ビューキャプチャセットアップと位置ベースのダイナミクスシミュレータを組み合わせて、遮蔽があっても相互作用する表面ジオメトリを再構築します。変形可能オブジェクトシミュレータを組み込むために、著者らは頭部メッシュの剛性値を「頭蓋皮膚距離(SSD)」という手法を使用して決定し、メッシュに非一様な剛性を割り当てます。このアプローチにより、均一な剛性値を使用する場合と比較して、再構築ジオメトリの定性的な妥当性が大幅に向上します。 彼らが新たに作成したデータセットを使用して、研究者たちはニューラルネットワークを訓練し、シングルビューのRGB画像から3D表面変形、頭部および手部表面の接触領域、および相互作用の深さの優先情報を抽出します。最終的な最適化段階では、さまざまな情報源からのこの情報を利用して、非剛体表面変形を伴う現実的な3D手と顔の相互作用を取得し、シングルビューセットアップに固有の深度のあいまいさを解決します。以下に示す結果は、既存の手法と比較してより現実的な手と顔の相互作用を示しています。 これがDecafの概要であり、顔の変形とともに顔と手の相互作用を捉えるために設計された新しいAIフレームワークです。興味があり、さらに詳しく知りたい場合は、以下で引用されたリンクをご覧ください。

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us