Learn more about Search Results タグ

ジョンズ・ホプキンス大学とUCサンタクルーズ校の研究者が、画像ベースのAI学習の画期的な進歩であるD-iGPTを発表しました

“` 自然言語処理(NLP)は、GPTシリーズなどの大規模言語モデル(LLMs)の導入により、さまざまな言語的なタスクに対して新たなパフォーマンス基準を確立する変革期に入りました。自己回帰前処理は、モデルにシーケンス内で最も可能性の高いトークンを予測することを教えることで、この驚異的な達成に影響を与える主要な要素の1つです。この基本的な技術により、モデルは構文と意味の複雑な相互作用を吸収し、人間のように言語を理解する卓越した能力を持つことができます。自己回帰前処理は、NLPに加えてコンピュータビジョンにも大きく貢献しています。 コンピュータビジョンにおいて、自己回帰前処理は最初は成功しましたが、後続の開発によりBERTスタイルの前処理に有利な鮮明なパラダイム変化が示されました。この移行は特に注目に値しますが、最初のiGPTの結果からは、自己回帰およびBERTスタイルの前処理がさまざまなタスクで同様のパフォーマンスを発揮することが示されました。ただし、視覚表現学習における効果の高さから、その後の研究ではBERTスタイルの前処理が優先されるようになりました。例えば、MAEはランダムにマスクされたピクセルの値を予測するだけの視覚表現学習に対してスケーラブルなアプローチを示しています。 本研究では、ジョンズ・ホプキンス大学とUCサンタクルーズの研究チームがiGPTを再検討し、自己回帰前処理が広範に適用された場合に高度な視覚学習者を生み出すことができるかどうかを問いました。その過程には2つの重要な変更が組み込まれています。まず、研究チームは画像が自然にノイズや冗長性を持つため、BEiTを使用して写真を意味的なトークンにトークン化します。この変更により、自己回帰予測の焦点がピクセルから意味的なトークンにシフトし、さまざまな画像領域の相互作用のより洗練された理解が可能になります。さらに、研究チームは生成デコーダに識別デコーダを追加し、次の意味的なトークンを自己回帰的に予測します。 視覚領域内の意味的なトークンの予測は、この追加のコンポーネントの責任です。さらに興味深いことに、CLIPのように識別的にトレーニングされたモデルは、この前処理経路に最適な意味的な視覚トークンを提供します。研究チームはこの改良された方法をD-iGPTと呼んでいます。彼らの提案されたD-iGPTの効率性は、さまざまなデータセットとタスクで行われた包括的なテストによって確認されています。関連する唯一のデータセットとしてImageNet-1Kを使用し、彼らのベースサイズのモデルは、従来の最先端モデルを0.6%上回る86.2%のトップ-1分類精度を達成しました。 さらに、彼らの大規模モデルは、3600万の公開データセットで89.5%のトップ-1分類精度を達成します。D-iGPTは、パブリックデータセットで以前の最先端トレーニングと同等のパフォーマンスを発揮しますが、トレーニングデータとモデルのサイズがはるかに少なくなります。同じ前処理とファインチューニングのデータセットを使用して、研究チームはD-iGPTをセマンティックセグメンテーションにも適用し、MAEと比較して優れたパフォーマンスを発揮することを明らかにしました。 “`

新しいCMUとMetaによるAI研究、PyNeRFの導入:スケールに意識したグリッドベースのレンダリングにおけるニューラル輝度場の進化

ニューラル・ラディアンス・フィールド(NeRF)は、シーン再構成時のスケールの変動とエイリアシングのアーティファクトを減らすためにどのように改善できるのでしょうか? CMUとMetaからの新しい研究論文では、ピラミッド状のニューラル・ラディアンス・フィールド(PyNeRF:Pyramidal Neural Radiance Fields)を提案することで、この問題に取り組んでいます。PyNeRFは、異なる空間グリッド解像度でモデルヘッドを訓練することにより、さまざまなカメラ距離でシーンを再構成する際に生じる視覚的な歪みを軽減するのに役立ちます。PyNeRFはパフォーマンスに大きな影響を与えることなく、NeRFを高速化しながら高品質のシーン再構成を維持する効果的な解決策です。 NeRFに触発されて、この研究ではボクセルグリッドやテンソル近似を使用して描画速度とメモリ効率を向上させるためのグリッドベースの手法(NSVF、Plenoxels、DVGO、TensoRF、K-Planes、Instant-NGP)を探求しています。PyNeRFは、速度の利点と品質の維持を兼ね備え、Instant-NGPやNerfactoなどの他の高速描画手法を凌駕し、描画品質とトレーニング速度で優れた結果を示します。 Nerfを含む最近のニューラルボリューメトリックレンダリングの進歩は、現実的な視点合成の進展をもたらしています。ただし、NeRFはMLP表現と仮定により遅いため、エイリアシングが発生します。Mip-NeRFなどのグリッドベースの手法はトレーニングを加速しますが、位置符号化との互換性に欠けます。PyNeRFは、分割と征服のNeRF拡張と古典的な技術からインスピレーションを受けています。PyNeRFのモデルピラミッドはレイに沿ってサンプリングされ、分割アプローチが採用されることにより、高速化されたNeRF実装の速度を維持しながら、描画品質が改善されます。効率的かつ高品質な新しい視点合成のための幅広い解決策を提供します。 研究では、より大きなボリュームサンプルの描画に向けて、グリッドベースのモデルを修正し、異なる空間グリッド解像度でモデルヘッドを訓練することを提案しています。バックボーンモデルとしてSUDSを使用し、徐々により高い解像度でトレーニングします。学習した特徴をボクセルグリッドやハッシュテーブルなどの構造に保存するさまざまなグリッドベースの加速手法について議論されています。研究者は、LaplacianPyNeRFや他の補間手法と比較して、特徴グリッドの再利用と2Dピクセル領域の使用の影響を評価しています。主な貢献は、既存のグリッド描画手法において描画速度を保持しながら視覚的な忠実度を向上させる多目的の分割手法です。 PyNeRFは、合成と実世界のシーンにおいて誤差率を20〜90%低下させ、パフォーマンスへの影響を最小限に抑えることで描画品質を大幅に向上させます。Mip-NeRFと比較して、トレーニング速度が60倍速い状態で誤差を20%削減します。PyNeRFは2時間でSUDS品質に収束し、さまざまなメトリックでベースラインを凌駕しますが、SUDSには4時間かかります。さまざまな合成およびマルチスケールブレンダーデータセットでのテストと評価によって、PyNeRFの高品質な再構築はArgoverse 2 Sensorデータセットでの評価に証明されています。 まとめると、PyNeRFは高速ボリューメトリックレンダラーのアンチエイリアシング機能の向上において印象的な進展を示し、さまざまなデータセットで優れた結果を示しています。この手法は、現実世界のキャプチャを共有することでニューラルボリューメトリックレンダリングの研究を更に進めることを提唱していますが、高品質なニューラル表現の効率的な構築におけるセキュリティとプライバシーのリスクにも言及しています。 今後の研究は、追加の実世界のキャプチャの共有や統合ボリュームを階層レベルに割り当てるための代替マッピング関数の探求から利益を得ることができるでしょう。モデルのトレーニング中にプライバシーフィルタリングのためにセマンティック情報を使用することも有益な調査方向です。将来の興味深い展望には、高速なNeRF手法において描画速度を保持しながら視覚的な忠実度を向上させるためのアーキテクチャのさらなる探求が含まれます。潜在的な研究領域には、ピラミッドアプローチを他の高速NeRF実装に適用し、そのパフォーマンスを評価することがあります。

「プロダクションに適したRAGアプリケーションの12のチューニング戦略ガイド」

「実稼働のための検索増強生成(RAG)アプリケーションのパフォーマンス向上に調整できる戦略とパラメータ」

AWSを使った生成AIを活用したクラウド上の新しい構築の時代へようこそ

「私たちは、時間の経過とともに、生成型AIが私たちが知るほぼすべての顧客エクスペリエンスを変革する可能性を持っていると信じていますAWS上で生成型AIアプリケーションを導入する企業の数は多く、adidas、Booking.com、Bridgewater Associates、Clariant、Cox Automotive、GoDaddy、LexisNexis Legal & Professionalなどがすばやく増えていますPerplexityなどの革新的なスタートアップも存在します...」

「PyTorch イントロダクション—テンソルとテンソル計算」

ディープラーニング分野で最も重要なライブラリの1つ(そしてChatGPTが構築された場所でもある)はpytorchですTensorflowフレームワークと共に、pytorchは最も有名なニューラル...

「Rcloneを使用したクラウドベースのデータストレージの管理」

企業がクラウドベースのストレージソリューションにますます依存するにつれて、ビッグデータを効果的に管理するために適切なツールと技術を持つことが不可欠です

OpenAI GPT(ジェネラル プロダクト トランスフォーマー):自分自身で作るChatGPTを活用した対話型AI

私たちの詳細な記事でカスタムGPTについて学びましょうその中では、あなたのニーズに合わせたAIチャットボットを簡単に作成する方法を探求しますアルゴリズムの指導からパーソナライズされた映画のおすすめまで、最新のOpenAIの機能、プライバシーコントロール、コーディング不要のカスタムチャットボットの将来について学びましょう

ファイデムのチーフ・プロダクト・オフィサー、アルパー・テキン-インタビューシリーズ

アルパー・テキンは、FindemというAI人材の獲得と管理プラットフォームの最高製品責任者(CPO)ですFindemのTalent Data Cloudは、最も先進的な人材データに基づいて構築されています市場の動向と同じくらい速く学習し、あなたのチーム全体に対して比類のない人材インテリジェンスを提供します以前は連続起業家として活動し、創業者兼CEOとして活躍していました[…]

「Pythonにおけるデータクリーニング」

「パンダでは、データセットをクリーニングするさまざまな方法や形式がありますが、今日は3つのトラックに焦点を当てます上にはトップ5つのフィールドがありますので、df.head()を入力すると、デフォルトでトップ5つが表示されます...」

Middleware.ioは、生成AIを搭載したクラウド観測プラットフォームを紹介します

クラウドネイティブアプリケーションのダイナミックな領域では、観測可能性の必要性が浮上しています。クラウドコンピューティングの急速な台頭とマイクロサービスの増殖により、現代のアプリケーションは複雑になり、グローバルなサーバーに分散し、毎日膨大なデータを処理しています。この複雑さにより、企業が中核目標を達成するために観測可能性の重要性に取り組む際のリスクが高まっています。たとえ一時的でもダウンタイムは収益の損失や企業の評判への悪影響につながります。これが現在多くの組織が直面しているジレンマです。 観測可能性の必要性は明確ですが、既存のソリューションはクラウドネイティブアプリケーションの複雑さに対してタイムリーな洞察を提供する必要があります。このギャップにより、組織はより効率的なトラブルシューティングと積極的な問題管理を探し続けています。迅速な行動が求められるデジタル空間で、リアルタイムでの問題の特定と解決は重要です。 ミドルウェアはこの観測可能性のジレンマに対する有望な解決策を提供します。この画期的なクラウドネイティブな観測性プラットフォームは、AI技術を活用して進化しました。このプラットフォームは、AIによる異常検出と解決の力を利用します。AIアドバイザーは重要なツールであり、インフラストラクチャーとアプリケーションの問題を特定し、問題解決の効率的なソリューションを提供します。このプラットフォームの特徴は、データのトレンドに基づいて入力エラーを予測する予測能力です。この問題管理への予測的なアプローチは、絶えず変化するデジタル領域でリスクを軽減しようとする組織にとってのゲームチェンジャーです。 この革新的なプラットフォームの最も魅力的な側面の一つは、強力なリアルタイムモニタリングです。組織は、ユーザーフレンドリーなダッシュボードを通じて重要なメトリクス、ログ、トレース、イベントに簡単にアクセスでき、自社の技術スタックに対する可視性が大幅に向上します。プラットフォームのAI駆動機能は問題を重大、VoAGI、低の3つのカテゴリに分類し、組織が効果的に優先し対処できるようにします。AIアドバイザーは、問題に関連するリソースや詳細な解決策など、包括的な情報を提供し、ユーザーが素早く修正できるよう支援します。 この革新的なソリューションは、観測可能性の需要が過去最高水準にある時期に登場しています。組織の86%が、観測可能性が主要なビジネス目標の実現をサポートする重要な機能であると認識しています。AI、具体的にはGPT-4の導入により、組織がクラウドネイティブアプリケーションの管理とトラブルシューティングを革新する可能性があります。最近の650万ドルのシードファンディングの活用により、このプラットフォームは拡大、チームの成長、およびさらなるAI機能の開発に向けて準備が整っており、クラウドネイティブ時代における観測可能性に明るい未来を約束しています。 まとめると、クラウドネイティブアプリケーションによる複雑性とデジタル時代における迅速なトラブルシューティングの必要性から、新たな革新的なソリューションが生まれました。このAI技術を活用した観測可能性プラットフォームは、クラウドネイティブアプリケーションの課題を効果的に対処するための希望の光です。リアルタイムモニタリング、予測能力、ユーザーフレンドリーなダッシュボードが全ての秒数が重要な世界で魅力的な選択肢となるでしょう。観測可能性の未来は以前よりも明るく積極的なものになります。 この記事はMiddleware.ioがAI駆動のクラウド観測可能性プラットフォームを紹介したものでした。遡及はMarkTechPostによって提供されました。

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us