Search Results Meta

「ODSC West 2023 写真で振り返る」

「ODSCウエストは今や私たちの歴史の一部であり、全てがうまくいっていて幸せです初めてのハロウィンパーティー、さらに多くの本のサイン会、エキサイティングな基調講演、そして誰にでも合ったセッションがたくさんありましたイベントの写真はこちらでご覧いただけます」

West 2023

Google DeepMindとYouTubeの研究者は、Lyriaという高度なAI音楽生成モデルを発表しました

最近の発表では、GoogleのDeepMindがYouTubeとの協力のもと、芸術的表現の風景を変えるであろう音楽生成モデルLyriaを発表しました。この革新的なテクノロジーは、Dream TrackとMusic AIの2つの実験的ツールセットとともに、AI支援の音楽制作において重要な進展を示し、ミュージシャンやクリエイターが自身のクラフトとの関わり方を再定義することを約束します。 Lyriaの発表は、Googleが以前に単語のプロンプトに基づいて曲を生成するAI技術を試みたことに続きます。今度はDeepMindのLyriaモデルが注目され、YouTubeとの協力を通じてクリエイターがその潜在能力を活用できるようになります。画期的なツールであるDream Trackでは、クリエイターがYouTube Shorts向けにAI生成のサウンドトラックを手掛け、著名アーティストの個性的な音楽スタイルに没入することができます。しかし、音楽制作におけるAIの役割については、AI生成の作品の信頼性と持続可能性についての懸念も浮上しています。長いフレーズにわたる音楽的連続性の保持の複雑さは、AIモデルにとっての課題となります。DeepMindはこれを認識し、長時間にわたって意図した音楽的な結果を保つことの難しさを強調し、時間の経過によるシュールな歪みをもたらす可能性があります。 DeepMindとYouTubeは、これらの課題を軽減するために初めに短い音楽作品に重点を置きました。Dream Trackの初回リリースは一部のクリエイターを対象とし、選ばれたアーティストの音楽のエッセンスを似せるように慎重に作り上げた30秒のAI生成サウンドトラックを作り上げる機会を提供します。特筆すべきは、アーティストがこれらのモデルのテストに積極的に参加し、信憑性を確保し貴重な洞察を提供していることです。この取り組みは、共同作業の性質を強調しています。具体的なアーティスト、作曲家、プロデューサーで構成されたMusic AI Incubatorは、AIツールの改善に積極的に貢献しています。彼らの関与は、創造的なプロセスを向上させながら、AIの限界を探求する意欲の表れです。 Dream Trackは限定リリースですが、Music AIツールの一般展開は今年後半に続きます。DeepMindは、特定の楽器やフミフミで音楽を作成し、簡単なMIDIキーボードの入力からアンサンブルを作曲し、既存のボーカルラインに伴奏する楽曲を制作するなど、これらの能力をうかがわせる魅力的なヒントを与えています。 AI生成音楽へのGoogleの進出は単独のものではありません。MetaのオープンソースのAI音楽生成器や、Stability AIやRiffusionなどのスタートアップからのイニシアチブも、音楽業界がAI駆動のイノベーションを受け入れる加速度的な変化を示しています。これらの進歩により、業界は変革を迎える準備ができています。 AIと創造性が交差する領域で、AI音楽生成における最も重要な問いは、AI作品が音楽の新たな標準となるのかということです。不確定要素が存在する中で、DeepMindとYouTubeの協力関係は、AI生成音楽がその信頼性を保ちながら人間の創造性を補完することを保証するための共同の努力を示しています。テクノロジーとアートが交錯する領域で、DeepMindとYouTubeのAI音楽生成への取り組みは、革新と芸術的表現が調和して音楽創造の本質を再定義する有望な未来を示唆しています。この投稿は、Google DeepmindとYouTubeの研究者が発表したLyria: 高度なAI音楽生成モデルが最初に掲載されました –…

アマゾンセージメーカースタジオを使用して、素早い実験結果のためにLlama 2、LangChain、およびPineconeを使用してRAG型の質問応答ソリューションを構築しましょう

「Retrieval Augmented Generation（RAG）は、ファインチューニングなしで大規模言語モデル（LLM）に外部の知識源（リポジトリ、データベース、APIなど）へのアクセスを提供することができます質問応答に対して生成的AIを使用する際、RAGはLLMが最も関連性の高い最新情報で質問に回答し、必要に応じて引用することができるようにします...」

「最も価値のあるコードは、書くべきでないコードです」

伝統的なプログラミング言語のコーディングスキルは、AIが進化するにつれてますます重要ではなくなります私はコーディングなしの面接を提案します

エクスラマV2：LLMを実行するための最速のライブラリ

ExLlamaV2は、GPTQからさらに高いパフォーマンスを引き出すために設計されたライブラリです新しいカーネルのおかげで、(超高速の)速い推論に最適化されています

「GO TO Any Thing（GOAT）」とは、完全に見たことのない環境で、画像、言語、カテゴリのいずれかで指定されたオブジェクトを見つけることができる、ユニバーサルなナビゲーションシステムです

このsystemですGOATは、イリノイ大学アーバナ・シャンペーン校、カーネギーメロン大学、ジョージア工科大学、カリフォルニア大学バークレー校、Meta AI Research、Mistral AIの研究者チームによって開発されました。GOATは、家庭や倉庫の環境での拡張された自律運転を目指した普遍的なナビゲーションシステムです。GOATは、カテゴリラベル、ターゲット画像、言語の説明から目標を解釈できる多様なモーダルシステムです。過去の経験から利益を得るライフロングシステムです。GOATはプラットフォームに依存せず、さまざまなロボットの具現化に適応できます。 GOATは、カテゴリラベル、ターゲット画像、言語の説明を使用して、多様な環境での自律ナビゲーションに長けたモバイルロボットシステムです。GOATは深さの推定と意味的セグメンテーションを利用して、正確なオブジェクトインスタンスの検出とメモリストレージのための3D意味的ボクセルマップを作成します。意味的マップは、空間表現、オブジェクトインスタンス、障害物、探索済みエリアの追跡を容易にします。 GOATは動物や人間のナビゲーションの洞察に触発されたモバイルロボットシステムです。GOATは普遍的なナビゲーションシステムであり、人間の入力に基づいて異なる環境で自律的に操作します。モーダル、ライフロング、プラットフォームに依存しないGOATは、カテゴリラベル、ターゲット画像、言語の説明を使用して目標の指定を行います。この研究では、以前の手法のCLIP特徴マッチングよりもSuperGLUEベースの画像キーポイントマッチングを活用することで、未知のモーダルオブジェクトインスタンスへの到達におけるGOATの性能を評価し、その優越性を示しています。 GOATはイメージと言語の説明に基づいたモーダルナビゲーションのためのモジュラーデザインとインスタンスアウェアな意味的メモリを採用しています。事前計算されたマップなしで評価されるプランは、プラットフォームに依存しない学習能力を持っており、家庭での大規模な実験を通じてその能力を示しています。パスの計算には高速マーチング法を使用し、パスに沿ってウェイポイントに到達するためにポイントナビゲーションコントローラを使用します。 9つの家での実験的試行において、GOATは83%の成功率を達成し、以前の手法を32%上回りました。探索後の成功率が60%から90%に向上し、その適応性を示しています。GOATはピックアンドプレイスやソーシャルナビゲーションなどの下流タスクもスムーズに処理しました。質的実験では、GOATはボストンダイナミクスのスポットやハローロボットのストレッチロボットに展開されました。家庭でのSpotによる大規模な量的実験では、GOATの優れた性能が3つのベースラインを上回り、インスタンスの一致と効率的なナビゲーションにおいて優れていることが示されました。優れたモーダルおよびプラットフォームに依存しない設計により、カテゴリラベル、ターゲット画像、言語の説明など、さまざまな手段で目標を指定することができます。モジュラーアーキテクチャとインスタンスアウェアな意味的メモリにより、同じカテゴリのインスタンスを効果的に識別することができます。事前計算されたマップなしでの大規模な実験で評価され、GOATは柔軟性を示し、ピックアンドプレイスやソーシャルナビゲーションなどのタスクに対応します。 GOATの将来の軌道は、さまざまな環境やシナリオでのパフォーマンスを総合的に評価し、その汎用性と堅牢性を測定する包括的な探求を含みます。調査では、調査中の課題に対処するために一致閾値の向上を目指します。目標カテゴリに基づいてインスタンスのサブサンプリングをさらに探求し、パフォーマンスの向上を図ります。GOATの進行中の開発は、グローバルおよびローカルポリシーの改善と、より効率的なナビゲーションのための追加の技術の統合を検討します。広範な現実世界での評価は、異なるロボットやタスクを含めて、GOATの汎用性を検証します。さらなる探求により、GOATの適用範囲をナビゲーション以外の領域、例えば物体認識、操作、相互作用にも広げることが可能です。

MITの研究者たちは「MechGPT」を導入しました：メカニクスと材料モデリングにおいてスケール、学問領域、およびモダリティをつなぐ言語ベースのパイオニア

研究者たちは、物質科学の広範な領域において密度の濃い科学的な文書から重要な洞察を効率的に抽出するという困難な課題に直面しています。この複雑な作業には、複雑なコンテンツをナビゲートし、物質の核心を網羅した意味のある質問・回答ペアを生成することが含まれます。その複雑さは、科学的な文書の密なフabricから重要な情報を抽出するという大きな課題にあります。このため、研究者は物質の本質を捉えた意味のある質問・回答ペアを作り出す必要があります。この領域内の現在の手法では、情報抽出に汎用言語モデルを活用することが一般的です。しかし、これらの手法はテキストの洗練化や方程式を正確に組み込む際に支援が必要です。これに対応するため、MITの研究者チームは、事前学習済み言語モデルに基づく画期的なモデルであるMechGPTを紹介しました。この革新的な手法では、一般的な言語モデルを利用して鋭い質問・回答ペアを形成するための2段階のプロセスを採用しています。MechGPTは単なる抽出以上に、鍵となる事実の明確さを向上させます。 MechGPTの旅は、Hugging Faceエコシステム内のPyTorchで実施される慎重なトレーニングプロセスで始まります。Llama 2 transformerアーキテクチャに基づき、このモデルは40のトランスフォーマーレイヤーを誇り、ロータリー位置埋め込みを活用して拡張されたコンテキストの長さを容易にします。32ビットのページ化されたAdamWオプティマイザーを用いて、トレーニングプロセスは約0.05の優れた損失を達成します。研究者たちは、モデルの能力を向上させるために微調整中にLow-Rank Adaptation (LoRA) を導入しています。これにより、追加のトレーニング可能なレイヤーを統合しながら、元の事前学習済みモデルを凍結させることで、モデルが初期の知識ベースを消去するのを防ぎます。その結果、メモリの効率化とトレーニングのスループットの加速が実現します。 MechGPTの基本モデルに加えて、研究者はより大規模な2つのモデル、MechGPT-70bとMechGPT-70b-XLのトレーニングにも取り組んでいます。前者はMeta/Llama 2 70 chatモデルの微調整バージョンであり、後者は10,000トークンを超える大きなコンテキストのために動的にスケーリングされたRoPEを組み込んでいます。 MechGPT内のサンプリングは、因果関係マスキングを実装した自己回帰原則に従って行われます。これにより、モデルは次の要素を考慮せずに各要素を予測するため、将来の単語を考慮しないように制約されます。この実装では、モデルの焦点を調整するために温度スケーリングが導入され、不確実性の温度の概念が導入されます。まとめると、MechGPTは物質科学の科学的な文書から知識を抽出するという困難な領域での希望の光として浮かび上がっています。LoRAや4ビットの量子化などの革新的な技術によって豊かになったモデルのトレーニングプロセスは、従来の言語モデルを超えた応用の可能性を示しています。Google Scholarへのアクセスを提供するチャットインタフェースにおけるMechGPTの具体的な具現化は、将来の拡張に向けた橋渡しとなります。この研究は、材料科学における貴重な財産としてMechGPTを紹介し、専門領域内の言語モデルの限界を押し広げる先駆者と位置付けています。研究チームがさらに前進する中、MechGPTは言語モデルのダイナミックな進化の証として、知識抽出の新たなフロンティアを開拓しています。

Artificial Intelligence

Learn more about Search Results Meta - Page 17

「ODSC West 2023 写真で振り返る」

Google DeepMindとYouTubeの研究者は、Lyriaという高度なAI音楽生成モデルを発表しました

アマゾンセージメーカースタジオを使用して、素早い実験結果のためにLlama 2、LangChain、およびPineconeを使用してRAG型の質問応答ソリューションを構築しましょう

「最も価値のあるコードは、書くべきでないコードです」

エクスラマV2：LLMを実行するための最速のライブラリ

「GO TO Any Thing（GOAT）」とは、完全に見たことのない環境で、画像、言語、カテゴリのいずれかで指定されたオブジェクトを見つけることができる、ユニバーサルなナビゲーションシステムです

MITの研究者たちは「MechGPT」を導入しました：メカニクスと材料モデリングにおいてスケール、学問領域、およびモダリティをつなぐ言語ベースのパイオニア

LangChain、Amazon SageMaker JumpStart、およびMongoDB Atlasの意味検索を利用した検索増強生成

「Amazon Bedrock のエージェント付きカスタマーサービスボットの基盤モデル（FM）を構築する」

MicrosoftエンジニアのAIイノベーションとリーダーシップへのガイド

Find the right Blockchain Investment for you