Search Results ボタン

「Googleとトロント大学の研究者が、ライブコンピュータ環境での自律学習とタスク実行のための画期的なゼロショットエージェントを紹介」

“`html 大規模言語モデル（LLM）は、ALFWORLDやALPHACODEなどのさまざまな現場でのアクション製作において、以前の試みで有望な結果を示しています。SAYCAN、REACT、TOOLFORMER、SWIFTSAGEなどの例があります。LLMは、専門家のトレイルを追い、環境の変化を理解し、将来の活動を計画・実施し、APIリクエストを作成するために同様に使用されます。REFLEXIONやSELF-REFINEを含むいくつかの研究は、自己反省の多数のラウンドを繰り返し実行することがタスクの完了を大幅に高めることを示しています。LLMには、環境のフィードバックに基づいて前の実行計画を変更するよう求められます。そのような調整は、次のラウンドのアクションジェネレータのプロンプトに組み込まれます。最近、MINIWOB ++は、モジュラ化されたコンピューティングワークロードでLLMのパフォーマンスを評価するためのテストベッドとして活用されています。タスクの包括的なトレース例（WebGUM）を使用した直接監督、自己監督、または少数/多数のプロンプティング（SYNAPSE）は、タスクを学習するための標準的な方法です。彼らは、タスク完了率が90％以上である場合の数十のコンピュータジョブを完了し、コンピュータ制御の問題を解決しているようです。ただし、エキスパートトレースの必要性は、エージェントの新しいジョブを学習する能力を制約しています。適切に選択されたトレースをガイドとして使用せずに、エージェントはコンピュータの制御について独立に知識を持ち、それを向上させることができるでしょうか？Google Researchとトロント大学の研究者は、この疑問に答えるために、ゼロショットエージェントを提案しています。彼らのエージェントは、最新のLLMであるPaLM2の上に構築されており、タスク固有のプロンプトではなく、すべてのアクティビティに対して単一のセットの指示プロンプトを使用しています。また、現代の取り組みであるRCI、ADAPLANNER、SYNAPSEなどは、ユーザーの画面に表示されるデータよりもはるかに多くのデータを含むスクリーン表現を使用する場合があります。たとえば、図1では、LLMに提供されるが画面上に表示されないHTMLに含まれるアイテムが示されています。この新たな知識を任意に使用することで、エージェントのタスク完了能力は向上します。しかし、通常の使用シナリオでは、そのような情報に簡単にアクセスできない場合があり、それに依存することでエージェントの適用範囲が制限される可能性があります。図1は、画面上の異なる表示を示しています。図1a-1cは、「もっと見る」ボタンを押す前後のソーシャルメディアのタスクを示しています（seed=2）。クリックする前に、HTMLで既にマテリアルが表示されています。図1d-1e：クリックタブ2（seed=0）も同様の問題を抱えています。 MINIWOB ++で評価されるように意図された多数のスクリーンにまたがるかなり難しいジョブ13件が注意深く評価され、そのうち5件には単一の観察で含まれるHTMLがそのような情報を含んでいました。彼らが行った貢献は次のとおりです：まず、以前の研究と比較して、より簡潔な画面描写を採用し、テスト環境をより包括的で現実的なものにします。次に、状態上で実行可能な操作を正確に計画するための簡単で効果的なアクションプランナーを提供します。彼らは、このような「素朴な」アプローチが、最新のLLMの能力を使用して、MINIWOB ++ベンチマークのほとんどの単純なタスクを完了できることを示しています。エージェントが探索的な失敗から成功裡に学び、より難しいタスクに進むために彼らはReflexionから影響を受けた体系的な思考管理技術を提案しています。彼らのエージェントは、数ラウンドの試行の後、以前の少数/多数ショットの最新技術と同等のパフォーマンスを達成します。彼らのエージェントは、研究によると、コンピュータ制御タスクのためのゼロショットデザインとしては彼らが知る限り初めてのものです。 “`

FineShare Review 2023年の最高の人工知能仮想カメラは？

「FineShareのレビューを通じて、最高のAI仮想カメラをご紹介しますその特徴、メリット、デメリットを詳しく分析します」

fineshare

「GitHubツールでデータサイエンスプロジェクトをスーパーチャージングする」

テクノロジーは急速に進化しており、私たちの職場を変革する新しいイノベーションをもたらしています中でも、この進歩によって特に影響を受けているのはデータサイエンティストの役割ですデータサイエンスはすでにエキサイティングな分野ですが、新しいツールによってさらなる次元に進化しています...

『Google Vertex AI Search＆Conversationを使用してRAGチャットボットを構築する』

「Googleは最近、彼らの管理されたRAG（Retrieval Augmented Generator）サービス、Vertex AI Search＆ConversationをGA（一般公開）にリリースしましたこのサービスは、以前はGoogleとして知られていました...」

「ReactでOpenAIの力を解き放つ：ユーザーエクスペリエンスを革新する」

このブログでは、ReactでOpenAIを使用してユーザーエクスペリエンスを革新する方法を探求しますOpenAIをReactと統合することで、ユーザーエクスペリエンスを変革する方法を発見してください

『冬-8Bに出会ってください：冴えたプラットフォームの背後にある非常にユニークなファンデーションモデル』

Adept.aiは、新たに誕生したAIのユニコーンの一部ですアイコニックなトランスフォーマーペーパーの著者たちによって最初に育成され、Adeptは自律型AIエージェントの領域で活動していますそのため、…

ビデオ編集は、VideoCrafterとともに新しい時代へ高品質なビデオ生成のためのオープンディフュージョンAIモデル

VideoCrafterは新しいオープンソースのビデオ作成および編集スイートです。このスイートは機械学習モデル、拡散モデルによって動作します。これらのモデルは、テキストの説明から写真や映像のようなリアルな出力を生成することがあります。まだリリースされていませんが、VideoCrafterは制作プロセスを大幅に変える可能性があります。VideoCrafterを使用すると、ビデオ編集やアニメーションの経験がない人でも簡単にプロ品質の結果物を作成することができます。 VideoCrafterはどのように動作しますか？ VideoCrafterは、書かれた説明から視覚的なシーケンスを作成します。多くの静止画像を組み合わせてビデオを作成します。VideoCrafterのリアルな画像や映像の生成は、大規模なテキストと画像のデータセットで訓練された拡散モデルによって可能になります。汎用性のあるビデオ編集ソフトウェアVideoCrafterを使用すると、以下のようなものを作成することができます：説明アニメーション製品の展示教育用ビデオプロモーション映画曲のビデオビデオクリップその他思い浮かぶものなんでも！ VideoCrafterの使い方 VideoCrafterを使用するには、ダウンロードとインストールが必要です。VideoCrafterは以下のいずれかのオペレーティングシステム用にダウンロードできます。VideoCrafterをダウンロードしてインストールした後、以下の手順でビデオ作成を開始できます：作成するビデオの概要を文章で作成します。解像度やフレームレートなど、ビデオのパラメータを必要に応じて変更します。「生成」ボタンを使用します。いくつかの単語を入力すると、VideoCrafterがビデオを作成します。作成したビデオは、統合エディタの助けを借りて調整できます。調整後、MP4、MOV、AVIなどのさまざまな形式でビデオを保存できます。主な利点 VideoCrafterの使いやすさにより、ビデオやアニメーションソフトウェアを取り扱ったことのない人でも効果的に使用できます。優れた品質： VideoCrafterの出力は商業的に製作された映画と同等です。説明ビデオや短編映画を作成したい場合、VideoCrafterが対応できます。…

Learn more about Search Results ボタン - Page 9

「Googleとトロント大学の研究者が、ライブコンピュータ環境での自律学習とタスク実行のための画期的なゼロショットエージェントを紹介」

FineShare Review 2023年の最高の人工知能仮想カメラは？

「GitHubツールでデータサイエンスプロジェクトをスーパーチャージングする」

『Google Vertex AI Search＆Conversationを使用してRAGチャットボットを構築する』

「ReactでOpenAIの力を解き放つ：ユーザーエクスペリエンスを革新する」

『冬-8Bに出会ってください：冴えたプラットフォームの背後にある非常にユニークなファンデーションモデル』

ビデオ編集は、VideoCrafterとともに新しい時代へ高品質なビデオ生成のためのオープンディフュージョンAIモデル

「LLMsでテキストデータの力を解き放つ」

『Gradioを使ったリテンションの理解』

「LLMとGUIの協力：チャットボットを超えて」

Find the right Blockchain Investment for you