Learn more about Search Results コミュニティ - Page 9
- You may be interested
- GPT – 直感的かつ徹底的な解説
- 「推測を超えて:効果的な記事タイトル選...
- ジニ係数の解説:経済学が機械学習に影響...
- 「変化の風を操る:2024年の主要なテクノ...
- 「NTU SingaporeのこのAI論文は、モーショ...
- レストランの革命:飲食業界におけるAIの力
- MLCommonsは、臨床効果を提供するためのAI...
- トップのAIメールアシスタント(2023年12月)
- 「AIに関するアレン研究所の研究者らが、...
- このAI研究では、優れた画像分類のために...
- 「Amazon SageMakerを使用して数百のモデ...
- 「InstagramがAIによって生成されたコンテ...
- このAI論文は、イメージとテキストのアラ...
- 「2023年の振り返り:Post-ChatGPT時代の...
- 🤗 Transformersを使用して、画像分類のた...
「データを素早く可視化するための7つのパンダのプロット関数」
「Pandasのデータフレームでデータを視覚化したいですか?これらの便利なpandasのプロット関数を使用してください」
次元性の祝福?!(パート1)
「これらの問題の1つまたは複数について、慎重に選ばれた科学者のグループが夏に一緒に取り組めば、重要な進展が期待できると私たちは考えています」と提案は述べましたジョンはまだ知りませんでしたが...
最近の人類学的研究によれば、クロード2.1の戦略的な促進を通じて、プロンプトに単一の追加をすることで、LLMsの記憶容量を70%増加させることができると報告されました
以下のHTMLコードを日本語に翻訳します(HTMLコードは結果に含めます): この研究は、Claude 2.1の機能における固有の課題に取り組んでいます:200,000トークンの文脈ウィンドウ内での個々の文に基づく質問に対する抵抗力です。このため、モデルのリコール能力を最大化する上で重要なハードルとなり、解決策の探求を促しています。 現在の手法を調査すると、Claude 2.1は、特に場違いとされる個々の文に関する質問に直面した際に躊躇することがわかります。これに対応して、Anthropicの研究者たちは、驚くほど効果的な解決策を提案しています:プロンプトの追加です。彼らは、「文脈内で最も関連のある文は次のとおりです:」という文をプロンプトに組み込むことを提案しています。この些細な調整は、メタコマンドに似ており、モデルのリコール能力を大幅に向上させます。 追加されたプロンプトは、Claude 2.1に関連する文を優先的に処理するよう指示するため、効果的にモデルの質問に対する躊躇を解消します。200,000文脈ウィンドウの評価において、Claudeのスコアは27%から98%に驚異的に向上するなど、パフォーマンスの改善が実証されています。 特に、このプロンプトを提供した後、単文のクエリの正確性が驚異的に90%増加しました。単文のクエリの正確性の増加は、追加されたプロンプトがClaude 2.1のパフォーマンスに与える重要な影響を示しています。この大幅な改善は、より広範な文脈内の単一の文の照会を処理する能力を高め、解決策の実用的な意義を示しています。 まとめると、この革新的な手法はClaude 2.1の躊躇を解消し、単一のプロンプトの追加によってリコール能力が70%向上することを示しています。研究チームの調査結果は、プロンプトの微妙な動態と言語モデルの振る舞いへの重要な影響について貴重な示唆を提供しています。AIコミュニティは大規模言語モデルの精度を高めるために改善を追求していますが、この発見は機能性の向上に実用的な意義を持つ注目すべき進展となります。 この記事はMarkTechPostの投稿から引用されました。
一時的なグラフのベンチマーク (Ichijiteki na gurafu no benchimāku)
最近では、公開データセットや標準化された評価プロトコルの提供により、静的グラフにおける機械学習において重大な進展がなされています
「ジェミニ発表ビデオでグーグルが誤解を招いていると非難される」
人工知能の急速な進化が進む中で、Googleの最新のAIモデルGeminiの発表は、期待と論争を呼びましたAIの能力の限界を押し広げることで知られるこの大手テック企業は、最近Geminiのデモ動画を公開し、それが激しい論争の中心になりましたこの動画は、 […]
「2023年のトップ8のAIトレンド:年間レビュー」
葉っぱが金色に変わり、12月の寒さが広がる中、人工知能の領域で目覚ましい進歩が見られた今年を振り返る時が来ました。2023年は単なる進歩の年ではありませんでした。それはトライアンフの年であり、AIが成し遂げられる限界が繰り返し押し広げられ、再定義された年でした。LLM(大規模言語モデル)の能力における画期的な進展から、前例のないほど世界とのナビゲーションや相互作用が可能な自律エージェントの登場まで、この年はこの変革的な技術の無限の可能性を示すものでした。 この包括的な探求の中で、私たちは2023年のAIを定義した8つの主要なトレンドについて掘り下げ、産業を再構築し、未来を革命化する革新を明らかにしていきます。だから、AI愛好家の皆さん、私たちは技術史の記録に永遠に刻まれる一年についての旅に出発です。 RLHFとDPOの微調整 2023年は、大規模言語モデル(LLM)の能力を向上させるための重要な進展が見られました。2つの主要なアプローチが登場しました: 人間のフィードバックに基づく強化学習(RLHF):この手法は、人間のフィードバックを活用してLLMの学習プロセスをガイドし、持続的な改善と進化するユーザーのニーズや好みに対応させることができます。このインタラクティブなアプローチにより、LLMは複雑または主観的な領域において微妙な理解力と意思決定能力を開発することができます。 直接的な選好最適化(DPO)::DPOはよりシンプルな代替手法であり、明示的な強化信号を必要とせずにユーザーの選好に直接最適化します。このアプローチは効率性とスケーラビリティを重視し、より速い適応と展開を必要とするアプリケーションに最適です。そのすっきりした性格により、ユーザーフィードバックに基づいてLLMの振る舞いを迅速に調整することができ、進化する好みに合わせることができます。 RLHFとDPOはLLMの開発における重要な進展を表していますが、既存の微調整手法を置き換えるのではなく、補完するものです: 事前学習:大規模なテキストとコードのデータセットを用いてLLMを訓練し、一般的な言語理解能力を学習させること。 微調整:特定のタスクまたはデータセットに基づいてLLMをさらに訓練し、特定のドメインやアプリケーションに適した能力を調整すること。 マルチタスク学習:LLMを複数のタスクに同時に訓練することで、共有表現を学習し、各タスクのパフォーマンスを向上させること。 LLMの効率性に対処する LLMの能力が向上するにつれて、計算上の制約とリソースの限界が重要な懸念事項となりました。その結果、2023年の研究はLLMの効率性の向上に焦点を当て、以下のような技術の開発をもたらしました: FlashAttention:この革新的なアテンションメカニズムは、LLMの計算コストを大幅に削減します。これにより、より速い推論と訓練が可能になり、LLMをリソースに制約のある環境でより実用的に利用し、実世界のアプリケーションに統合することができるようになります。 LoRA および QLoRA:LoRAやQLoRAなどの手法は、2023年にも提案された軽量かつ効率的なLLMの微調整方法を提供します。これらの手法は、既存のLLMアーキテクチャに追加された小さなモジュールであるアダプターに依存し、再トレーニングすることなくカスタマイズを可能にします。これにより、著しい効率の向上、より速い展開時間、さまざまなタスクへの適応性の向上が実現されます。 これらの進展は、効率的なLLMへの需要の増大に対応し、この強力な技術への広範な導入の道を開き、結果としてこの技術へのアクセスを民主化することにつながります。 検索補完生成(RAG)の浸透 純LLMは巨大な可能性を秘めていますが、それらの正確性と実証的根拠に関する懸念は依然として存在しています。検索補完生成(RAG)は、既存のデータや知識ベースとLLMを組み合わせることで、これらの懸念に対処する有望な解決策として登場しました。このハイブリッドアプローチにはいくつかの利点があります: エラーの減少:外部情報から事実情報を取り込むことにより、RAGモデルはより正確で信頼性のある出力を生成することができます。 拡張性の向上:RAGモデルは純LLMに必要な大規模なトレーニングリソースの必要性を排除し、大規模なデータセットに適用することができます。 低コスト:既存の知識リソースを利用することにより、LLMのトレーニングおよび実行に関連する計算コストを削減することができます。 これらの利点により、RAGは検索エンジン、チャットボット、コンテンツ生成など、さまざまなアプリケーションにおける貴重なツールとして位置付けられています。 自律エージェント…
「自律AIエージェントを使用してタスクを自動化するための10の方法」
はじめに テクノロジーのダイナミックな風景の中で、自律型AIエージェントは変革的な存在として登場し、データと人工知能とのやり取りの方法を変えつつあります。この魅力的な領域に深入りするにつれて、これらのエージェントが単なるプログラム以上のものであり、私たちの日常生活におけるAIの統合においてパラダイムシフトを表していることが明らかになります。本記事では、現在利用可能な最も優れた自律型AIエージェントの中から10つを紹介します。これらのAIエージェントがあなたに何ができるのか、さらに詳しく知るために読み続けてください。 自律型AIエージェントとは何ですか? 自律型AIエージェントは、持続的な人間の介在なしにタスクを実行するために独立して動作する高度な人工知能システムです。これらのエージェントは、機械学習と自動化を活用して、異なる領域でタスクの分析、学習、および実行を行います。単純なタスク自動化ツールから、自然言語の理解、意思決定、および新しい情報への適応能力を持つ洗練されたシステムまで、さまざまな範囲のエージェントが存在します。自律型AIエージェントは、技術がさまざまな日常タスクとの相互作用を革新する上で重要な役割を果たしています。 自律型AIエージェントはどのように動作するのですか? 自律型AIエージェントが具体的に何をするか、またどのようにしてタスクを自己で実行できるのかを疑問に思っていましたか?これらの高度なAIモデルは、複雑な指示や目標をより小さな、シンプルなタスクに分解し、構造化されたプロセスでそれらを実行するように設計されています。また、特定のタスクの自動化やループでの操作も可能です。以下は、ほとんどの自律型AIエージェントの基本的なワークフローです。 タスクの定義:まず、AIエージェントが明確な指示、締切、および優先順位を持つタスクを作成します。 タスクの優先順位付け:次に、緊急性と重要性に基づいてタスクの優先順位を付けるためにAIアルゴリズムを使用します。 タスクを自動化:重複するタスクを効率的に実行するために、それらをAIモデルに委任します。 進捗の監視:プロセスの設定とタスクの実行後、これらのタスクの進捗状況を追跡し、リアルタイムで更新を受け取ります。 相互作用:これらのエージェントは、自然言語のコマンドを使用して簡単にタスクを作成、変更、管理することもできます。 トップ自律型AIエージェント 以下に、10の最も優れた自律型AIエージェントとそれぞれの説明、利点、および具体例をご紹介します。 1. AgentGPT AgentGPTは、多機能でカスタマイズ可能なオープンソースの自律エージェントです。旅行の計画、メールの作成、クリエイティブなテキスト形式の生成など、幅広いタスクを実行することができ、さらに追加の機能や機能を追加することでカスタマイズすることができます。AgentGPTは、名前と目標を追加し、展開ボタンをクリックするだけで使用することができ、コーディングは不要です。複雑なタスクをより小さなサブタスクに分解し、最小限の人間の関与で主目標を達成するために反復的なプロンプトを使用します。 利点 時間と労力を節約:AgentGPTは、あなたがたくさんの時間と労力を要するタスクを自動化することができます。 生産性の向上:タスクの自動化により、重要なことに集中するために時間を確保することができます。 楽しむ時間を増やす:退屈でつまらないタスクを自動化することにより、楽しい時間を過ごすことができます。 より創造的になる:新しいアイデアや可能性を生成することによって、より創造的になることができます。 具体例 ハワイ旅行の計画:AgentGPTは、フライト、宿泊施設、アクティビティなど、詳細なハワイ旅行を計画するのに役立ちます。 メールの作成:件名、本文、署名を含めたメールの作成をサポートします。…
チャットGPT vs Gemini:AIアリーナでのタイタン同士の激突
はじめに 人工知能の世界では、GoogleのGemini AIとOpenAIのChatGPTの2つの巨人の間で魅惑的な一戦が繰り広げられています。ChatGPTは注目を浴びていますが、Gemini AIは静かに強力な武器を作り上げ、攻撃の瞬間を待っていました。そして、その瞬間がやってきて、驚くべきベンチマークの連続がAIの世界の基盤を揺るがすことになりました。Googleは過去1年間、OpenAIのChatGPTが世界を席巻するのを静かに見守ってきました。しかし今、Googleの輝く番です。画期的なAIモデルであるGeminiの登場により、GoogleはAIの競技場に進出するだけでなく、それを再定義しようとしています。AIの世界でのタイタン同士の激突、ChatGPT対Geminiについて掘り下げてみましょう。 GoogleのCEOであるSundar Pichaiは、Geminiのリリースにより「新たなAIの時代」の到来を大胆に宣言しました。Geminiは最も高度な大規模言語モデル(LLM)であり、優れた「推論能力」を誇っており、複雑な問いにもより正確かつ深い理解で取り組むことができます。これにより、他のAIモデル(Google自身を含む)が抱える「幻覚」のリスクを最小限に抑えます。この飛躍的な進歩により、知的かつ微妙な思考プロセスが可能な新世代のAIが道を切り拓かれます。 Geminiの異なるバージョン Geminiはデータセンターからモバイルデバイスまで効率的に実行するように設計されています。これにより、開発者やあらゆる規模の企業が簡単に製品やサービスにAIを統合することができます。 Gemini Ultra Gemini Pro Gemini Nano Geminiの最も重要で強力なバージョンは、科学研究や薬物発見などの複雑なタスクに向けて設計されています。この最も強力なバージョンは現在一般公開されていません。Googleは2024年にリリースすることを発表しましたが、具体的な日付はまだ発表されていません。 これはChatbotsやバーチャルアシスタント、コンテンツ生成など、さまざまなタスクに拡張可能なGeminiの最良のバージョンです。このモデルはBard(ぜひ試してみてください)の基盤となっており、2023年12月13日からGoogle Generative AI StudioまたはVertex AI in Google Cloudを介して開発者やエンタープライズのお客様が利用できるようになります。 これはモバイル電話やスマートホームデバイスなどのデバイス上で実行するために設計された、最も効率的なGeminiのバージョンです。この軽量バージョンは現在、Pixel…
Amazon AlexaのAI研究者がQUADRoを発表:QAシステムの向上に向けた画期的なリソースで、440,000以上のアノテーション付きの例があります
人工知能(AI)と機械学習(ML)の能力は、あらゆる可能な産業に進出することを成功裏に可能にしました。最近では、大規模言語モデル(LLM)と質問応答システムの導入により、AIコミュニティは大きな進歩を遂げています。事前計算されたデータベースから効率的に応答を取得することは、自動質問応答(QA)システムの開発における一般的なステップです。 主なQAパラダイムには、オープンブック型とクローズドブック型の2つがあります。オープンブック型、またはリトリーブアンドリード型は、適切な素材を大量の文書コーパス、頻繁にインターネットから取得する2つの手順を経て、異なるモデルや手法を適用して取得された素材から解決策を取り出す手法です。一方、クローズドブック型は最近の手法であり、外部のコーパスを利用せずにT5などのSeq2Seqモデルを基にしたモデルを訓練することで、結果を生成します。 クローズドブック技術は優れた結果を示しているものの、多くの産業アプリケーションに対してリソースが過剰であり、システムのパフォーマンスに重大なリスクをもたらす可能性があります。質問応答型データベース(DBQA)は、パラメータや大規模なコーパスの情報に頼るのではなく、事前生成された質問応答のデータベースから応答を取得する方法です。 これらのシステムの主要な部分は、質問と回答のデータベース、データベースのクエリに対する検索モデル、および最適な回答を選ぶランキングモデルです。DBQA技術により、迅速な推論と再学習モデルなしで新しいペアを追加できる能力が可能となり、新しい情報を導入することができます。 DBQA技術の課題の一つは、検索およびランキングモデルの開発における充分なトレーニングデータの不足です。既存のリソースはスコープと内容の面で不足しており、注釈プロセスの品質を向上させる必要があるものや、質問と質問の類似性に焦点を当て、回答を無視するものが多数存在しています。 これらの課題に対処するため、研究者チームは質問応答データベースの検索に関するデータセットとモデルであるQUADRoを提案しました。これは訓練と評価のために特別に作成された新しいオープンドメインの注釈リソースです。リポジトリの15,211の入力質問には、各質問に関連する30の質問応答ペアがあります。このコレクションには合計で443,000の注釈付きサンプルが含まれています。入力クエリに対する各ペアの重要性を示すバイナリインジケータがラベル付けされています。 研究チームはまた、このリソースの品質と特性をいくつかの重要なQAシステムコンポーネントに関して評価するための徹底した実験も行いました。これらの要素には、トレーニング方法、入力モデルの構成、および回答の関連性が含まれます。実験は、このデータセットで訓練されたモデルの挙動とパフォーマンスを検討することで、関連する応答を取り出すために提案された方法がどれだけうまく機能するかを示しました。 まとめると、この研究は、自動品質保証システムにおけるトレーニングとテストデータの不足を解決するために、有用なリソースを導入し、リソースの属性を慎重に評価することで、包括的な理解を支援しています。トレーニング戦略と回答の関連性のような重要な要素に重点を置くことで、評価が補完されます。
「 Omnivore に会いましょう:SiBORG Lab は OpenUSD と NVIDIA Omniverse を使ってアクセシビリティのアプローチを高める」
アクセシビリティは、すべてのデザイナーがスペースや製品を構築する前に考慮しなければならない重要な要素ですが、評価プロセスは従来、手間と時間がかかるものでした。 ニュージャージー工科大学の建築とデザインの助教授であるマシュー・シュワルツは、NVIDIA OmniverseプラットフォームとUniversal Scene Descriptionフレームワーク(別名OpenUSD)を使用して、建築家、インテリアデザイナー、産業デザイナーがこの課題に取り組むのを支援しています。 シュワルツの研究および設計ラボSiBORG(シミュレーション、バイオメカニクス、ロボット工学、グラフィックス)は、特にアクセシビリティ、人間要因、自動化に関連するデザインのワークフローを理解し、改善することに焦点を当てています。シュワルツと彼のチームは、研究プロジェクトのためのアルゴリズムを開発し、それらを利用可能な製品に転換します。 Omniverseを使用することで、チームはシュワルツのコードを使用してグラフやそれが生成するパスを視覚化することができます。これは、デザイナーが建築基準と居住者の安全性をより良く評価するのに役立ち、重要なアクセシビリティの洞察を提供します。 https://blogs.nvidia.com/wp-content/uploads/2023/12/Pathloop.mp4 OpenUSDの力 従来、建築設計プロセス中のアクセシビリティや環境条件に関するフィードバックは、建築基準分析に限定されていました。シュワルツの研究により、OmniverseとOpenUSDをシームレスに統合することで、デザイナーはこの壁を乗り越えることができるようになりました。 以前は、彼はシミュレーションとモデリングのプロジェクトのさまざまな側面を達成するために複数のアプリケーションの切り替えが必要でした。彼のワークフローは、人々をサポートするUnityや3Dモデリング機能を提供するMcNeel Rhino3Dなどのツールの間で分割されることが多かったのです。 OpenUSDを使用することで、彼は研究、Pythonコード、3D環境とレンダリング、お気に入りのツールをOmniverseに統合することができます。 彼は言いました。「Omniverseに魅了されたのは、Pythonアプリケーションプログラミングインタフェースを強力な物理、レンダリング、アニメーションソフトウェアと組み合わせることができる点でした。チームは、柔軟なPython APIをOmniverseで活用して、ほぼすべてのユーザーインターフェースを開発しました。」 シュワルツのチームは、OpenUSDに互換性のあるプログラムと相互作用できる汎用的なデータ分析ツールをOmniverseを使用して活用しています。 彼は言いました。「OpenUSDとOmniverseを使用すると、研究の範囲を広げることができました。データ分析と可視化を設計プロセスと簡単に組み合わせることができます。」 リアルなレンダリングとシミュレーションの実行 シュワルツはまた、Omniverseを使用して人々の動きや相互作用をシミュレートしています。 彼は、リアルタイムの可視化を可能にする2つのNVIDIA RTX A4500 GPUsを使用して大規模な群衆のシミュレーションとアニメーションを高速化しています。これにより、デザイナーは移動能力の制限がある人々がどのように空間を移動し、相互作用するかに関する貴重な洞察を得ることができます。 シュワルツは言いました。「看板を最も目立つ位置に配置するための最適な場所を示すこともできます。シミュレーションの結果は、早期の設計段階で取られるパスを可視化するために使用できます。これにより、建築基準に問題が生じることを防ぎながら、最小の要件を超えるデザインを作成できます。」…
Find the right Blockchain Investment for you
Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.