Learn more about Search Results A - Page 321

Terraformのインポート:それは何か、そしてどのように使用するのか

おそらく、Terraformについて聞いたことがあり、おそらくプロジェクトで使用したこともあるでしょうしかし、その最も強力な機能であるTerraform Importについて、深く掘り下げたことはありますか?この記事の最後まで読んでいただくと、...

「10 Best AI医療書記」

「技術革新は医療部門に深い影響を与えており、AIを搭載した医療秘書が患者記録管理を革新していますこれらのツールは、医師のメモ取りの負担を軽減するだけでなく、効率的な文書化を通じて患者ケアを向上させますこのブログでは、今日の医療部門で波を起こしているトップ5のAI医療秘書について詳しく見ていきます1. […]」

「マッキンゼー・レポートからの5つの重要な洞察:創発的AIの未来への影響」

人工知能(AI)の変革力は既に仕事の風景を変え始めており、McKinseyのレポート「2023年のAIの状況:創造的AIのブレイクアウトイヤー」によれば、このトレンドは加速すると予想されています。このレポートは、労働市場の潜在的な変化に関する重要な洞察を強調し、労働者や産業の適応性と準備が求められることを強調しています。この記事では、レポートから得られた5つの重要な洞察について掘り下げ、労働力における創造的AIの影響について明らかにします。 1. 迫り来る雇用の転換: McKinseyのレポートによれば、2030年までに、創造的AIの進展により、アメリカでは約1200万人が新たな職業に転換する必要があると予測されています。創造的AI技術による自動化は、さまざまな産業で日常的で繰り返しの多いタスクを置き換えることが予想されています。これにより生産性と効率が向上する一方で、労働力は適応能力と再教育の必要性に直面することになります。 出典: https://www.mckinsey.com/capabilities/quantumblack/our-insights/the-state-of-ai-in-2023-generative-ais-breakout-year?cid=aisurge2023-soc–mar-mar–07/23-i1a–bam-ip&linkId=227872978#/ 2. 変化する雇用パターン: このレポートでは、アメリカにおける最近の雇用変動における重要なトレンドが強調されています。観察された860万人の雇用移行のうち、半数以上が飲食業、顧客サービス、事務支援、生産などの職種から離れていったことが明らかになりました。これらの職種は、繰り返し予測可能なタスクが多く、AIシステムによって効率的に実行される可能性があるため、自動化の影響を特に受けやすいです。労働力のこれらの変化への対応が、雇用市場の変革のペースを決定するでしょう。 出典: https://www.mckinsey.com/capabilities/quantumblack/our-insights/the-state-of-ai-in-2023-generative-ais-breakout-year?cid=aisurge2023-soc–mar-mar–07/23-i1a–bam-ip&linkId=227872978#/ 3. 創造的AIによる仕事の自動化の可能性: 創造的AIの能力は、雇用市場に大きな影響を与える可能性があります。レポートによれば、2030年までに、この技術によって最大30%の仕事が自動化されると予想されています。この自動化は、製造業、金融業、顧客サービスなど、さまざまなセクターに影響を与える可能性があります。ただし、自動化は必ずしも仕事の廃止を意味するわけではありません。代わりに、仕事の役割の変革や新しい機会の創出を意味することもあります。 出典: https://www.mckinsey.com/capabilities/quantumblack/our-insights/the-state-of-ai-in-2023-generative-ais-breakout-year?cid=aisurge2023-soc–mar-mar–07/23-i1a–bam-ip&linkId=227872978#/ 4. 生成AIの影響の二重性: 生成AIは、科学、技術、エンジニアリング、数学(STEM)、医療、建設などの専門分野で多くの仕事を自動化することができますが、これらの産業においても成長の機会を提供しています。例えば、生成AIは医療専門家が診断や治療計画を支援し、患者ケアを向上させることができます。建設では、AIが建物の設計を最適化し、プロジェクト管理を効率化することができます。 出典:https://www.mckinsey.com/capabilities/quantumblack/our-insights/the-state-of-ai-in-2023-generative-ais-breakout-year?cid=aisurge2023-soc–mar-mar–07/23-i1a–bam-ip&linkId=227872978#/ 5. 雇用トレンドの対照: McKinseyの報告書は、産業間で異なる成長の軌道を強調しています。医療、STEM、建設セクターは、技術の進歩と高齢化人口による医療サービスの需要の増加により、雇用の成長を経験しています。しかし、報告書はまた、事務支援や顧客サービスの仕事が自動化とデジタル化により減少していることも明らかにしています。 出典:https://www.mckinsey.com/capabilities/quantumblack/our-insights/the-state-of-ai-in-2023-generative-ais-breakout-year?cid=aisurge2023-soc–mar-mar–07/23-i1a–bam-ip&linkId=227872978#/…

このAI論文は、大規模なビジョン・ランゲージ・ナビゲーション(VLN)トレーニングのための効果的なパラダイムを提案し、パイプライン内の各コンポーネントの影響を定量的に評価しています

ビジュアルナビゲーションの学習のために、いくつかの人間のデモが収集され、最近の巨大なデータセットには数百の対話的なシナリオが含まれており、エージェントのパフォーマンスの大幅な改善につながっています。ただし、このような大規模なトレーニングを行うには、ナビゲーショングラフの構築方法、破損したレンダリングされた画像の復元方法、およびナビゲーション指示の生成方法など、いくつかの重要なサブ問題を解決する必要があります。これらすべてが収集されたデータの品質に大きな影響を与えるため、徹底的に探求されるべきです。 大規模なデータを効率的に活用し、ナビゲーションエージェントのトレーニングに適切に利益をもたらす方法を研究することが必要であり、人間の自然言語を理解し、写真のような環境でナビゲーションすることができるエージェントは、洗練されたモジュール化されたシステムです。 オーストラリア国立大学、OpenGVLab、上海AI研究所、UNCチャペルヒル、アデレード大学、Adobe Researchの研究者たちは、大規模なビジョンと言語のナビゲーションネットワーク(VLN)をトレーニングするために、パイプライン内の各コンポーネントの影響を統計的に評価する新しいパラダイムを提供しています。彼らはHabitatシミュレータを使用して、HM3DとGibsonのデータセットから環境を使用し、環境のためのナビゲーショングラフを構築します。彼らは新しい軌跡をサンプリングし、指示を作成し、エージェントをトレーニングして下流のナビゲーション問題を解決します。 AutoVLNやMARVALなどの従来の方法とは異なり、これらのナビゲーショングラフは、過剰な視点サンプリングと集約手法を使用して構築され、導入されたグラフ作成ヒューリスティックを使用しています。このアプローチにより、広範な屋外カバレッジを持つ完全に接続されたネットワークが得られます。 研究者たちはまた、HM3DとGibsonの設定から生成された破損した生成画像から、壊れた、変形した、または欠落した部分の写真のような画像を生成するために、Co-Modulated GANをトレーニングします。これにより、視覚データのノイズの影響を軽減することができます。MARVALとは異なり、この大規模なトレーニング体制は完全に再現可能で実行が容易であり、エージェントのパフォーマンスを大幅に向上させます。 包括的な実験により、エージェントがR2Rなどの特定の指示に基づいて下流のタスクでより良いパフォーマンスを発揮するためには、ナビゲーショングラフが完全にトラバーサブルである必要があります。さらに、Gibsonの環境からの低品質な3Dスキャンに対して生成された画像から写真のような画像を復元する利点も示されています。研究結果は、エージェントが一般的により多様な視覚データを使用でき、新しいシーンから学習することにより新しいコンテキストへの一般化を向上させることができることを示しています。 さらに、チームは、基本的なLSTMベースのモデルによって提供される拡張指示を使用してトレーニングされたエージェントがさまざまなナビゲーションタスクでうまく機能することを検証しました。彼らは、拡張データを元のデータと統合し、事前トレーニングと微調整中にエージェントの一般化能力を向上させることができると結論付けています。 驚くべきことに、データ拡張やエージェントのトレーニングのための上記の分析をガイドとして使用することで、提案されたVLNモデルは、先行探索、ビームサーチ、またはモデルのアンサンブルなしで単純な模倣学習によってR2Rテスト分割で80%の成功率を達成し、見たことのない環境とのナビゲーションギャップを解消します。この結果は、以前の最良の手法(73%)と比べて、パフォーマンスの差を人間のレベルに約6パーセントポイントまで縮める大幅な改善です。CVDNやREVERIEなどのいくつかの言語によるビジュアルナビゲーションの課題へのアプローチは、最先端を前進させました。強化されたデータは離散的であるにもかかわらず、連続的な環境(R2R-CE)においてVLNのパフォーマンスが5%成功率向上していることも示しています。

「AIの使用を支持する俳優たちと、支持しない俳優たち」

最近のニュースでご覧になったかもしれませんが、作家や俳優たちは収益に関連する問題やAIがエンターテイメント業界にどのように拡大していくのかに関してストライキを行っています特にVFXにおいて、AIは映画作りの重要なツールとなっていますが、一部の俳優には...

Excalidraw 図を使ってデータサイエンスで自分自身をより明確に表現する方法

何度も聞いたことがあるかもしれませんが、私は繰り返します一枚の写真は千の言葉に値しますデータサイエンスのコミュニケーションにおいて、この引用は文字通り、比喩的に、あらゆる副詞が当てはまる真実です...

「ChatGPTを利用する5人のミリオネア」

「以下は、地球上で最も成功した人々がChatGPTをどのように活用しているかの方法です」

「ToolLLMをご紹介します:大規模言語モデルのAPI利用を向上させるためのデータ構築とモデルトレーニングの一般的なツールユースフレームワーク」

多くのツール(API)と効率的に接続し、困難なタスクを完了するために、ツール学習は大規模な言語モデル(LLM)の潜在能力を活用しようとします。 LLMは、APIとの接続により、消費者と大規模なアプリケーションエコシステムとの効果的な仲介役としての価値を大幅に高めることができます。オープンソースのLLMであるLLaMAやVicunaなどの指示チューニングにより、さまざまな機能を持つことができましたが、ユーザーの指示を理解し、ツール(API)との効果的なインターフェースを実現するなど、より高度なタスクを処理する必要があります。これは、現在の指示チューニングが主に単純な言語タスク(例:カジュアルチャット)に焦点を当てているためです。 一方、ツールの使用に優れたスキルを持つGPT-4などの最新の状態-of-the-art(SOTA)LLMは、クローズドソースであり、内部動作に不透明です。そのため、コミュニティ主導のイノベーションやAI技術の民主化の幅が制約されます。このような観点では、オープンソースのLLMがさまざまなAPIを適切に理解できるようにすることが重要であると見なされています。以前の研究では、ツールの使用に対する指示チューニングデータの作成に取り組んでいましたが、内在的な制約により、LLM内のツールの使用能力を完全に刺激することはできませんでした。 (1) 制約されたAPI:現実のAPI(RESTAPIなど)を無視するか、十分な多様性を持たない狭い範囲のAPIのみを考慮しています。 (2) 制約されたシナリオ:既存の研究は、単一のツールのみを使用する指示に限定されています。一方、現実の設定では、多数のツールを組み合わせて多ラウンドのツール実行を行い、困難なタスクを完了する必要がある場合があります。 さらに、多数のAPIが提供されている場合、ユーザーが特定のコマンドに最適なAPIセットを事前に決定することを前提としていますが、これは不可能です。 (3) 低品質な計画と推論:既存の研究では、モデルの推論のために単純なプロンプトメカニズム(チェーンオブソートやReACTなど)が使用されており、完全にLLMにエンコードされた能力を引き出すことができず、複雑な指示を処理することができません。これは、オープンソースのLLMにとって特に深刻な問題であり、SOTAのLLMよりも推論能力がはるかに劣っています。さらに、一部の研究では、後続のモデル開発において重要なデータである真の応答を取得するためにさえAPIを使用していません。彼らは、オープンソースのLLM内でツールの使用能力を刺激するためのデータ生成、モデルトレーニング、評価のための一般的なツール使用フレームワークであるToolLLMを提案します。 図1は、APIリトリーバーとToolLLaMAのトレーニングを3つのステップで行い、ToolBenchを構築する方法を示しています。 指示の推論中にAPIリトリーバーが関連するAPIをToolLLaMAに提案し、ToolLLaMAは最終結果に到達するために多くのAPI呼び出しを行います。ToolEvalは審議の全体プロセスを評価します。 彼らはまず、図1に示すような高品質の指示チューニングデータセットであるToolBenchを収集します。最新のChatGPT(gpt-3.5-turbo-16k)を使用して、自動的に生成されます。表1には、ToolBenchと以前の取り組みの比較が示されています。特に、ToolBenchの作成には3つのステージがあります: • APIの収集:RapidAPI2から16,464のREST(表現状態転送)APIを収集します。このプラットフォームには、開発者によって提供される実世界のAPIが多数あります。これらのAPIは、eコマース、ソーシャルネットワーキング、天気など、49の異なる領域をカバーしています。各APIの包括的なAPIドキュメントをRapidAPIからスクレイプし、機能の要約、必要な入力、API呼び出しのためのコードサンプルなどを含めます。モデルがトレーニング中に遭遇しなかったAPIにも汎化するために、LLMがこれらのドキュメントを理解することでAPIを利用することを学ぶことを期待しています。 • Instruction Generation(指示生成):彼らはまず、全体のAPIコレクションからいくつかのAPIを選び、ChatGPTにこれらのAPIに関するさまざまな指示を開発するように依頼します。シングルツールとマルチツールのシナリオをカバーする指示を選択し、実世界の状況をカバーします。これにより、モデルはさまざまなツールを個別に扱う方法と、それらを組み合わせて難しいタスクを完了する方法を学ぶことができます。 • Solution Path Annotation(解決経路の注釈):彼らはこれらの指示に対する優れた回答をハイライトします。各応答には、モデルの推論とリアルタイムのAPIリクエストの複数のイテレーションが含まれる場合があります。最も高度なLLMであるGPT-4ですら、複雑なコマンドの成功率が低いため、ツールの学習の固有の難しさにより、データ収集が効果的でなくなります。このため、彼らはユニークな深さ優先探索ベースの意思決定木(DFSDT)を作成し、LLMsの計画と推論の能力を向上させることでこれに対処します。従来の思考の連鎖(CoT)やReACTに比べて、DFSDTはLLMsがさまざまな論理を評価し、戻るか続行するかを判断する能力を持たせます。研究では、DFSDTはCoTやReACTを使用して返答できない難しい指示を効果的に完了し、注釈の効率を大幅に向上させます。 清華大学、ModelBest社、中国人民大学、イェール大学、WeChat AI、テンセント社、知乎社の研究者たちは、ChatGPTをサポートする自動評価システムであるToolEvalを作成し、LLMsのツール使用能力を評価しました。ToolEvalには2つの重要なメトリックが含まれています:(1)勝率(win…

AIシステム:発見されたバイアスと真の公正性への魅力的な探求

「人工知能(AI)はもはや未来の概念ではありません-それは私たちの生活の一部になっています Visaが1秒間に1,700件のトランザクションを検証し、...を検出するかを考えるのは難しいです...」

GoogleのSymbol Tuningは、LLM(Language Learning Models)におけるIn-Context Learningを行う新しいFine-Tuningテクニックです

言語モデルのスケーリングアップにより、機械学習は革命的な急増を経験し、インコンテキスト学習を通じて難しい推論タスクを達成することが可能になりましたしかし、一つの課題は…

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us