Learn more about Search Results ML - Page 307

データオブザーバビリティの先駆け:データ、コード、インフラストラクチャ、AI

2019年にデータの可観測性カテゴリを立ち上げた時、その用語はほとんど発音できなかったものでした四年後、このカテゴリは現代の中核層として確立されました...

ピクセルを説明的なラベルに変換する:TensorFlowを使ったマルチクラス画像分類のマスタリング

「今日のビジュアル中心のデジタル環境では、画像を正確に分類できる能力がますます重要になっています医療、eコマース、自動運転車など、どの分野においても…」

ジオスペーシャルデータ分析のための5つのPythonパッケージ

この記事では、地理空間解析の重要性について説明し、地理空間データから貴重な洞察を効果的に処理し可視化するための5つの必須のPythonパッケージを紹介しています

「Retroformer」をご紹介します:プラグインの回顧モデルを学習することで、大規模な言語エージェントの反復的な改善を実現する優れたAIフレームワーク

大規模な言語モデル(LLM)を強化して、単にユーザーの質問に応答するのではなく、目標のために独立して活動できる自律的な言語エージェントにするという、力強い新しいトレンドが浮上しています。React、Toolformer、HuggingGPT、生成エージェント、WebGPT、AutoGPT、BabyAGI、Langchainなどは、LLMを利用して自律的な意思決定エージェントを開発する実用性を効果的に実証したよく知られた研究です。これらの手法は、LLMを使用してテキストベースの出力とアクションを生成し、それを使用して特定の文脈でAPIにアクセスし、活動を実行します。 ただし、現在の言語エージェントの大部分は、パラメータ数の多いLLMの範囲が非常に広いため、環境の報酬関数に最適化された行動を持っていません。ReflexionやSelf-Refine、Generative Agentなど、同様のアプローチを取る他の多くの作品とは異なり、比較的新しい言語エージェントアーキテクチャである反省アーキテクチャは、過去の失敗から学ぶために、口頭フィードバック、具体的には自己反省を利用してエージェントを支援します。これらの反射エージェントは、環境のバイナリまたはスカラーの報酬を音声入力としてテキストの要約に変換し、言語エージェントのプロンプトにさらなる文脈を提供します。 自己反省フィードバックは、エージェントに特定の改善領域を指示することで、エージェントにとって意味的な信号となります。これにより、エージェントは過去の失敗から学び、同じ間違いを繰り返さずに次回の試行でより良い結果を出すことができます。ただし、自己反省操作によって反復的な改善が可能になるものの、事前に訓練された凍結LLMから有用な反省フィードバックを生成することは困難です(図1参照)。これは、LLMが特定の環境でエージェントの誤りを特定し、改善の提案を含む要約を生成する能力が必要だからです。 図1は、凍結LLMの情報のない自己反省のイラストです。エージェントは「Teen Titans」という回答ではなく、「Teen Titans Go」と回答するべきであり、これが前回の試行が失敗した主な理由です。一連の思考、行動、詳細な観察を通じて、エージェントは目標を見失いました。しかし、凍結LLMからの音声フィードバックは、以前のアクションシーケンスを新たな計画として提案するだけであり、次の試行でも同じ間違った行動につながります。 特定の状況でのタスクの信用割り当ての問題を専門にするために、凍結言語モデルを十分に調整する必要があります。また、現在の言語エージェントは、異なる可能な報酬に基づいて勾配ベースの学習からの思考や計画に一貫した方法で取り組んでいません。Salesforce Researchの研究者は、Retroformerというモラルフレームワークを紹介し、制約を解決するためのプラグインの後向きモデルを学習して言語エージェントを強化する方法を提案しています。Retroformerは、方策最適化を通じて環境からの入力に基づいて言語エージェントのプロンプトを自動的に改善します。 具体的には、提案されたエージェントアーキテクチャは、失敗した試行を反省し、将来の報酬に対してエージェントが実行したアクションにクレジットを割り当てることで、事前に訓練された言語モデルを反復的に改善します。これは、複数の環境とタスク全体にわたる任意の報酬情報から学習することによって行われます。HotPotQAなどのオープンソースのシミュレーションおよび実世界の設定(WikipediaのAPIに繰り返し問い合わせる必要があるWebエージェントのツール使用スキルを評価する)で実験を行います。HotPotQAは、検索ベースの質問応答タスクで構成されています。反省に対して、勾配を使用しない思考や計画を行わないRetroformerエージェントは、より速く学習し、より良い意思決定を行います。具体的には、Retroformerエージェントは、検索ベースの質問応答タスクのHotPotQAの成功率をわずか4回の試行で18%向上させ、多くの状態アクション空間を持つ環境でのツール使用における勾配ベースの計画と推論の価値を証明しています。 結論として、彼らが貢献した内容は次の通りです: • この研究では、大規模言語エージェントへのコンテキスト入力に基づいて提示されるプロンプトを反復的に洗練することで、学習速度とタスク完了を向上させるRetroformerを開発しました。提案された手法は、Actor LLMのパラメータにアクセスせず、勾配を伝播する必要もないため、言語エージェントアーキテクチャ内のレトロスペクティブモデルの強化に焦点を当てています。 • 提案された手法により、さまざまなタスクと環境のためのさまざまな報酬信号からの学習が可能となります。Retroformerは、その汎用性のため、GPTやBardなどのクラウドベースのLLMに適応可能なプラグインモジュールです。

Airbnbの研究者がChrononを開発:機械学習モデルの本番用機能を開発するためのフレームワーク

機械学習の絶え間なく進化する風景において、特徴管理はAirbnbのMLエンジニアにとって重要な課題となっています。彼らはさまざまな製品のための革新的なモデルを作成することを目指していますが、モデルにすべての焦点を当てる代わりに、インフラの複雑さに時間を費やすことがしばしばあります。Airbnbは、特徴データの管理を効率化し、リアルタイムの更新を提供し、トレーニングと本番環境の整合性を確保する解決策の必要性を認識しました。 そこで登場するのがChrononです。Airbnbチームによって設計された強力なAPIで、これらの課題に対処することを目指しています。Chrononは、MLプラクティショナーが特徴を定義し、モデルのトレーニングと本番推論のためのデータ計算を一元化することを可能にし、プロセス全体での正確性と一貫性を保証します。 さまざまなソースからのデータの取り込み Chrononは、イベントストリーム、データウェアハウスの事実/寸法テーブル、テーブルのスナップショット、変更データストリームなど、さまざまなソースからデータを取り込むことができます。リアルタイムのイベントデータや履歴のスナップショットなど、Chrononはすべてのデータをシームレスに処理します。 柔軟性を持ってデータを変換する ChrononのSQLのような変換と時間ベースの集計により、MLプラクティショナーは簡単にデータを処理することができます。標準の集計や高度なウィンドウ処理技術など、ChrononのPython APIは、複雑な計算を実行する能力をユーザーに与えながら、完全な柔軟性と組み合わせ性を保証します。 オンラインおよびオフラインの結果生成 Chrononは、オンラインおよびオフラインのデータ生成の要件の両方に対応しています。Chrononは、特徴データを提供する低レイテンシのエンドポイントやトレーニングデータのためのHiveテーブルなど、さまざまなユースケースに適した「Accuracy」パラメータを提供します。これにより、リアルタイムの更新からデイリーのリフレッシュまで、幅広い用途に対応できます。 正確性とデータソースの理解 Chrononの正確性へのユニークなアプローチにより、派生データの望ましい更新頻度を表現することができます。ほぼリアルタイムまたはデイリーの間隔であるかどうかに関係なく、Chrononの「Temporal」または「Snapshot」の正確性モデルは、各ユースケースの特定の要件に合わせて計算が整合することを保証します。 データソースはChrononエコシステムの重要なコンポーネントです。Chrononは、次の3つの主要なデータ取り込みパターンをサポートしています: タイムスタンプ付きアクティビティのためのイベントデータソース ビジネスエンティティに関連する属性メタデータのためのエンティティデータソース 遅変化次元での履歴的な変更を追跡するための累積イベントソース 計算コンテキストとタイプ Chrononは、オンラインとオフラインの2つの異なるコンテキストで動作します。オンラインの計算は低レイテンシのアプリケーションに提供され、オフラインの計算はバッチジョブを使用してデータウェアハウスのデータセットで実行されます。すべてのChrononの定義は、集計のためのGroupBy、さまざまなGroupBy計算からのデータの組み合わせのためのJoin、およびカスタムのSpark SQL計算のためのStagingQueryの3つのカテゴリに分類されます。 強力な洞察を得るための集計の理解 ChrononのGroupBy集計は、従来のSQLのgroup-by機能にさまざまな拡張機能を提供します。ユーザーは、時間に基づいた集計のためのウィンドウ、追加の粒度のバケット、および配列内のネストデータを処理するための自動展開を活用することができます。さらに、時間ベースの集計は、MLモデルのための洞察に富んだ特徴を作成するためのさらなる柔軟性を提供します。 AirbnbのMLプラクティショナーにとってのシームレスな統合 Chrononは、AirbnbのMLプラクティショナーにとって画期的な変革をもたらしました。Chrononは、特徴エンジニアリングを簡素化することで、MLモデルのパワーを引き出すために数千もの特徴を生成することができるようにユーザーに提供します。この革命的なソリューションにより、MLエンジニアは手動のパイプラインの実装の負担から解放され、常に変化するユーザーの行動と製品の需要に対応する革新的なモデルの構築に集中することができます。 まとめると、ChrononはAirbnbの機械学習の武器庫に欠かせないツールとなりました。包括的な特徴管理ソリューションを提供することで、特徴エンジニアリングの生産性と拡張性を引き上げ、MLプラクティショナーによる最先端のモデルの提供と数百万人のユーザーのAirbnb体験の向上を実現しています。

このAI論文では、これらの課題に対処しながらMoEsの利点を維持するために、完全に微分可能な疎なTransformerであるSoft MoEを提案しています

大きなTransformerが適切に機能するには、より多くの計算コストが必要です。最近の研究では、モデルのサイズとトレーニングデータは同時にスケーリングする必要があり、トレーニングの計算リソースを最大限に活用するために必要です。モデルの拡張性を可能にする代替手法として、専門家のスパースミックスが考えられています。言語、ビジョン、およびマルチモーダルモデルでは、ネットワーク全体でトークンパスウェイをスパースに活性化するための手法が最近開発されています。スパースMoE Transformerの中心にあるのは、各入力トークンに適用するモジュールを選択することであり、これは離散最適化の課題です。 これらのモジュールはしばしばMLP(多層パーセプトロン)であり、専門家と呼ばれています。適切なトークンと専門家のペアリングを特定するためには、線形プログラム、強化学習、決定論的な固定ルール、最適輸送、トークンごとの上位kの専門家、および専門家ごとの上位kのトークンなど、さまざまな手法が使用されます。専門家の利用率をバランスさせ、未割り当てのトークンを減らすためには、ヒューリスティックな補助的な損失がしばしば必要です。小さな推論バッチサイズ、一意の入力、または転移学習は、これらの問題を分布外設定で悪化させることがあります。Google DeepMindの研究者は、これらの問題のいくつかに対処する新しい戦略であるSoft MoEを提供しています。 Soft MoEは、トークンと専門家の間の良いハードな割り当てを求めるスパースで離散的なルーターではなく、トークンを組み合わせることによってソフトな割り当てを行います。彼らは特に、トークンと専門家の両方に依存するいくつかの重み付き平均を構築し、それぞれの重み付き平均を関連する専門家で処理します。スパースMoEの中心にある離散プロセスによって引き起こされる上記の多くの問題は、ソフトMoEモデルでは存在しません。一般的なスパースMoE手法では、望ましい挙動を課す補助的な損失があり、これらの補助的な損失はルーティングスコアに依存します。ルーターパラメータは、専門家の出力を選択されたルーティングスコアと後置乗算することで学習されます。 観察によると、これらのアルゴリズムはしばしばランダムな固定ルーティングと同様のパフォーマンスを発揮します。Soft MoEは、各入力トークンに依存して各ルーティングパラメータを直接更新することにより、この問題を回避します。彼らは、巨大な割合の入力トークンがネットワーク内で同時に離散的なパスを変更できることに気付き、トレーニング中にトレーニングの問題を引き起こすと述べています。ソフトルーティングは、ルーターのトレーニング時に安定性を提供することができます。多くの専門家が存在する場合、ハードルーティングも困難です。ほとんどの作品は少数の専門家でのみ訓練されるためです。彼らはSoft MoEが数千の専門家にスケーラブルでバランスの取れたモデルであることを示しています。 最後に、推論中にバッチ効果はありません。つまり、1つの入力が複数の入力のルーティングと予測に影響を与えることはありません。訓練には約半分の時間しかかからず、Soft MoE L/16はViT H/14を上流、フューショット、およびファインチューニングで上回り、推論でも速くなります。また、同等のトレーニング量の後、Soft MoE B/16はViT H/14よりも上流の指標で勝ち、フューショットとファインチューニングではViT H/14と同等のパフォーマンスを発揮します。Soft MoE B/16はViT H/14のパラメータの5.5倍を持っていながら、推論は5.7倍速くなります。

「インドが最新のAIを活用してペイメント詐欺に取り組む方法」

今日のデジタル時代において、オンライン取引に関連する詐欺は増加しており、金融機関と規制当局に重大な課題をもたらしています。インドのユニーク・アイデンティフィケーション・オーソリティ(UIDAI)は、アドハール有効決済システム(AePS)に関連する特に支払い詐欺に対処するため、積極的なアプローチを取っています。人工知能(AI)と機械学習(ML)の力を活用して、UIDAIは指紋認識と顔認識を中心とした革新的な技術を開発しています。これらのAI対策がどのように支払い詐欺の抑制とお金の安全を確保するのに役立っているかについて探ってみましょう。 また、AIによる「ディープフェイク」詐欺:ケララ州の詐欺師に対する継続的な戦いも参照してください。 AIによる指紋の最小情報記録 – 指紋画像記録(FMR-FIR)モダリティ UIDAIは、アドハール認証中の複製指紋の使用に対抗するために、社内でAI/ML技術をベースにしたFMR-FIRモダリティを導入しました。この洗練されたシステムは、本物または「ライブ」の指紋と複製の指紋を区別し、AePS取引の追加のセキュリティ層を提供します。認証中に指紋の生存性をチェックすることで、このAI駆動のソリューションは、詐欺師が指紋データを不正に利用して銀行口座にアクセスすることを大幅に減少させました。 また、AI時代のディープフェイクの検出と処理方法も参照してください。 取引認証における顔認識の役割 インド国立支払い公社(NPCI)と連携し、Airtel Payments BankはUIDAIと協力して、AePS取引のための顔認識に基づいた認証手法を導入しました。UIDAIが社内で開発したこの最先端の顔認識技術は、デジタル取引のセキュリティをさらに向上させます。顔の特徴を通じてユーザーの身元を確認し、本物の個人のみが金融取引を行えるようにし、システムを悪用しようとする詐欺師を効果的に防止します。 支払い詐欺の増加傾向 インドの支払い詐欺の規模は、内務省と財務委員会の報告によれば、深刻な増加を示しています。2020-21年の財務年度には、様々な金融犯罪の報告件数が262万件報告されましたが、2022年には驚異的な694万件にまで増加しました。そのうち支払い関連の詐欺は急激に増加し、23財務年度には約2000万件に達しました。これらの統計は、デジタル取引を保護し、ユーザーを潜在的なサイバー犯罪から守るために、頑健なAIベースのソリューションの緊急性を強調しています。 また、AI駆動のサイバー犯罪ツール「FraudGPT」の驚異的な増加も参照してください。 ビジネスコレスポンデントの課題 AIベースの技術は、特定の種類の詐欺防止において効果を発揮していますが、制限もあります。1つの重要な課題は、ビジネスコレスポンデント(BC)による詐欺の対処です。これらはバイオメトリックPOS(販売時点)機器を備えた非公式な銀行代理店であり、マイクロATMとして機能しています。一部の場合、BCは個人に支払われる金額を誤って報告し、彼らを金融的な搾取の危険にさらします。特に農村地域では、認識の欠如が状況を悪化させ、ユーザーに安全な銀行取引の実践について教育することが重要となります。 また、ワームGPTを利用したメールセキュリティの侵害も参照してください。 UIDAIのAePS詐欺への取り組み UIDAIは、常にAIベースのソリューションを洗練させることで詐欺師に先手を打ち続けています。同機関は、2021年11月から2023年3月までに2,000件以上のAePS取引に関連する苦情を受け付けています。UIDAIは、銀行、政府機関、および他の関係者と協力して、デジタル支払いシステムのセキュリティを強化し、インド全体の数百万人のユーザーの信頼を維持することを目指しています。 また、詐欺メールを特定するためのAIツールの開発も参照してください。 私たちの見解 急速にデジタル化が進む世界において、デジタル取引を保護する重要性は言い尽くせません。UIDAIが支払い詐欺を防ぐためにAIとMLの技術を採用することは、数百万人のインド人の金融利益を確保する上で重要な一歩です。FMR-FIRモダリティや顔認識などの革新的な手法を通じて、UIDAIはより安全で信頼性の高いデジタル支払いエコシステムを構築しています。デジタルの複雑さを乗り越えるにあたり、これらの進歩を受け入れ、サイバー犯罪者の手から自分自身と自分の築き上げたお金を守るために協力しましょう。私たちの共同の努力により、より安全で信頼性の高いデジタルの未来を築くことができます。

「Javaプログラミングの未来:2023年に注目すべき5つのトレンド」

この記事では、Javaプログラミングの将来について学びます2023年の最も注目すべきJavaのトレンド5つをチェックしてください

AWSは、大規模なゲーミング会社のために、Large Language Model (LLM) を使って有害なスピーチを分類するためのファインチューニングを行います

「ビデオゲーム業界は、世界中で30億人以上のユーザーベースを持っています1毎日大量のプレイヤーが仮想的にお互いとやり取りしています残念ながら、現実の世界と同様に、すべてのプレイヤーが適切に礼儀正しくコミュニケーションを取るわけではありません社会的責任を持ったゲーム環境を作り維持するために、AWSは努力しています…」

データサイエンティストやアナリストのための統計の基礎

データサイエンスまたはデータ分析の旅における重要な統計的概念

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us