Learn more about Search Results A - Page 768

メタのラマ2:商業利用のためのオープンソース化

Facebookの親会社であるMetaは、商業利用のために人工知能モデルであるLlama 2をオープンソース化することで、テック業界に波紋を広げました。この画期的な動きにより、スタートアップやビジネスは、OpenAIやGoogleのような業界の巨人が提供する高価な独自モデルの代わりとなる、費用効果の高い選択肢を手に入れることができます。Metaはマイクロソフトを優先パートナーとして選び、Llama 2をマイクロソフトのAzureクラウドサービスを通じて配布し、さまざまなプラットフォームで利用できるようにすることで、AIの民主化を目指しています。この画期的な進展の詳細について見ていきましょう。 また読む:Metaがプラットフォームに導入予定のエキサイティングなAIツール:チャットボット、写真修正ツールなど! Llama 2:Metaのオープンソースモデルの商業版 Metaは火曜日にオープンソースのAIモデルであるLlamaの商業版を発表しました。Llama 2を利用することで、スタートアップやビジネスは独自モデルに関連する財務負担なしにAIの力を活用することができます。この動きは業界の風景を変え、小規模なプレイヤーがアプリケーションにAIの可能性を活かすことができるようにします。 また読む:OpenAIがAIモデルを公開ソース化し、オープンソース競争に参加 Microsoft:Metaの配布の優先パートナー MetaはLlama 2の配布先としてマイクロソフトを選びました。Llama 2はマイクロソフトのAzureクラウドサービスを通じてWindowsユーザーに提供されます。この戦略的なパートナーシップにより、Llama 2の到達範囲が広がり、マイクロソフトのエコシステムへのシームレスな統合が確保されます。 広範な利用可能性とアクセシビリティ MetaのAIの民主化への取り組みは、Llama 2の利用可能性に明確に表れています。マイクロソフトAzureを介した配布に加えて、Llama 2は直接ダウンロードも可能です。このモデルは、Amazon Web ServicesやHugging Faceなどの他のプロバイダーを通じても利用できます。このマルチプラットフォームのアプローチにより、Llama 2は幅広いユーザーベースに届き、協力とイノベーションを促進します。 また読む:Metaがテキスト、画像、音声を同時にトレーニングしたAIモデルをオープンソース化 Metaのオープンさ:特徴的な特性…

現代の自然言語処理(NLP):詳細な概要パート1:トランスフォーマー

最近の半年間で、私たちはBERTやGPTなどのアイデアの導入により、自然言語処理の領域で大きな成果を見てきましたこの記事では、…について詳しく掘り下げることを目指します

「テキスト要約の革新:GPT-2とXLNetトランスフォーマーの探索」

イントロダクション すべてを読んで理解するためには時間が足りません。そこでテキスト要約が登場します。テキスト要約は、テキスト全体を短くすることで、私たちが理解するのを助けます。詳細をすべて読まずに、必要な情報を得るようなものです。テキスト要約は、さまざまな状況で本当に役立ちます。たとえば、明日試験があるけれどもまだ読み始めていない学生の場合を想像してみてください。試験のために3章を勉強しなければならず、今日しか勉強する時間がありません。心配しないでください。テキスト要約を使ってください。それは明日の試験に合格するのに役立ちます。興味深いですね?この記事では、GPT-2とXLNetトランスフォーマーモデルを使用したテキスト要約について探求します。 学習目標 この記事では、以下のことを学びます。 テキスト要約とその種類について トランスフォーマーモデルの登場とそのアーキテクチャの仕組みについて GPT-2やXLNetなどのトランスフォーマー要約モデルについて 最後に、それぞれの異なるバリアントを使用した実装について この記事は、データサイエンスブログマラソンの一環として公開されました。 テキスト要約とは何ですか? 本のいくつかのページを読まなければならない状況に直面したことはありますか?しかし、怠け者のためにそれができなかったこともありますよね。テキスト要約のおかげで、私たちは本のすべての行やページを実際に読まずに、テキスト全体の要約を理解することができます。 テキスト要約は、重要な情報を保ちながら長いテキストを短く変換することです。まるでテキストの要約を作成するかのようなものです。テキスト要約は、自然言語処理(NLP)の魅力的な分野です。それは元のテキストの主要なアイデアと重要な情報を保持します。簡単に言えば、テキスト要約の目標は、元のテキストの重要なポイントを捉え、実際には読まずにテキストの内容を素早く把握できるようにすることです。 出典: Microsoft 要約の種類 テキスト要約のアプローチには、主に2つのタイプがあります。それらは以下の通りです。 抽出型 抽象型 それぞれ詳しく理解しましょう。 抽出型要約 これは、元のテキストから重要な文を選択し組み合わせて要約を形成することを含みます。このタイプの要約は、最も関連性の高い情報を抽出します。これらの文は、元のテキストの主要なアイデアや文脈を表すものでなければなりません。選択された文は、修正なしで要約を形成します。抽出型要約で使用される一部の標準的な手法には、次のものがあります。 文のスコアリング: これはスコアに基づくアプローチです。システムは、単語の頻度、文の位置、キーワードの重要性に基づいて要約のための文を選択します。スコアが高い文を要約に含めるために、スコアが高い文を選択します。この方法で、すべての高スコアの文が元のテキスト全体の要約となります。 グラフベース:…

GPT-4の詳細がリークされました!

OpenAIはGPT-4について何を隠しているのか?

CMUの研究者が「Zeno」という名前の、機械学習(ML)モデルの行動評価のためのフレームワークを紹介しました

AI駆動システムのプロトタイピングは常に複雑でした。しかし、プロトタイプを使用してしばらくすると、それがより機能的であることがわかるかもしれません。メモを取るためのチャットボット、テキストから画像を作成するためのエディタ、および顧客のコメントを要約するためのツールは、プログラミングの基本的な理解と数時間で作成することができます。 実際の世界では、機械学習(ML)システムには社会的な偏見や安全上の懸念などの問題が組み込まれることがあります。歩行者検出モデルの人種的偏見から特定の医療画像の系統的な誤分類まで、実践者や研究者は常に最先端のモデルの重大な制限や不具合を発見しています。モデルの制限を発見し、検証するためには、行動評価またはテストが一般的に使用されます。集計された精度やF1スコアなどの統合メトリックを調べる以上に、モデルの出力パターンをサブグループや入力データのスライスごとに理解する必要があります。MLエンジニア、デザイナー、およびドメインエキスパートなどの利害関係者は、モデルの予想される欠陥と潜在的な欠陥を特定するために協力する必要があります。 行動評価の重要性は広く強調されていますが、それを行うことは依然として困難です。さらに、公正なツールキットなどの多くの人気のある行動評価ツールは、実際の実践者が通常取り扱うモデル、データ、または振る舞いをサポートしていません。実践者はユーザーや利害関係者から手動で選んだケースをテストし、モデルを評価し、適切な展開バージョンを選択します。モデルは、実践者がモデルが使用される製品またはサービスに慣れる前に頻繁に作成されます。 特定のタスクをどれだけうまく完了できるかを理解することは、モデル評価の難しさです。モデルのパフォーマンスは、人間の知能の粗い近似値であるように、集計指標を使用しておおよそ推定するしかありません。たとえば、NLPシステムに正確な文法を埋め込むことができない場合や、社会的な偏見のようなシステム上の欠陥を隠すことができる場合があります。標準のテスト方法は、データのサブセットで全体のパフォーマンスメトリックを計算することです。 モデルが持つべき機能を決定する難しさは、行動評価の分野にとって重要です。複雑なドメインでは、要件のリストをテストすることは不可能です。なぜなら、無限の数が存在する可能性があるからです。その代わりに、MLエンジニアはドメインエキスパートやデザイナーと協力して、モデルの予想される機能を説明し、反復および展開する前に記述します。ユーザーは製品やサービスとのインタラクションを通じてモデルの制約と予想される振る舞いにフィードバックを提供し、将来のモデルのイテレーションに組み込まれます。 ML評価システムには、モデルの振る舞いを特定し、検証し、監視するための多くのツールがあります。これらのツールは、公平性の懸念やエッジケースなどのパターンを明らかにするために、データの変換と可視化を使用します。Zenoは他のシステムと協力し、他の方法を組み合わせています。データセットのサブグループまたはスライスに対してメトリックを計算するスライスベースの分析は、Zenoに最も近い行動評価方法です。Zenoは現在、任意のドメインやアクティビティに対してスライドベースのテストとメタモーフィックテストを可能にしています。 ZenoにはPythonアプリケーションプログラミングインタフェース(API)とグラフィカルユーザインタフェース(GUI)(UI)が含まれています。モデルの出力、メトリック、メタデータ、変更されたインスタンスなど、行動評価の基本的なコンポーネントは、Python API関数として実装できます。APIの出力は、行動評価とテストを実施するためのメインインタフェースを構築するためのフレームワークです。Zenoには2つの主要なフロントエンドビューがあります。データの発見とスライスの作成に使用されるExploration UIと、テストの作成、レポートの作成、パフォーマンスのモニタリングに使用されるAnalysis UIです。 ZenoはPythonスクリプトを介して一般に公開されています。組み込まれたフロントエンドはSvelteで書かれており、視覚化にはVega-Lite、データ処理にはArqueroを使用しています。このライブラリはPythonパッケージに含まれています。必要な設定(テストファイル、データパス、列名など)を指定した後、ユーザーはコマンドラインからZenoの処理とインタフェースを開始します。ZenoのUIをURLエンドポイントとしてホストする能力により、それをローカルに展開するか、他のコンピューティングと共にサーバーに展開することができ、ユーザーは自分のデバイスからアクセスできます。このフレームワークは、数百万のインスタンスを含むデータセットで試され、設置されたシナリオにも適切にスケーリングするはずです。 ML環境には、特定のデータやモデルに対応するさまざまなフレームワークやライブラリがあります。Zenoは、カスタマイズ可能なPythonベースのモデル推論およびデータ処理APIに大いに依存しています。研究者たちは、ほとんどのMLライブラリがPythonに基づいているため、同じ断片化の問題に直面しているにもかかわらず、現代のほとんどのMLモデルをサポートするために、zenoのバックエンドAPIを一連のPythonデコレータメソッドとして開発しました。 研究チームによって実施された事例研究では、ZenoのAPIとUIがデータセットとジョブ全体にわたって主要なモデルの欠陥を発見するのにどのように協力しているかが示されました。より広い意味で言えば、この研究の結果から、行動評価フレームワークはさまざまなデータやモデルに対して有用であることが示唆されます。 ユーザーのニーズや課題の難しさに応じて、Zenoのさまざまな機能は行動評価をより簡単で迅速かつ正確にすることが可能です。事例2の参加者はAPIの拡張性を活用してモデル分析のメタデータを作成しました。事例研究の参加者は、既存のワークフローにZenoを組み込むことやZeno APIとのコード通信についてほとんど困難を報告していませんでした。 制約と予防措置 行動評価において、エンドユーザーにとって重要な行動やモデルによってエンコードされる行動を把握することは大きな困難です。研究者は現在、ZenoHubという共同リポジトリを開発しており、ユーザーがZenoの機能を共有し、関連する分析コンポーネントをより簡単に見つけることができるようにして、モデル機能の再利用を促進しています。 Zenoの主な機能はデータスライスに対してメトリックを定義してテストすることですが、ツールはデータやスライスを表示するための限られたグリッドとテーブルビューのみを提供しています。Zenoの有用性は、さまざまな強力な可視化手法のサポートによって向上する可能性があります。DendroMap、Facets、AnchorVizなど、意味的な類似性をエンコードしたインスタンスビューを使用することで、ユーザーはデータ内のパターンや新たな行動をより良く発見することができるでしょう。ML Cube、Neo、ConfusionFlowなど、Zenoがモデルの行動をより良く表示するために変更できるいくつかのMLパフォーマンスの可視化手法があります。 Zenoは並列計算とキャッシングによって大規模なデータセットにスケーリングすることができますが、機械学習のデータセットのサイズは急速に増加しています。そのため、より高速な処理を実現するためにさらなる改善が求められます。Rayなどのライブラリを使用して分散コンピューティングクラスタで処理を行うことは、将来のアップデートとなるでしょう。 非常に大きなテーブル上での複数のヒストグラムのクロスフィルタリングは、別の障害です。ZenoはFalconのような最適化手法を用いて、大規模データセット上でリアルタイムのクロスフィルタリングを容易にすることができます。 結論: 訓練データにおいて機械学習モデルが高い精度を達成しても、実際の世界においてはネガティブなバイアスや安全上の問題など、システム的な欠陥に苦しむ可能性があります。実践者はモデルの行動評価を行い、特定の入力に対するモデルの出力を検査して、このような問題を特定し修正します。行動評価は重要でありながらも困難な課題であり、実世界のパターンの発見やシステム的な欠陥の検証を必要とします。機械学習の行動評価は、バイアスや安全上の問題など、問題のあるモデルの行動を特定し修正するために重要です。この研究では、著者らがMLの評価の困難さに深く踏み込み、さまざまな文脈でモデルをスコアリングするための普遍的な手法を開発しました。実践者が実世界のモデルを評価する4つの事例研究を通じて、研究者はZenoが複数の領域にわたって適用できる可能性を示しました。 多くの人々はAIの発展に高い期待を寄せています。しかし、彼らの行動の複雑さは彼らの能力と同じ速度で発展しています。行動駆動の開発を可能にし、人間の価値と調和したインテリジェントシステムの構築を保証するためには、堅牢なリソースが必要です。Zenoは、AI関連のさまざまなジョブ全体でこのような詳細な検証を行うことができる柔軟なプラットフォームです。

MITとUC Berkeleyの研究者は、最小限の努力で人間がロボットに望むことを素早く教えることができるフレームワークを提案しました

ニューヨーク大学とカリフォルニア大学バークレー校との共同研究により、MITの研究者たちは、人間が最小限の努力で家庭のタスクをロボットに効果的に教えることができる画期的なフレームワークを開発しました。この革新的な手法により、ロボットの適応性が大幅に向上し、高齢者や障害を持つ個人がさまざまな環境で支援を受けるための能力が向上する可能性があります。 ロボットが直面する主な課題は、訓練中に遭遇していない予期しないシナリオやオブジェクトを処理する能力の限定です。その結果、ロボットはしばしば見慣れないアイテムを認識し、タスクを実行することができません。現在のトレーニング手法では、ロボットが失敗する理由がわからないため、再トレーニングプロセスが時間のかかるものとなっています。 MITの研究者は、失敗の原因を特定しフィードバックを提供するメカニズムの欠如が学習プロセスを妨げると説明しています。この問題に対処するため、研究者たちは、ロボットがタスクを完了できない場合に対立的な説明を生成するアルゴリズムベースのフレームワークを開発しました。これらの説明は、成功するために必要な変更に関する洞察を提供します。 失敗に直面した場合、システムはロボットがタスクを成功させるためにどのような変更が必要であったかを示す一連の対立的な説明を生成します。その後、ユーザーはこれらの対立的な説明を提示され、失敗に関するフィードバックを提供するよう求められます。このフィードバックは、生成された説明と組み合わせて、ロボットのパフォーマンスを微調整するための新しいデータの作成に使用されます。 微調整とは、既に一つのタスクに対してトレーニングされた機械学習モデルを効率的に同様でありながら異なるタスクを実行できるように調整することです。このアプローチにより、従来の方法と比較して、研究者たちはロボットをより効率的かつ効果的にトレーニングすることができ、ユーザーの要求する時間を短縮することができました。 特定のタスクに対してロボットを再トレーニングする一般的な方法の一つは、ユーザーが望ましいアクションをデモンストレーションする模倣学習です。しかし、この従来の方法では、ロボットが特定の色とマグカップを関連付けるなど、限定的な理解を持つ可能性があります。研究者たちは、マグカップがどの色であってもマグカップであることをロボットに認識させることは煩雑で、多くのデモンストレーションが必要とされると説明しています。 この制約を克服するために、研究者たちのシステムは、ユーザーがロボットが対話するために望んでいる特定のオブジェクトを識別し、タスクに対して重要でない視覚的な要素を決定します。そして、これらの「重要ではない」視覚的な要素をデータオーグメンテーションというプロセスを用いて変更することで、合成データを生成します。 このフレームワークは、以下の3つのステップで進行します: ロボットの失敗につながったタスクを提示する。 ユーザーからデモンストレーションを収集し、望ましいアクションを理解する。 ロボットの成功を可能にするための可能な変更を探索して対立的な説明を生成する。 人間のフィードバックを組み込み、多数のオーグメンテーションデモンストレーションを生成することで、システムはロボットの学習プロセスをより効率的に微調整します。 研究者たちは、ユーザーがタスクに影響を与えずに変更できる要素を特定するようヒューマンユーザーに求める実験を実施し、その効果を測定しました。その結果、人間はこのタイプの対立的な推論に優れていることが示され、このステップが人間の推論とロボットの推論を結びつける上で有効であることが強調されました。 研究者たちは、目標オブジェクトへのナビゲーション、ドアの解錠、テーブルトップにオブジェクトを配置するなどのタスクにおいて、彼らの手法が従来の技術を上回り、ロボットがより早く学び、ユーザーのデモンストレーションが少なくて済むようにすることができることをシミュレーションを通じて検証しました。 今後の展望として、研究者たちは自動ロボットに彼らのフレームワークを実装し、生成的な機械学習モデルを使用して新しいデータを作成するために必要な時間を短縮する方法を探求し続けることを目指しています。究極の目標は、ロボットに人間のような抽象的な思考能力を備えさせ、タスクと周囲の環境をより良く理解させることです。 このフレームワークの成功により、高い適応性と柔軟性を持ち、私たちの日常生活にシームレスに統合され、様々な環境で貴重な支援とサポートを提供する高度に適応可能なロボットの登場が可能になる可能性があります。

オンラインプライバシーのためのトップアドブロッカー(2023年)

最も効果的な広告ブロッカーは、現代のウェブを利用するすべての人にとって欠かせない存在です。頻繁に訪れるサイトに関係なく、ウェブを悩ませる無数のポップアップ広告、アクティビティトラッカー、マルウェア広告から堅牢なセキュリティが必要です。FBI自体もその使用を推奨しています。 ブラウザのアドオンや専門の広告ブロックプログラムが利用できるようになったため、安全性を確保することは簡単になりました。それらは優れたVPNやウイルス対策プログラムと同様に重要なリソースです。複数の広告ブロッカーが利用可能なため、使用するものとその欠点が受け入れられるかどうかは、唯一の問題です。ただし、利益がコストを上回ると感じる場合、最も効果的な広告ブロッカーやプライバシー強化アプリケーションの包括的なリストをまとめました。これらは想像できるすべてのブラウザとオペレーティングシステムをサポートしているため、心配することなくウェブを閲覧できます。 AdBlock Plus (ABP) AdBlock Plus (ABP)は、Firefox、Chrome、Safari、Edge、Operaなどの一般的なブラウザにプラグインがあります。ABPを使用すると、事前に設定されたフィルタリストを読み込んでボタンをクリックするだけで、ほとんどの広告、スパイウェア、ソーシャルメディアのリンクをブロックすることができます。収入を確保するために、熟練したユーザーは追加のブロックリストを選択したり、カスタムフィルタを実装したり、お気に入りのウェブサイトをホワイトリストに登録したりすることができます。AdBlock Plusの「非侵入型広告」フィルタリング機能は、一部のユーザーには迷惑かもしれませんが、設定メニューで無効にすることができます。AdBlock Browser for Androidは、広告をブロックするFirefoxベースのブラウザを提供し、AdBlock PlusアプリはiOS上のコンテンツブロッカーシステムとシームレスに結合し、Safari上の広告をブロックします。 AdBlock AdBlockは、世界中で最も広く使用されている広告ブロックソフトウェアです。AdBlockはバナー広告、ビデオ広告、ポップアップウィンドウなどをブロックすることができます。マーケターがオンラインの動きを追跡するために使用するトラッカーもブロックされます。AdBlockは、迷惑な広告を排除するだけでなく、オンラインのプライバシーとセキュリティも向上させます。AdBlockは、Chrome、Firefox、Safari、Microsoft Edgeと互換性があります。また、iOSおよびAndroidデバイスとも互換性があります。GetAdBlock.comで、「Get AdBlock Now」というボタンでAdBlockをダウンロードできます。その後、アドオンのインストールにより、AdBlockによる即時の広告ブロックがトリガーされます。 Ublock Origin Ublock Originは、軽量で効果的なブロックを重視するWebブラウザ用の広告ブロッカーです。このプラグインには、一般的な広告とマルウェアのドメインに対する事前設定のフィルタリストが付属しており、ホストファイルを使用してより多くのフィルタリストをダウンロードしたり、フィルタを読み書きしたりすることができます。uBlock Originは広告だけでなく、トラッキングも防止します。ウェブサイトにはしばしば「トラッカー」と呼ばれる小さなコードが挿入されます。それらはあなたが訪れるウェブサイトに関するデータを収集し、広告主と共有します。uBlock Originを使用すると、特定のトラッカーがデータにアクセスできなくなります。要するに、uBlock…

Concrete MLと出会ってください:プライバシーの保護と安全な機械学習を可能にするオープンソースのFHEベースのツールキット

人工知能と機械学習は、過去数年間で驚異的な生産性の向上を示しています。機械学習は、すべてのプライバシーと機密性の手段を保持することによって、高品質のデータを持つことに関連しています。問題を解決するために、プライバシーと機械学習の利点のギャップを埋めることは非常に重要です。現在のデータ駆動型の時代において、個人のプライバシーを保護することは非常に困難になっています。機械学習が現在非常に一般的になっているため、その影響には注意を払い、クライアントの情報を保護することが必要です。Fully Homomorphic Encryption(FHE)などの新しい進歩によって、ユーザー情報の保護と機密性の維持が成功裏に行われています。 Zamaの機械学習研究者たちは、Concrete-MLというオープンソースのライブラリを開発しました。このライブラリは、MLモデルをそのFHE相当物にスムーズに変換することを可能にします。彼らは最近、Google Tech TalkでConcrete MLを発表しました。ユーザーに関連するデータの一部がクラウドに送信されるとき、ホモモーフィック暗号化スキームがそのデータを保護します。データの安全性を考慮して、操作とすべてのアクションが暗号化されたデータ上で行われます。Fully Homomorphic Encryptionは例を使って説明することができます。例えば、ある都市で心臓の問題を抱える患者に関する記述的な分析を行いたいとする医師がいます。その都市の病院の内部チームは、プライバシーの問題のためにデータを公開することができないかもしれませんが、そのデータは安全にデータベースに保存されています。ここで、FHEは機密データを暗号化し、データを安全に計算することができます。 Concrete MLは、The Concrete Frameworkの上に開発されたオープンソースのツールキットです。これは、研究者やデータサイエンティストが機械学習モデルをその同一のホモモーフィックユニットに自動的に変換するのを支援します。Concrete MLの主な特徴は、暗号技術についての事前知識がなくても、MLモデルをFHE相当物に変換する能力です。Concrete MLを使用することで、ユーザーは異なるサービスプロバイダーとの信頼性のない会話を行うことができ、MLモデルの展開を妨げることなくデプロイすることができます。データとユーザーのプライバシーは保持され、MLモデルは信頼性のないサーバー上でも本番環境に配置されます。 直接暗号化データ上で計算を行うことを許可する暗号化戦略であるFHEを使用すると、独自の機能を持つアプリケーションを開発することができます。FHEは復号化の必要性を必要としません。Concrete MLは、Scikit-learnとPyTorchからいくつかの人気のあるアプリケーションユーザーインターフェース(API)を使用しています。Concrete MLモデルは次のように設計されています。 モデルのトレーニング – モデルはScikit-learnライブラリを使用して暗号化されていないデータ上でトレーニングされます。Concrete MLは推論中にのみ整数を使用します。FHEは整数上でのみ動作するためです。 変換とコンパイル –…

新たなディープ強化学習(DRL)フレームワークは、シミュレートされた環境で攻撃者に対応し、サイバー攻撃がエスカレートする前に95%をブロックすることができます

サイバーセキュリティの防御者は、技術の発展とシステムの複雑さのレベルが上昇するにつれて、自分たちの技術と戦術を動的に適応させる必要があります。過去10年間にわたる機械学習(ML)および人工知能(AI)の研究の進歩とともに、これらの技術のサイバーセキュリティに関連するさまざまな領域での利用事例も進化してきました。既存の多くのセキュリティアプリケーションでは、頑強な機械学習アルゴリズムによって支えられたいくつかの機能が、大規模なデータセットでトレーニングされています。そのような例の1つが、MLアルゴリズムを電子メールセキュリティゲートウェイに統合した2010年代初頭です。 実世界のシナリオでは、自律型のサイバーシステム防御戦略と行動の推奨事項を作成することは非常に困難です。なぜなら、このようなサイバーシステムの防御メカニズムに対する意思決定支援には、攻撃者と防御者の間のダイナミクスの組み込みとシステム状態の不確実性の動的特性化が必要だからです。さらに、サイバー防御者は、コスト、労力、時間などのさまざまなリソース制約に直面することが多いです。AIを使用しても、積極的な防御が可能なシステムの開発は理想的な目標のままです。 この問題に対する解決策を提供するため、米国エネルギー省太平洋北西国立研究所(PNNL)の研究者たちは、シミュレートされた環境で攻撃者に対応し、サイバー攻撃の95%をエスカレートさせる前に停止できる新しいDRL(深層強化学習)に基づくAIシステムを開発しました。研究者たちは、ネットワーク内で攻撃者と防御者の間で行われるマルチステージのデジタル紛争を示すカスタムのシミュレーション環境を作成しました。そして、報酬を最大化することに基づいて妥協を回避し、ネットワークの混乱を減らすことを目指した強化学習の原則を使用して、4つのDRLニューラルネットワークをトレーニングしました。このチームの研究成果は、また、ワシントンDCで開催された人工知能の進歩協会で発表され、多くの称賛を受けました。 このようなシステムを開発する際のチームの理念は、まずDRLアーキテクチャを成功裏にトレーニングできることを示すことでした。洗練された構造に取り組む前に、彼らは有用な評価メトリックを示したいと考えました。研究者たちが最初に行ったことは、Open AI Gymツールキットを使用して抽象的なシミュレーション環境を作成することでした。次に、この環境を使用して、MITRE ATT&CKフレームワークの15のアプローチと7つの戦術から選ばれたサブセットに基づいてスキルと持続性レベルを示す攻撃者エンティティを開発しました。攻撃者の目標は、初期アクセスと偵察フェーズから他の攻撃フェーズまでの7つの攻撃チェーンステップを進むことで、最終目標である影響と流出フェーズに到達することです。 重要なポイントとして、チームは環境内で攻撃を開始する敵をブロックするためのモデルを開発する意図はありませんでした。むしろ、システムが既に侵害されていると想定しています。その後、研究者たちは強化学習を使用して4つのニューラルネットワークをトレーニングしました。研究者たちは、強化学習を利用せずにこのようなモデルをトレーニングすることも可能ですが、良いメカニズムを開発するには長い時間がかかると述べています。一方、深層強化学習は、人間の行動の一部を模倣することで、この巨大な探索空間を非常に効率的に利用します。 研究者たちがシミュレートされた攻撃環境でAIシステムをトレーニングすることができることを実証するための努力により、AIモデルがリアルタイムで攻撃に対する防御反応が可能であることが示されました。研究者たちは、実際のマルチステージの攻撃シーケンスに対する4つのモデルフリーDRLアルゴリズムのパフォーマンスを厳密に評価するために、いくつかの実験を実施しました。彼らの研究は、異なるスキルと持続性レベルを持つマルチステージの攻撃プロファイルでDRLアルゴリズムをトレーニングできることを示し、シミュレートされた環境で効果的な防御結果を生み出すことを示しました。

「データ民主化:大企業が取り入れる5つの「全員向けデータ」戦略」

「スケールでデータ駆動の洞察を活用し、日常の意思決定に統合するには、データ、スキル、ツール、文化の複数の側面で高いレベルのエンタープライズデータの成熟度が必要です」

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us