強化学習:マルコフ決定過程ー第1部

強化学習:マルコフ決定過程ー第1部' -> '強化学習:マルコフ決定過程ー第1部

強化学習のバックボーンであるマルコフ決定過程を紹介します

Image by Ricardo Gomez Angel on Unsplash

私の以前の記事では、主に教師あり学習について説明し、教師なし学習の要素も少し取り上げました。しかし、この記事と次のいくつかの記事では、強化学習の問題に取り組み、読者の皆さんにそれについて明確で直感的なアイデアを提供します。

まず、機械学習の概要を説明しましょう。機械学習には3つの主要なサブフィールドがあります。教師なし学習、教師あり学習、および強化学習です。まず、それぞれの違いを理解しましょう:

  1. 教師なし学習:ラベルのないすべてのデータポイントに対して、パターンを自動的に見つけたりラベルを付けたりします。各ポイントはすべての特徴のベクトルであり、通常はクラスタリングによって行われます。新しい部屋に移動すると想像してください。クローゼットと戸棚があり、あなたの持ち物がすべてあります。部屋と持ち物を注意深く調べ、どのアイテムが互いに似ているかを見て、持ち物をそれぞれのカテゴリーにパッキングして部屋を整理します。要するに、教師なし学習を実践しています。これは単一のステップのプロセスです。
  2. 教師あり学習:ラベルが付けられたデータポイントがあります。各データポイントがどのラベルに属するかを学びます。そして、これらのデータポイントを正しいラベルにフィットさせる関数を見つけます。つまり、y≈f(x)を見つけます。強化学習を学んでいると想像してください。最初にいくつかの先入観があります。したがって、f(x)はランダムに初期化されます。学習教材を繰り返し学習すると、徐々に概念が強くなります。要するに、yは学習教材で、f(x)は理解です。教師あり学習は単一のステップのプロセスです。
  3. 強化学習:強化学習は教師あり学習とは異なり、学習にラベルを頼らずに報酬を利用します。さらに、強化学習は通常、複数のステップで行われます。各ステップには、各ステートに対してデータポイントがあります。そして、各ステートでは、エージェントは長期的に報酬を最大化するために行動を選択します。教師あり学習では、ラベルy

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AIニュース

KubernetesでのGenAIアプリケーションの展開:ステップバイステップガイド

このガイドは、高い可用性のためにKubernetes上でGenAIアプリケーションを展開するための包括的で詳細な手順を提供します

データサイエンス

「Ego-Exo4Dを紹介:ビデオ学習とマルチモーダルパーセプションに関する研究をサポートするための基礎データセットとベンチマークスイート」

今日、AIはほとんどの想像できる分野で応用されています。それは確かに私たちの生活を変え、プロセスを合理化し、効率を向上...

機械学習

エンジニアにとって役立つ6つのリソース

「このリソースのコレクションは、さまざまな経験レベルを持つ多くのAIのプロフェッショナルに役立つでしょうブックマークに...

機械学習

「P+にお会いしましょう:テキストから画像生成における拡張テキスト反転のための豊かな埋め込み空間」

テキストから画像の合成は、テキストのプロンプト記述から現実的な画像を生成するプロセスを指します。この技術は、人工知能...

機械学習

科学者たちは、AIと迅速な応答EEGを用いて、せん妄の検出を改善しました

うつ病を検出することは容易ではありませんが、それには大きな報酬があります。患者に必要な治療を迅速かつ確実に行うことで...

コンピュータサイエンス

「アリババは、量子コンピューティングよりもこれを優先します」

中国のテック巨人であるアリババは最近、量子コンピューティング部門を廃止するという戦略的な重点の大幅な転換を発表しまし...