遺伝的アルゴリズムを使用して特徴セットを最適化する方法

遺伝的アルゴリズムによる特徴セット最適化方法

前提条件

遺伝的アルゴリズムは高度なトピックです。初心者の要件を考慮してコンテンツが準備されていますが、この記事を読む前にプログラミングと基本的なアルゴリズムの基礎知識を持っていることが望ましいです。さらに、数学のスキルを磨くことも考慮してください。数学のスキルは例を理解するのに非常に役立ちます。

最適化の概要

最適化はパフォーマンスの向上の技術です。どんなプロセスでも、図に示されているように、入力と出力の集合に遭遇します。

最適化は、最も有利な出力結果をもたらす入力値の検索を含みます。有利な概念は、具体的な問題によって異なる場合がありますが、数学的な文脈では、入力パラメータの調整を通じて1つ以上の目的関数を最大化または最小化することを通常求めます。

例えば、y = f(x)を考えてみましょう。もしf’(x)=0がx=x*の点で成立する場合、最適解（最大または最小）または転曲点がその点に存在します。

詳しく調べると、最初のゼロでない高階微分は通常「n」と表されることがわかります。つまり、

nが奇数の場合、x*は転曲点です。
nが偶数の場合、x*は局所的な最適点です。

このアイデアをさらに展開すると…

次の高階微分の値が+veの場合、x*は局所的な最小点です。
次の高階微分の値が-veの場合、x*は局所的な最大点です。

例えば:

最適化の原則

以下の制約付き最適化問題を考えてみましょう:

制約の特性に基づいて、実行可能領域が特定されます。この実行可能領域内にある点は、最適解の候補と見なされます。実行可能領域内にある点は自由点と呼ばれ、領域の境界にある点は境界点として分類されます。したがって、最適解は実行可能領域内の自由点または境界点として現れることがあります。勾配ベースの手法、特に導関数ベースの手法は、制約のない最適化問題に対処するための従来の手段でした。ただし、これらにはいくつかの制約と欠点が存在することに注意する必要があります。

遺伝的アルゴリズムとは何ですか？

歴史を通じて、自然は常に人類に対して豊かなインスピレーションの源を提供してきました。遺伝的アルゴリズム（GAs）は、自然選択と遺伝学の原理に基づく探索ベースのアルゴリズムです。GAsは進化計算として知られる計算の広い範囲の一部です。

遺伝的アルゴリズム（GAs）は、ジョン・ホーランドと彼の学生やミシガン大学の同僚、特にデヴィッド・E・ゴールドバーグによって開発されました。創始以来、GAsはさまざまな最適化問題に適用され、高い成功を収めてきました。

遺伝的アルゴリズム（GAs）では、与えられた問題の潜在的な解候補の集団が確立されます。これらの解候補は再結合と突然変異のプロセスを経て、自然遺伝学の原理を模倣し、新しい子孫が作成されます。この反復プロセスは複数の世代にわたります。個々の候補解は、目的関数のパフォーマンスによって評価されます。適応度の高い個体は、より優れた子孫を生み出す可能性が高くなります。これは、ダーウィニアン理論の「適者生存」に合致します。

このようにして、遺伝的アルゴリズムは世代を超えて個体または解の品質を進化させ、事前に定義された停止基準が満たされるまで続けます。遺伝的アルゴリズムは操作においてかなりのランダム性を持っていますが、単純なランダムな局所探索法よりも優れた性能を発揮します。なぜなら、遺伝的アルゴリズムは最適解を探索するために歴史的な情報も組み込んでいるからです。

なぜ遺伝的アルゴリズムを使用するのですか？

遺伝的アルゴリズム（GAs）は、伝統的なアルゴリズムが解を提供するのに苦労する大規模な問題に特に優れた能力を持っています。GAsは複雑な最適化問題に対処するための汎用的なフレームワークを提供します。遺伝的アルゴリズム（GAs）を使用することのいくつかの利点は以下の通りです。

汎用性：GAsは、エンジニアリング、ファイナンス、生物学などのさまざまなドメインにおいて、広範な最適化問題に適用できるため、汎用的な選択肢となります。
グローバルサーチ：GAsは、ローカルサーチアルゴリズムでは見落とされる可能性がある解を見つける能力に優れています。これにより、複数の局所最適解を持つ問題に適しています。
導関数の必要性がない：多くの最適化手法と異なり、GAsは目的関数の導関数を必要としません。そのため、連続しない、ノイズのある、または複雑なフィットネスの地形を持つ問題にも適用できます。
並列性：GAsは効果的に並列化できるため、高性能コンピューティングシステムでの収束が速くなります。
確率性：GAsの確率性により、局所最適解を回避し、より詳細に探索空間を探索することができます。
適応性：GAsは時間とともに検索戦略を適応させることができます。これは、動的または変化する最適化問題に特に有用です。
解の多様性：GAsは多様な解の集団を維持するため、幅広い可能な解を見つけ、収束を防ぐのに役立ちます。
解釈可能性：一部の場合、GAsは解空間の構造に関する洞察を提供することができ、問題をより理解しやすくします。
組み合わせ最適化問題：GAsは、巡回セールスマン問題やジョブスケジューリングなどの組合せ最適化問題に適しています。
並行進化：GAsは複数の解を同時に進化させることができるため、多目的最適化や他の複雑なシナリオに価値があります。

重要なことは、遺伝的アルゴリズムはこれらの利点を提供する一方で、すべての最適化問題に最適な選択肢ではなく、問題の特性によって性能が異なることです。最適な結果を得るためには、適切な問題分析とアルゴリズムの選択が必要です。

遺伝的アルゴリズムの用語

集団と世代：集団は個体の配列です。たとえば、集団のサイズが100でフィットネス関数の変数の数が3の場合、集団は100×3の行列で表されます。同じ個体が集団内で複数回現れることがあります。たとえば、個体(2, -3, 1)は配列の複数の行に現れることがあります。遺伝的アルゴリズムは各イテレーションで現在の集団上で一連の計算を行い、新しい集団を生成します。各次の集団は新しい世代と呼ばれます。
親と子：次の世代を作成するために、遺伝的アルゴリズムは現在の集団内の特定の個体（親）を選択し、次の世代の個体（子）を作成します。通常、アルゴリズムはより優れたフィットネス値を持つ親を選択する傾向があります。
個体：フィットネス関数を適用できる任意の点です。個体のフィットネス関数の値はそのスコアです。たとえば、フィットネス関数が：
- f(x1,x2,x3)=(2×1+1)2+(3×2+4)2+(x3−2)2
- 問題の変数の数が長さとなるベクトル(2, -3, 1)は個体です。個体(2, –3, 1)のスコアはf(2, –3, 1) = 51です。

個体は時にゲノムまたは染色体と呼ばれ、個体のベクトルのエントリは遺伝子と呼ばれます。

フィットネス関数：最適化したい関数です。標準の最適化アルゴリズムでは、これを目的関数と呼びます。
フィットネス値と最良フィットネス値：個体のフィットネス値はその個体のフィットネス関数の値です。集団の最良フィットネス値は、最適化問題に応じて最小のフィットネス値または最大のフィットネス値です。
収束：GAが終了基準を満たす解に到達するポイントです。最適または近似最適解となることがあります。
探索空間：最適化問題のすべての可能な解の集合です。
多様性：多様性は集団内の個体間の平均距離を指します。平均距離が大きい場合、集団は高い多様性を持ちます。多様性は遺伝的アルゴリズムにとって重要であり、アルゴリズムがより広い領域を探索できるようにします。
ゲノタイプ：染色体の内部表現（例：バイナリまたは数値の文字列）。
フェノタイプ：染色体によって表される実際の解です。ゲノタイプをデコードすることで得られます。
交叉率：2つの親が新しい世代で子供を生み出すために交叉する確率です。
突然変異率：新しい世代で遺伝子（または染色体の一部）が突然変異する確率です。

基本遺伝的アルゴリズム（GA）：疑似コード

基本遺伝的アルゴリズム（GA）の詳細な戦略

エンコーディングと集団

染色体は探索空間での解をエンコードします

通常は0と1の文字列として表現されます
文字列の長さをlとすると、異なる染色体（または文字列）の数は2lです

集団

世代内の染色体の集合
集団のサイズは通常一定です
一般的な慣行は初期集団をランダムに選ぶことです。

フィットネス評価

各染色体には適応度/目的関数が関連しています。
これは、符号化された解の良さの程度を示しています。
最小化問題を解決する場合、適応度 = 1 / 目的関数または適応度 = -1 * 目的関数です。
最大化問題を解決する場合、適応度 = 目的関数です。

選択

優れた文字列にはより多くのコピーを作成します。
悪い文字列にはより少ないコピーを作成します。
比例選択スキーム。
- コピーの数はその適応度に比例します。
- ある程度自然選択手続きを模倣します。
ルーレット選択とトーナメント選択は、よく使われる2つの選択手法です。

交叉

遺伝情報の交換
ランダムに選択された親染色体の間で行われます。
一点交叉と一様交叉が最も一般的に使用される手法です。
確率的操作

突然変異

遺伝的構造のランダムな変更
遺伝的多様性を集団に導入します。
新しい探索領域の探索
バイナリ遺伝子の突然変異はビットの単純な否定を含みます。
さまざまな方法で定義された実数コード化遺伝子の突然変異
確率的操作

エリート主義

次の世代に最も優れたパフォーマンスをする個体を保存する戦略です。
最も適応度の高い個体は、交叉や突然変異などの遺伝的操作を受けずに次世代の一部になります。
エリート主義は、これまでに見つかった最良の解が進化プロセス中に失われず、集団に貢献し続けることを保証します。
安定した改善と加速された収束を保証します。

終了基準

選択、交叉、突然変異のサイクルが数回繰り返され、以下のいずれかが発生するまで続けられます。
集団の平均適応度値が数世代にわたってほぼ一定です。
目的の目的関数値が集団内の少なくとも1つの文字列で達成されます。

世代数（または反復数）がある閾値よりも大きいです（最も一般的に使用されます）。

遺伝的アルゴリズム（GA）のバリエーション

差分進化（DE）：DEは、実数最適化問題に特化したGAの一種です。ベクトルベースの突然変異および組み合わせ演算子を使用します。
分布推定アルゴリズム（EDA）：EDAは、集団内の有望な解の確率分布をモデル化し学習し、この分布を使用して新しい候補解を生成します。
自己適応型遺伝的アルゴリズム：進化する集団の特性に基づいて遺伝的演算子（突然変異率、交叉タイプ）を適応させることができるアルゴリズムで、効率的な収束を実現します。
ニッチングアルゴリズム：これらのアルゴリズムは、フィットネスランドスケープに複数のピークまたはモードが存在する多様な最適化問題で、複数の異なる解を見つけることに焦点を当てています。
多目的進化アルゴリズム（MOEA）：MOEAは、複数の相反する目的を持つ問題に対応します。これらの目的間のトレードオフを表す一連のパレート最適解を見つけることを目指します。
ハイブリッドアルゴリズム：GAを他の最適化手法、機械学習モデル、またはドメイン固有のヒューリスティックと統合して、パフォーマンスと堅牢性を向上させます。

遺伝的アルゴリズムと最適化について簡潔な概要を提供することを目指しました。ただし、この広範な主題について特定の質問がある場合や、詳細な情報が必要な場合は、お気軽にコメントでお知らせください。

お時間とご注意いただき、ありがとうございます！LinkedInでお問い合わせいただけます。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

AlgorithmGenetic Algorithm

Was this article helpful?

93 out of 132 found this helpful