「トランスフォーマーは戦略を学ぶことができるのか?」

トランスフォーマーの戦略学習可能性は?

簡単なボードゲームをプレイするためのTicTacGPT

Jon Tysonによる写真、Unsplash

ほとんどのボードゲームは、畳み込みニューラルネットや他の幾何学的にインスピレーションを受けたアーキテクチャの使用を惹きつけますが、実際にボードの状態を文字列として表現できるという事実は、トランスフォーマをゲームに自然に適用できるかどうかという問題を提起します。ここでは、シンプルな三目並べゲームの文脈でこれに答えることができるかどうかを見てみましょう。これは非常に実用的ではないように見えるかもしれません(ほとんどの人がこのゲームには非常に簡単に学習できるクローズドフォームのナッシュ均衡戦略があることを知っています)、しかし、これは私たちの疑問のための有用なテストベッドです。その理由は、ゲームが十分にシンプルであるため、私たちは簡単にトランスフォーマを使ってそれをプレイすることができる一方で、最善の戦略がすぐに明らかではないほど複雑であるためです。

ゲームの実装

まず、`TicTacToe`クラスを実装します。これは非常に簡単です。ボードを9つの文字列で表現できるようにしたいので、各マスに1つの文字を使用します。最初のプレイヤーには`X`、2番目のプレイヤーには`O`、空のマスには`-`を使用します。次にプレイする人とゲームが終了したかどうかも追跡します。また、デバッグ時に文字列を見つめる必要がないように、ボードを表示するための素敵なメソッドも含めます。

class TicTacToe:    def __init__(self):        # 空のボードを初期化        self.board = ['-' for _ in range(9)]        self.current_player = 'X'  # Xがスタートする        def make_move(self, position):        """ボード上での動きをする。"""        if self.board[position] == '-':            self.board[position] = self.current_player            self.switch_player()            return True        else: return False  # 非合法な動き        def switch_player(self):        """現在のプレイヤーを切り替える。"""        self.current_player = 'O' if self.current_player == 'X' else 'X'        def check_winner(self):        """勝者がいるかどうかをチェックする。"""        # 行、列、対角線        winning_positions = [            [0, 1, 2], [3, 4, 5], [6, 7, 8],  # 行            [0, 3, 6], [1, 4, 7], [2, 5, 8],  # 列            [0, 4, 8], [2, 4, 6]  # 対角線        ]                for positions in winning_positions…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

「Seerの最高データオフィサーであるDr. Serafim Batzoglouによるインタビューシリーズ」

セラフィム・バツォグルはSeerのチーフデータオフィサーですSeerに加わる前は、セラフィムはInsitroのチーフデータオフィサー...

人工知能

「ゲイリー・ヒュースティス、パワーハウスフォレンジクスのオーナー兼ディレクター- インタビューシリーズ」

ゲイリー・ヒュースティス氏は、パワーハウスフォレンジックスのオーナー兼ディレクターであり、ライセンスを持つ私立探偵、...

人工知能

「パクストンAIの共同創業者兼CEO、タングイ・シャウ - インタビューシリーズ」

タングイ・ショウは、Paxton AIの共同創設者兼CEOであり、法的研究と起草の負担を軽減するためにGenerative AIを使用するプラ...

人工知能

ベイリー・カクスマー、ウォータールー大学の博士課程候補 - インタビューシリーズ

カツマー・ベイリーは、ウォータールー大学のコンピュータ科学学部の博士課程の候補者であり、アルバータ大学の新入教員です...

人工知能

「Ntropyの共同創設者兼CEO、ナレ・ヴァルダニアンについて - インタビューシリーズ」

「Ntropyの共同創設者兼CEOであるナレ・ヴァルダニアンは、超人的な精度で100ミリ秒以下で金融取引を解析することを可能にす...

人工知能

「ElaiのCEO&共同創業者、Vitalii Romanchenkoについてのインタビューシリーズ」

ヴィタリー・ロマンチェンコは、ElaiのCEO兼共同創設者であり、マイク、カメラ、俳優、スタジオの必要なく、個人が一流のビデ...