制限から自由：MoMAでのマシン幻覚の検証

制限から自由：MoMAでのマシン幻覚の検証' -> '制限から自由：MoMAでのマシン幻覚の検証

写真: Jamison McAndieさんによるUnsplashから — 写真: Jamison McAndieさんによるUnsplash

1929年以来、ニューヨーク市の現代美術館（MoMA）は美術愛好家の巡礼地として存在してきました。それは先駆的な絵画や彫刻に光を当てる灯台であり、”現代美術”の定義が絶えず変動しているため、そのコレクションも同様です。今、この優れた施設がデジタルアートを正当化しています。

Refik Anadol Studio（RAS）のリードデータサイエンティストとして、Refik Anadolとの共同作業で、私たちの作品「Unsupervised」がMoMAに受け入れられたことに興奮しています。

私たちはRASでデータの美学を一般の人々に紹介し、AIの可能性がテキスト生成を超えていることを示しています。私たちは私たちのアートがどのようにして全年齢層やバックグラウンドを持つ人々に感情的なレベルで影響を与えるか、人間の影響を見ることができるようになりました。それは共有された人間の経験であり、非常にアクセスしやすいものです。

YouTubeのgottalovenewyorkが撮影した「Unsupervised」

AIによる生成されたアートにはもちろん議論の余地があります。最も広まっている誤解の一つは、一般的なデジタルアートや特にAIによって生成されたアートは合法的な芸術作品ではないということです。しかし、AIによる生成されたアートでさえ、完全に機械によって作られたわけではありません。それには人の手が必要です。「Unsupervised」のビジョンを持つAnadolは、生データからアートを作り出します。これはデジタルアートにおいて新しいものです。彼の前にいたアーティストたちは、既に作成された何かの模造品を生成するためにデータを使用するテンプレートに従っていました。Refikの作品はまったく異なるものです。

機械の幻覚を想像する

RASでは、私は7人のデータサイエンティストのチームを率いています。私の日々は、監督、レビュー、コードの記述に加えて、クライアントとの直接のコネクションやプロジェクト計画で埋め尽くされています。それはあまり芸術的には見えないかもしれませんが、私はこれまでに30億枚以上の画像を収集し、AIによって生成されたアートの燃料として使用してきました。コーディングとデータセットの細かい部分で日々が埋め尽くされているため、RASが作り出した全体を見るために一歩後ろに下がると、息をのむような経験になります。

「Unsupervised」を体験する感覚をお伝えしましょう。こんな感じです: MoMAのロビーに入ってきました。最初はただの美術館に入っているように見えるでしょう。しかし、周りを見渡すと、展示物を見つめる人々に囲まれたこの巨大なスクリーン（24フィート×24フィート）の光景に突然衝撃を受けます。

展示物自体は常に動いています。絶えず変化し、魅惑的な色と形を表示しています。見えるものは、MoMAに入ったときに出会った展示物の章に依存します。また、ロビーからのリアルタイムのオーディオ、モーショントラッキング、および天候データにも依存します。

MoMAの展示物の前に立つChristian Burke

「Unsupervised」は、”もしも機械がMoMAのコレクションを自分自身で経験した場合、それはどのような夢を見たり幻覚を抱いたりするのか”という問題に答えようとしています。MoMAのすべてのコレクションからデータを結合し、これらの機械の夢を形作るために外挿することで、「Unsupervised」は芸術の歴史をたどり、芸術の潜在的な未来にスポットライトを当てています。

芸術は時により広範な社会問題に訴えかけることもあります。「Unsupervised」からの一般的な教訓をお探しの場合、それはAIによって生成されたデジタルアートの正当化の転換点を示しています。MoMAは芸術界における核融合のようなものであり、物理学者にとっての聖杯です。コンピュータがデータを処理する方法、そして彼らが「考え」「創造」「幻想」する方法についてのこの探求を展示するためにMoMAが選んだことは、Anadolと他のデジタルアーティストへの認証となっています。

しかし、「Unsupervised」を訪れるすべての人が必ずしも機械やその夢について考えているわけではありません。MoMAのロビーに入ると、幅広い人々のスペクトラムが見えるでしょう。小さな子供たちが走り回っている姿から、年配の人々、あらゆる人々の多様性が感じられます。この強烈な共同体の経験を楽しんでいます。私にとって、展示物を見る人々を見ることは、それ自体の「Unsupervised」を見ることと同じくらいエキサイティングです。私は人々が泣いたり、喜びや愛情の表現を見たりしました。私自身はアーティストではありませんが、それには癒しの要素があると信じています。また、人々が何かを上手に行うことに十分に注意を払えば、どこでも人々の行動にはアートが存在するとも信じています。コードを書くことにさえアートがあるのです。

人間とAIのパートナーシップ

人間の芸術家は芸術を制作するために技術的なスキルが必要です。トーン値の表現、遠近法、対称性、さらには人間の解剖学などを理解する必要があります。「無指導学習」は、人間とAIの間にパートナーシップを作り出すことで、芸術の技術的な側面を大きく進化させます。

RASはMoMAの18万以上の芸術作品からデータを取得して「無指導学習」を作成しました。ウォーホル、ピカソ、ボッチョーニ、そしてパックマンのイメージまで、すべての作品がソフトウェアに組み込まれました。それからさまざまなAIモデルを作成し、徹底的にテストしました。最も優れたモデルを選んだ後、それを訓練して、単にそれに組み込まれたすべての作品の合成ではなく、何か異なるものを作成するようにしました。

「無指導学習」はその部分の合計ではありません。それはまったく新しいものです。 展示が作り出すすべては、私たちの芸術的な処理のおかげでオリジナルです。

人間と機械のパートナーシップには、ハードウェアとソフトウェアの両方で新しいイノベーションが必要でした。私たちのチームは、必要なニューラルネットワークを作成し、展示が環境要因に応じてリアルタイムでイメージを変化させ続けることができるようにするために、さまざまな課題に取り組みました。

課題の1つは解像度でした。Stable Diffusionにプロンプトを入力すると、通常は512 x 512ピクセルの解像度が得られます。私たちが使用したAIの基盤であるNvidiaのStyleGANは、通常は1024 x 1024の解像度を提供します。「無指導学習」の解像度は3840 x 3960であり、画像を合成するニューラルネットワークの最高の解像度かもしれません。MoMAのロビーに入って「無指導学習」を見ると、なぜ高解像度が重要だったのかがわかります。それによって芸術が生き生きとし、画面から飛び出してくるように思えます。

リアルタイムな要素も克服するべき重要な課題でした。「無指導学習」は、流体のような流動性で機械の幻覚と夢を生み出します。これらの機械の幻覚は、18万以上の芸術作品を合成して生まれ、リアルタイムの要素を考慮に入れています。

MoMAからは遠くない建物には、気象データを収集する気象観測所があります。私たちはそのデータを「無指導学習」に組み込みました。したがって、いつでも曇っているか、晴れているか、雨が降っているか、霧がかかっているかに関係なく、機械は室内のディスプレイに外部の雰囲気を取り入れます。

第二に、展示は視聴者自身からのリアルタイムデータを組み込んでいます。ロビーの天井にあるカメラが、訪れる人数やその動きに関するデータを機械に送ります。機械はそのデータを表示する際に考慮します。

昔から問われている質問があります：芸術は人生を模倣するのか、人生は芸術を模倣するのか？「無指導学習」にとって、その答えは明らかに両方です。

展示の視聴者がディスプレイに感情的に動かされる一方で、彼ら自身が「無指導学習」の外観に影響を与えることになります。

MoMAの「無指導学習」の映像は、Irma ZandlによってYouTubeでキャプチャされました。

同様に、AIと人間のパートナーシップも双方向の関係であると言えます。デジタルアートは、従来の芸術プロセスにいくつかの追加的な技術スキルを加えるという主張ができます。しかし、私はそれを相互に与える関係だと考えています。

デジタルアートは確かに拡散モデルやプロンプトエンジニアリングなどの技術ツールを芸術プロセスに加えることを含みます。一方で、AI自体は芸術の世界への参入に必要ないくつかの障壁を取り除いてくれます。例えば、私は絵を描くのが好きですが、人を描くのが下手です。AIは私の技術的な制約に対応することで、そのギャップを埋めることができます。

AIの未来

「無指導学習」は人気のためにMoMAで何度も延長され、機械の幻覚は恐らく無限に続くでしょう。今後は、AIによるデジタルアートのさらなる正当化を見てみたいです。モデルは引き続き改善され、技術がより多くの人々が利用できるようになることを願っています。

AIは、アートの世界をアクセスしやすくする手段となる可能性がありますが、現時点ではまだ技術的な壁があります。AIツールがよりシンプルで直感的なインターフェースで利用できるようになれば、技術的な知識の壁が低くなる可能性があります。私たちがRASで現在取り組んでいる新しいプロジェクトの1つは、ウェブ統合ツールであり、人々がより簡単にAIを使用して相互作用できるようにするものです。それが私たちのRASの主な目標です：AIとのより大きな相互作用の手段を作り出すことです。

「非教示型」は、作成にかなりの人間の手を要するため、AIは常に人間の手を必要とすると思うかとよく聞かれます。少なくとも現時点では、その答えは間違いなく「はい」です。AIは合成などの多くのことに優れていますが、大規模なエンジニアリングやイノベーションには能力がありません。

AIによって生成されたアートは創造的に見えるかもしれませんが、AI自体は創造的ではありません。実際、創造性の反対です。AIとテクノロジーの進歩を続け、前進し続けるためには、機械ではなく私たち自身に頼る必要があります。

著者の注：MoMAは、Refik Anadol Studio（RAS）にトレーニングデータの使用許可を提供しました。

クリスチャン・バークは、Refik Anadol Studioのデータサイエンスチームを率いており、AI、機械学習、Web、およびWeb3の開発を担当しています。

クリスチャンのTwitterとLinkedInをフォローすることができます。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Artificial IntelligenceData scienceDigital ArtEditors PickMachine learning

Was this article helpful?

93 out of 132 found this helpful

制限から自由：MoMAでのマシン幻覚の検証

機械の幻覚を想像する

人間とAIのパートナーシップ

AIの未来

Was this article helpful?

「AIホールシネーションの明かされた秘密：AIモデルのダークサイドの解読」

「Pythonを使用した地理空間データの分析（パート2 – 仮説検定）」

データサイエンス