AIによる光通信の加速化

Accelerating Optical Communication with AI

クレジット:Shutterstock.com

光コンピューティングは、人工知能(AI)の歴史と同様に、研究のブレークスルーや長期間の研究中断を経験してきました。現在、AIの復活に伴い、今日の大規模なニューラルネットワークモデルが電子コンピュータ上で実行される際に必要な膨大なエネルギー量が、光と電子の統合に再び関心を呼び起こしています。

30年以上前、人工ニューラルネットワークの研究ブームの1つで、デメトリ・サルティスとカリフォルニア工科大学の同僚たちは、ホログラフィーの技術が初歩的な顔認識を行うことができることを実証しました。チームメンバーは、液晶ディスプレイの主要な要素を使用して2層ニューラルネットワークの1つの重みを最大10億個まで格納できることを示しました。同様の空間光変調器は、英国のスタートアップOptalysysによる光コンピューティング技術の商業化の試みの基礎となり、最近では安全なリモートコンピューティングをサポートするためにホモモーフィック暗号化を加速することに焦点を当てています。

一部のグループはAIに空間光変調器を使用していますが、これはAIに適した光コンピュータのカテゴリーの1つに過ぎません。光コンピュータに最適なニューラルネットワークの形式についての意見は分かれています。一部の技術は、主流のディープラーニングパイプラインの行列演算に焦点を当てており、他の技術は生物学的な脳のスパイクトレインをエミュレートすることに重点を置いています。

提案されているすべてのシステムが共通して持つのは、光を使用して通信と計算を行うことで、純粋に電気信号に基づくシステムに比べて、密度と速度の面で主要な利点をもたらす可能性があることです。プリンストン大学のMitchell Nahmias氏(現在はスタートアップLuminous ComputingのCTO)と同僚たちによる2021年の行列演算に基づく推論の研究によると、光学ドメインでのAI推論の理論的効率は、既存の電子アーキテクチャに基づく従来のアクセラレータよりもはるかに高い可能性があると主張しています。

機械学習にとっての主要な問題は、アクセラレータ内でデータを移動するために必要なエネルギー量です。電子アクセラレータでは、モデルの構造に応じて一時的な結果または重みがキャッシュに保持されるかどうかに関する大きなトレードオフがあり、できるだけ多くのデータをキャッシュに格納して、このオーバーヘッドを減らす戦略が採用されています。ただし、1つのチップの範囲よりも大きな距離に光子を配信するエネルギーコストは、電気信号の場合よりもはるかに低くなります。

光コンピューティングの2番目の潜在的な利点は、アナログドメインで複雑な操作を処理できることですが、ここで実現できる省電力化の効果は通信に比べて不確実です。行列演算は、従来のシステムで性能を発揮するために高度に並列化されたハードウェア回路に焦点を当てていますが、Mach-Zehnder干渉計(MZi)やマイクロリング共振器などの光学部品を通過するだけで、デジタル回路の数百から数千の論理ゲートが必要な演算を実行できます。

MZiでは、光の同期ビームがカプラーと位相シフタの連続を通過します。各カップリングポイントでは、ビーム間の干渉により、行列乗算の一部として解釈できる位相シフトが生じます。4×4行列演算には、4つの入力が6つのカップリング要素に送られ、4つの出力ポートが結果を提供します。操作の速度は、単に一定のレートで連続したパルスを配信できる速度に制限されます。

アナログアーキテクチャでは、ノイズが重要な障害となります。推論操作の加速に関する多数のグループの研究により、深層ニューラルネットワークは効果的な解像度4ビットで正常に動作することが示されましたが、解像度が上がるにつれてハードウェアオーバーヘッドとエネルギーが急速に上昇します。これらの効果により、光学デザインの実用的なエネルギー利点が制限される可能性があります。

クイーンズ大学の助教授Alexander Taitによる試算によると、2020年代初頭の技術を使用して、完全に接続されたレイアウトで500個のマイクロリング共振器が1cm2のダイに収まる可能性があるということです。しかし、10GHzで動作する場合、キロワットの電力が必要になります。Taitは、現在の光学特性を調整するためにヒーターが必要なことの影響を示す例を強調し、スケーリングと設計変更によりエネルギーを大幅に削減できると述べています。「ヒーターは確かに解決可能な問題です」と彼は述べています。

1つの可能性は、書き換え可能なDVDや不揮発性メモリで使用される相変化材料を使用することです。これらの材料は、急速な加熱後にどのように急速に冷却されるかに基づいて、その電気光学特性に変化が生じます。ただし、定常的な加熱が必要ではないため、信頼性が確保できれば、より低エネルギーの光学コンピュータを実現できる可能性があります。

「もし低エネルギーのフェーズシフターを持っていれば、集積型フォトニクスでできることはたくさんあります」と、メリーランド大学の材料科学・工学教授のカルロス・リオス・オカンポは語ります。

しかし、材料の適用方法には違いがあります。Tait氏は、MZiとマイクロリング乗算器のエネルギーが現在は似ていることを指摘していますが、MZiデバイスに必要なチューニングがダイナミックであるため、位相変化材料の不揮発性はマイクロリングほどの利益をもたらさないと述べています。

「もし低エネルギーのフェーズシフターを持っていれば、集積型フォトニクスでできることはたくさんあります」とは。

光処理を支持する要因の1つは、フォトニック処理の高帯域幅と高速性が、電子処理のレベルとは比較にならないため、統合が必要なレベルにないことです。

「指標は計算密度です。フォトニクスでベクトルまたは行列演算を行う場合、高速度を活用してハードウェアを再帰的に使用できるため、密集したコアデバイスは必要ありません」と、クイーンズ大学の助教授であるBhavin Shastriは述べています。

フォトニックニューラルネットワークの潜在的な問題の1つは、AIアルゴリズムに非線形振る舞いが必要であることです。ほとんどの従来のフォトニックコンポーネントは完全に線形的に機能し、線形的および非線形的領域で操作できるトランジスタの柔軟性に欠けています。

「非線形相互作用は非常に困難になります。非線形性を高めるために新しい材料が必要か、光-電子-光変換に移行する必要があり、非常に効率的に行われなければなりません」とShastri氏は述べています。現在、光-電変換の遅延により、フォトニックAIの理論的なスループットの利点が低下しています。

リオス・オカンポは、必要なシリコンフォトニクスチップを構築できる半導体ファブリケータが、大規模な市場ドライバがない限り新しい材料をプロセスに導入することをためらっていると指摘しています。フォトニックコンピューティングは、必要な需要をまだ提供していません。半導体企業が電子相変化メモリに何十年も取り組んできた経験が、これらのシステムで役立つ光非揮発性メモリやその他のコンポーネントの開発を支援することができますが、ほとんどの焦点は光を吸収する化合物にあります。位相のみを操作することができる透明材料は、半導体ファブリケーション装置との互換性のテストがさらに必要です。

フォトニックAIが進化の初期段階にあるにもかかわらず、いくつかのスタートアップ企業が商用フォトニックアクセラレータの構築計画に乗り出しており、これまでに主にネットワーキングおよび通信セクターのニーズに応えてシリコンフォトニクスの改良を活用しています。通信スループットはAI界でも重点的に研究されています。スタートアップ企業の中でも、Lightmatterはフォトニックアクセラレータと電子モジュール間の通信速度を向上させるために使用できる光学的インターコネクト技術の両方に取り組んでいます。

Luminous Computingはもともと独自のフォトニックAIシステムを構築する予定でしたが、同社は、独自の設計によるフォトニックインターコネクトをサポートする電子アクセラレータに焦点を合わせることにしました。

Luminousの社長であるマイケル・ホッチバーグは、フォトニックコアのオプションを調査した結果、「劇的な改善を阻んでいたボトルネックがシステムの他の部分にあることが分かりました」と述べています。

光学的専用ルーターに関する研究が行われた1990年代後半のドライバーは、データをフォトニックドメインに保持し、電気光学およびデジタルアナログ変換の影響を受けずにラインスピードでパケットを誘導することが簡単であるという信念でした。センサー出力をアナログ-デジタル変換せずに直接取り込み、保存されたデータで作業するデータセンターシステムとは対照的に、多数の可能なアプリケーションがあります。

Shastri氏は、アナログフォトニック処理を使用してラジオ送信を分離する最近の研究に言及しています。「これはカクテルパーティの問題の形式です。混雑した無線周波数スペクトルで、1つの信号を見つけてフォーカスし、それを処理するための知的な方法を使用する必要があります。フィルタリングだけでは使えません。電子の帯域幅は狭く、チャンネルまたはアンテナの数に応じてエネルギーのスケーリングが二乗になることがあります。私たちは非常に広い帯域幅で処理できることを示し、エネルギーは線形にスケールします」と述べています。

「データセンターに完全にオフロードできないタスクがある。そのタスクとは何か?」

もう1つの潜在的な応用は、高速移動する航空機(超音速飛行機など)の最適化タスク、予測制御、および安定化にあります。 「解決策に素早く収束する必要がある場合、フォトニクスには優位性がある可能性があります。」

多くが費用対効果の高い方法で複数の技術を統合する能力にかかっていますが、成長するアプリケーションの範囲でのデータインテリジェンスへの巨大な需要は、フォトニックコンピューティングにR&Dの冬を回避するために必要な条件を提供するかもしれません。

参考文献

Huang, C. et al. 「Prospects and Applications of Photonic Neural Networks Advances in Physics : X, 7:1, 1981155 (2021)」

Nahmias, M.A, Ferreira de Lima, T., Tait, A.N., Peng, H.-T., Shastri, B.J, and Prucnal, P.R. 「Photonic Multiply-Accumulate Operations for Neural Networks IEEE Journal of Selected Topics in Quantum Electronics , Volume 26, Issue 1 (2020)」

Ríos Ocampo, C.A. et al. 「Ultra-Compact Nonvolatile Photonics Based on Electrically Reprogrammable Transparent Phase-Change Materials PhotoniX, 3:26 (2022)」

Tait, A.N. 「Quantifying Power in Silicon Photonic Neural Networks Physical Review Applied 17 , 054029 (2022)」

トップへ戻る

著者

Chris Edwardsは、電子、IT、および合成生物学について報告する英国サリー州を拠点とするライターです。

©2023 ACM  0001-0782/23/7

個人または教室での使用のために、この作品の一部または全部のデジタルまたは印刷物の複製を作成したり配布したりする権利が無料で付与されます。ただし、複製を利益または商業的利益のために作成または配布しないでください。また、複製物にはこの通知と最初のページに完全な引用が含まれている必要があります。ACM以外の所有者が所有するこの作品のコンポーネントの著作権は尊重される必要があります。クレジットを付けて要約することは許可されています。 それ以外の場合は、許可と/または料金が必要です。[email protected] または(212)869-0481から許可を取得して公開すること、サーバーに投稿すること、リストに再配布することは、事前に具体的な許可と/または料金が必要です。

デジタルライブラリは、Association for Computing Machineryによって出版されています。著作権 © 2023 ACM、Inc。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more