光ベースのコンピューティング革命:強化された光ニューラルネットワークでChatGPTタイプの機械学習プログラムを動かす
光ベースのコンピューティング革命:光ニューラルネットワークでChatGPTタイプの機械学習プログラムを動かす
ChatGPTのいくつかの単純な問いに対して洗練されたエッセイ、メール、およびコードを生成する能力は、国際的な注目を集めています。MITの研究者たちは、ChatGPTの責任者よりもはるかに能力のある機械学習プログラムの道を開く可能性のある方法を報告しています。さらに、彼らの技術は、現在の最先端のスーパーコンピュータよりも少ないエネルギーを消費するかもしれません。
チームは、新しいシステムの最初の実験的デモンストレーションを報告しています。このシステムは、光の動きに基づいて計算を行うために数百のマイクロンスケールレーザーを使用しています。この新しいシステムは、現在の最先端のデジタルコンピュータよりもエネルギー効率が100倍以上高く、計算密度も25倍以上高くなっています。
さらに、彼らは「将来の改善のためにはさらに数桁の改善が必要」と指摘しています。これにより、科学者たちは「データセンターから分散型エッジデバイスまでの機械学習タスクを加速するための大規模な光電子プロセッサへの道を開く」と述べています。将来的には、携帯電話のような小さなデバイスでも、巨大なデータセンターでしか計算できないプログラムを実行することができるかもしれません。
- 「Advanced Reasoning Benchmark(ARB)に会いましょう:大規模な言語モデルを評価するための新しいベンチマーク」
- 「FACTOOLにご紹介いたします:大規模言語モデル(例:ChatGPT)によって生成されたテキストの事実エラーを検出するためのタスクとドメインに依存しないフレームワーク」
- LGBMClassifier 入門ガイド
脳の情報処理を模倣する大規模な機械学習モデルは、ChatGPTのような深層ニューラルネットワーク(DNN)の基礎です。機械学習が拡大する一方で、現在のDNNを駆動するデジタル技術は停滞しています。また、そのエネルギー需要が極めて高いため、これらのDNNは非常に大きなデータセンターにしか存在しません。これがコンピューティングアーキテクチャのイノベーションを推進しています。
データサイエンスの分野は、深層ニューラルネットワーク(DNN)の台頭により進化しています。従来のコンピュータハードウェアの能力を超えるこれらのDNNの指数関数的な拡大に対応するため、光ニューラルネットワーク(ONN)が最近進化して、高いクロックレート、並列処理、および最小のデータ損失でDNNタスクを実行するようになりました。低い電光変換効率、巨大なデバイスのフットプリント、およびチャネルのクロストークは、ONNの計算密度を低下させますが、インライン非線形性の欠如は大きな遅延を引き起こします。研究者は、これらの課題すべてを一度に解決するための空間-時間-多重化ONNシステムの実験的な実証を行いました。彼らは、大量に製造され、優れた電光変換特性を示す垂直共振器面射出レーザー(VCSEL)のマイクロメートルスケールのアレイを使用してニューロンエンコーディングを行っています。
研究者は、これらの3つの問題を一度に解決する小さな設計を初めて提供しています。現代のLiDARリモートセンシングとレーザープリンティングは、このアーキテクチャに基づいており、垂直面射出レーザー(VCSEL)アレイ上に構築されています。これらの措置は、将来的には2桁の改善となる可能性があります。光電子プロセッサは、集中化および分散型のインフラストラクチャ全体で機械学習プロセスの高速化に新たな機会を提供します。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles