「生成AIの新たなフロンティア—クラウドからは遠くに」

「美容とファッションの専門家による、生き生きとした記事」

インターネットが誕生し、私たちの生活を永遠に変えました – コミュニケーション方法、ショッピング方法、ビジネスの推進方法も。そして、遅延、プライバシー、コスト効率の理由からインターネットはネットワークのエッジに移り、”物のインターネット”が生まれました。

そして今、人工知能があります。これによってインターネット上で行うすべてのことが簡単で、よりパーソナライズされ、よりインテリジェントになります。ただし、大規模なサーバーと高い計算能力が必要なため、クラウドに閉じ込められています。しかし、遅延、プライバシー、コスト効率という同じ動機が、Hailoなどの企業がAIをエッジで可能にする技術を開発する原動力になっています。

間違いなく、次の大きな進化は生成型AIです。生成型AIは、さまざまな産業分野で非常に大きな可能性を持っています。これを利用して弁護士、コンテンツライター、グラフィックデザイナー、ミュージシャンなどのクリエイターの作業を効率化することができます。また、新しい治療薬の発見や医療手術の支援に役立つこともあります。生成型AIは産業の自動化を向上させ、新しいソフトウェアコードを開発し、ビデオ、オーディオ、画像などを自動的に合成することで輸送の安全性を向上させることができます。

ただし、現在の生成型AIはその可能性を制約する技術によって制約されています。それはクラウドで行われるからです – 実際のユーザーから遠く離れた高コストでエネルギーを消費するコンピュータプロセッサの大規模なデータセンター上で処理されます。例えば、ChatGPTや他のAIベースのビデオ会議ソリューションのような生成型AIツールにプロンプトを発行すると、リクエストはインターネット経由でクラウドに送信され、結果はネットワークを通じて返されるまでサーバーで処理されます。

企業が生成型AIを新しいアプリケーションとして開発し、ビデオカメラやセキュリティシステム、産業用および個人用ロボット、ノートパソコン、さらには自動車などのさまざまなタイプのデバイスに展開すると、クラウドは帯域幅、コスト、接続性の制約となります。

ドライバーアシスト、パーソナルコンピュータソフトウェア、ビデオ会議、セキュリティなどのアプリケーションにおいて、ネットワークを介してデータを常に移動させることはプライバシーのリスクになります。

解決策は、これらのデバイスが生成型AIをエッジで処理できるようにすることです。エッジにおける生成型AIは、多くの新興アプリケーションに利益をもたらすことになります。

生成型AIの台頭

例えば、6月にはメルセデスベンツが車にChatGPTを導入すると発表しました。ChatGPTを搭載したメルセデスでは、例えば、運転手は自宅にある材料を基にして晩ご飯のレシピを車に – ハンズフリーで – 聞くことができます。ただし、車がインターネットに接続されている場合です。駐車場や離れた場所では話は別です。

ここ数年でビデオ会議は私たちの間では当たり前の存在となりました。すでにソフトウェア企業はビデオ会議ソリューションにAIの形態を統合しています。例えば、オーディオやビデオの品質を最適化したり、人々を同じ仮想空間に”配置”するためです。今、生成型AIパワーを活用したビデオ会議では、会議の議事録を自動的に作成したり、異なるトピックが議論される際にリアルタイムで会社の情報を取り込んだりすることができます。

ただし、スマートカー、ビデオ会議システム、その他のエッジデバイスがクラウドにアクセスできない場合、生成型AI体験は実現できません。しかし、もし彼らがクラウドAIの巨大な処理を考慮しなければならない場合も可能です。

エッジにおける生成型AI

すでに生成型AIツールで、例えば、豊かで魅力的なPowerPointプレゼンテーションを自動的に作成することができます。ただし、ユーザーはどこからでもシステムを利用できるようにする必要があります。インターネットに接続されていなくても利用できるようにする必要があります。

同様に、私たちはすでに新しいタイプの生成型AIベースの”共同パイロット”アシスタントを見ています。これにより、日常の仕事、報告書の作成、データの視覚化などの多くのルーチンタスクが自動化され、コンピューティングデバイスとのインタラクション方法が根本的に変わります。例えば、ラップトップを開くと、カメラを通じてユーザーを認識し、Outlook、Teams、Slack、Trelloなどのよく使うツールを基に、日/週/月の行動計画を自動的に生成することができます。ただし、データのプライバシーと良好なユーザーエクスペリエンスを維持するためには、生成型AIをローカルで実行するオプションが必要です。

信頼性の低い接続やデータプライバシーの課題に対処するだけでなく、エッジAIは帯域幅の需要を減らし、アプリケーションのパフォーマンスを向上させるのに役立ちます。例えば、生成型AIアプリケーションがクラウドを介して仮想会議空間などのデータ豊かなコンテンツを作成する場合、利用可能な(そして高コストな)帯域幅に応じて処理が遅れる可能性があります。また、セキュリティ、ロボット工学、医療などの一部の生成型AIアプリケーションは、クラウド接続では処理できない、高性能で低遅延の応答を必要とします。

ビデオセキュリティでは、ネットワークが到達できない場所に配置されたカメラの間を移動する人々を再識別する能力は、データモデルとAI処理を実際のカメラに必要とします。この場合、ジェネレーティブAIは、シンプルなクエリ「赤いTシャツと野球帽をかぶった8歳の子供を見つける」というクエリを介してカメラが見たものの自動化された説明に適用できます。

それがエッジでのジェネレーティブAIです。

エッジAIの進展

新しいAIプロセッサの採用と、より効率的でありながら、パワフルなジェネレーティブAIデータモデルの開発により、エッジデバイスはクラウド接続が不可能または望ましくない場所で賢く動作するように設計することができます。

もちろん、クラウド処理はジェネレーティブAIの重要なコンポーネントとして残ります。たとえば、AIモデルのトレーニングはクラウドで行われますが、ユーザーの入力をこれらのモデルに適用するアクション、つまり推論は、エッジで行うことができますし、多くの場合はそうすべきです。

産業界では既に、エッジデバイスにロードできるより効率的なAIモデルが開発されています。Hailoなどの企業は、ニューラルネットワーク処理を行うために特別に設計されたAIプロセッサを製造しています。このようなニューラルネットワークプロセッサはAIモデルを驚くほど迅速に処理するだけでなく、より少ない電力で処理を行うためエネルギー効率が高く、スマートフォンからカメラまでさまざまなエッジデバイスに適しています。

エッジでのジェネレーティブAIの処理は、成長するワークロードの負荷を効果的に分散させ、アプリケーションをより安定してスケーリングし、クラウドデータセンターを高コストな処理から解放し、環境に優しくすることも可能です。

ジェネレーティブAIは再びコンピューティングを変える準備が整っています。将来的には、LaptopのLLMは今日のOSと同じように自動更新され、同じように機能するかもしれません。しかし、そこに到達するために、ネットワークのエッジでのジェネレーティブAIの処理を可能にする必要があります。その結果、パフォーマンス、エネルギー効率、プライバシーとセキュリティが向上するAIアプリケーションが実現されるでしょう。これらはすべて、ジェネレーティブAI自体と同様に世界を変えるAIアプリケーションにつながるのです。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

黄さんの法則に留意する:エンジニアたちがどのように速度向上を進めているかを示すビデオ

話の中で、NVIDIAのチーフサイエンティストであるビル・ダリー氏が、モーアの法則時代後のコンピュータパフォーマンスの提供...