「アフリカと中東で5人の生成型AIイノベーターに会おう」

Meet 5 AI innovators in Africa and the Middle East.

起業家たちは、西アフリカの西海岸からアラビア砂漠の東端まで、生成的AIを育てています。

Gen AIは、コーヒ・ゲンフィとニー・オサエが15年前にガーナの首都アクラで高校で出会って以来、孵化し続けている大きな計画の最新バージョンです。

「私たちはここ数年、最新のAIの波を見てきました」とオサエは言います。彼は大学で機械学習に情熱を抱き、ソフトウェアエンジニアとなりました。

スタートアップMazzumaのニー・オサエ(左)とコーヒ・ゲンフィ

そこで、昨年末、彼らは既に1億5,000万ドル以上の取引を処理しているモバイル決済スタートアップのMazzumaを拡大し、MazzumaGPTを追加しました。

この大型言語モデル(LLM)は、2つの人気のあるブロックチェーン言語でトレーニングされており、開発者が迅速にスマートコントラクトの草案を作成するのに役立ちます。国際データ企業が来年には190億ドルに達すると予測しているWeb3市場です。

数千のヒット

LLMの初月には、1750億のパラメータを持つモデルが70か国から400人の開発者によって使用されました。パラメータはモデルのサイズと強度の目安です。

これは、2018年にアフリカのトップ30の起業家のリストに入った二人にとって最新の成功です。

「成長率が高く、人口が多いため、この地域には大きな機会があります」とゲンフィは言います。彼は19歳の時に最初の会社を始めました。それはAppleデバイスの転売業でした。

オサエは、ガーナAI協会の創設者兼会長としてその可能性を育てています。「私たちは他の地域よりも進歩を飛び越える軌道に乗っていると思います」と彼は言います。

LLMはアラビア語を話す

約2年前、北東に6,000マイル離れた場所で、もう一組の起業家がドバイのペルシャ湾のエミレートで生成的AIビジネスを立ち上げました。ドバイには世界最高のビルであるブルジュ・ハリファがあります。

ヤコフ・リブシッツは、AI研究者であるエリ・ブラギンスキーが友人の家族のつながりで持ちかけたMetaDialogのアイデアを持っていました。このスタートアップは、アラビア語と英語の両方をサポートする最初のLLMを構築しました。これは世界最大のアラビア語/英語データセットの1つでトレーニングされた70億のパラメータを持っています。

「私たちはそれをBabyと呼んでいます。それに誇りを持っており、現在はさらに大きな400億パラメータのモデルを構築しています」とブラギンスキーは言います。

「私たちのBaby LLMは現在、この地域で最大の政府に統合されており、それを使用したいと考えている他の3つの政府とも話し合っています」とリブシッツは言います。

13平方マイルに3,000万人以上の人々が暮らすドバイは、地域の活気ある拠点です。

「中東の政府がAIや先進技術について考える方法は非常に大胆です。彼らは速く進みたいので、異なる言語でカスタムモデルをトレーニングし、GITEXカンファレンスでそれらを発表する予定です」とリブシッツは言います。彼はロシア、イスラエル、アメリカに住んでからドバイに移りました。

2月、サウジアラビアは国の経済を多様化するために24億ドルのスタートアップ資金を発表しました。

企業はカスタムLLMを求めています

ちょうど海岸沿いに100マイル先のアブダビでは、フセイン・アルナツシェがBeyond Limitsのエンジニアとデータサイエンティストのチームを率いて、LLMのトレーニングと微調整を行っています。そのうちの1つは既に大規模エネルギー会社の文書を起草し、その基準に準拠しているかどうかを検証しています。

Beyond Limitsは、エネルギー会社、公共事業会社、その他の顧客向けに、企業文書の索引作成や検索、マーケティング資料の起草などのモデルに取り組んでいます。

「企業は機密のデータで独自のLLMを必要としているため、私たちは彼らのデータを読むのではなく、機械が読むようにしています」とアルナツシェは言います。彼はジョーダンのアンマン出身で、Beyond Limitsに参加する前は最初のアラビア語音声アシスタントの一つであるSalmaに取り組んでいました。

データの掘削

データが新たな石油となった今、Beyond Limitsはツールキットを開発して、企業の電子メール、パワーポイントなどの非構造化ファイルからデータを抽出し、カスタムの巨大なLLMs(約700億パラメータのサイズ)を訓練することができるようにしています。

これらのツールキットは、多くのアラビア語の方言のデータサンプルの不足に対処するのに役立ちます。実際、UAE政府による100のトップジェンAIの使用例に関する報告書では、約50億人が話すアラビア語に関するさらなる研究が求められています。

良いニュースは、G42という地域のクラウドサービス会社を含む政府や大手企業がこの問題に資源を投入していることです。たとえば、Beyond Limitsは、G42からの多くの資金調達ラウンドによって、ドバイに地域本部を設立することができました。

Inceptionからの大きなサポート

これら3社は、NVIDIA Inceptionのメンバーです。これは、ジェネラティブAIなどの最先端技術に取り組むスタートアップを支援する無料のプログラムです。

Inceptionの一環として、Beyond LimitsはNVIDIA NeMoのライブラリにアクセスすることができました。これは、巨大なジェンAIモデルを構築するためのフレームワークであり、あるケースではトレーニング時間を5日から1日に短縮しました。

「NVIDIAのソフトウェアは私たちの仕事を大いに容易にし、私たちのクライアントもNVIDIAの技術を信頼しています」とAl-Natsheh氏は述べています。

Inceptionの一環として、MazzumaはクラウドGPUサービスにアクセスし、実験を加速させるための導入を受けました。

「それは本当に私たちに活力を与えてくれました。最高の人々やツールと一緒に仕事をすることからは、多くの保証があります」とGenfi氏は述べています。

パートナーへの配慮

一方、MetaDialogは、Databricksによって最近買収されたInceptionのメンバーであるMosaicMLが運営するサービスを使用して、440のNVIDIA A100 Tensor Core GPUでBaby LLMを訓練しました。

「私は多くのスタートアップを立ち上げましたが、NVIDIAほどパートナーを大切に扱う企業はありません」とLivshits氏は述べています。

上から下へ:Nii Osae、Hussein Al-Natsheh、Eli Braginskiy、Yakov Livshits、Kofi Genfi。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

「ビジョン・トランスフォーマーの内部機能」

ビジョン・トランスフォーマー(ViTs)の内部動作を視覚化する際、研究者たちはランダムな背景パッチに注目の奇妙なスパイク...

データサイエンス

『FastSpeech:論文の概要と実装』

2019年、FastSpeechはニューラルテキスト音声変換のフロンティアを推し進め、推論速度を大幅に改善しながら、単語の繰り返し...

データサイエンス

「関係深層学習ベンチマーク(RelBench)に出会ってください:関係データベース上の機械学習のためのリアルな、大規模で多様なベンチマークデータセットのコレクション」

人工知能(AI)と機械学習(ML)の急速な進歩の分野において、効果的で自動化され、適応性のある手法を見つけることは非常に...

AI研究

CMUとUCサンタバーバラの研究者は、心理療法における認知の歪み検出のための革新的なAIベースの「思考の診断」を提案しています

世界中で、約8人に1人が精神の問題を抱えています。しかし、精神保健障害は、心の専門家の不足、劣悪な治療法、高額な費用、...

AIニュース

「イーロン・マスクのxAIはTwitterのフィードでトレーニングされました」

テスラやSpaceXなどの企業を展開するビジョナリーであるイーロン・マスクは、人工知能(AI)の領域に再び目を向けています。...

機械学習

「Java での AI:Spring Boot と LangChain を使用して ChatGPT のクローンを構築する」

「Spring Boot、LangChain、Hillaを使用してJavaでChatGPTのクローンを作成する方法を学びましょう同期チャットの補完と高度...