「アフリカと中東で5人の生成型AIイノベーターに会おう」

Meet 5 AI innovators in Africa and the Middle East.

起業家たちは、西アフリカの西海岸からアラビア砂漠の東端まで、生成的AIを育てています。

Gen AIは、コーヒ・ゲンフィとニー・オサエが15年前にガーナの首都アクラで高校で出会って以来、孵化し続けている大きな計画の最新バージョンです。

「私たちはここ数年、最新のAIの波を見てきました」とオサエは言います。彼は大学で機械学習に情熱を抱き、ソフトウェアエンジニアとなりました。

スタートアップMazzumaのニー・オサエ(左)とコーヒ・ゲンフィ

そこで、昨年末、彼らは既に1億5,000万ドル以上の取引を処理しているモバイル決済スタートアップのMazzumaを拡大し、MazzumaGPTを追加しました。

この大型言語モデル(LLM)は、2つの人気のあるブロックチェーン言語でトレーニングされており、開発者が迅速にスマートコントラクトの草案を作成するのに役立ちます。国際データ企業が来年には190億ドルに達すると予測しているWeb3市場です。

数千のヒット

LLMの初月には、1750億のパラメータを持つモデルが70か国から400人の開発者によって使用されました。パラメータはモデルのサイズと強度の目安です。

これは、2018年にアフリカのトップ30の起業家のリストに入った二人にとって最新の成功です。

「成長率が高く、人口が多いため、この地域には大きな機会があります」とゲンフィは言います。彼は19歳の時に最初の会社を始めました。それはAppleデバイスの転売業でした。

オサエは、ガーナAI協会の創設者兼会長としてその可能性を育てています。「私たちは他の地域よりも進歩を飛び越える軌道に乗っていると思います」と彼は言います。

LLMはアラビア語を話す

約2年前、北東に6,000マイル離れた場所で、もう一組の起業家がドバイのペルシャ湾のエミレートで生成的AIビジネスを立ち上げました。ドバイには世界最高のビルであるブルジュ・ハリファがあります。

ヤコフ・リブシッツは、AI研究者であるエリ・ブラギンスキーが友人の家族のつながりで持ちかけたMetaDialogのアイデアを持っていました。このスタートアップは、アラビア語と英語の両方をサポートする最初のLLMを構築しました。これは世界最大のアラビア語/英語データセットの1つでトレーニングされた70億のパラメータを持っています。

「私たちはそれをBabyと呼んでいます。それに誇りを持っており、現在はさらに大きな400億パラメータのモデルを構築しています」とブラギンスキーは言います。

「私たちのBaby LLMは現在、この地域で最大の政府に統合されており、それを使用したいと考えている他の3つの政府とも話し合っています」とリブシッツは言います。

13平方マイルに3,000万人以上の人々が暮らすドバイは、地域の活気ある拠点です。

「中東の政府がAIや先進技術について考える方法は非常に大胆です。彼らは速く進みたいので、異なる言語でカスタムモデルをトレーニングし、GITEXカンファレンスでそれらを発表する予定です」とリブシッツは言います。彼はロシア、イスラエル、アメリカに住んでからドバイに移りました。

2月、サウジアラビアは国の経済を多様化するために24億ドルのスタートアップ資金を発表しました。

企業はカスタムLLMを求めています

ちょうど海岸沿いに100マイル先のアブダビでは、フセイン・アルナツシェがBeyond Limitsのエンジニアとデータサイエンティストのチームを率いて、LLMのトレーニングと微調整を行っています。そのうちの1つは既に大規模エネルギー会社の文書を起草し、その基準に準拠しているかどうかを検証しています。

Beyond Limitsは、エネルギー会社、公共事業会社、その他の顧客向けに、企業文書の索引作成や検索、マーケティング資料の起草などのモデルに取り組んでいます。

「企業は機密のデータで独自のLLMを必要としているため、私たちは彼らのデータを読むのではなく、機械が読むようにしています」とアルナツシェは言います。彼はジョーダンのアンマン出身で、Beyond Limitsに参加する前は最初のアラビア語音声アシスタントの一つであるSalmaに取り組んでいました。

データの掘削

データが新たな石油となった今、Beyond Limitsはツールキットを開発して、企業の電子メール、パワーポイントなどの非構造化ファイルからデータを抽出し、カスタムの巨大なLLMs(約700億パラメータのサイズ)を訓練することができるようにしています。

これらのツールキットは、多くのアラビア語の方言のデータサンプルの不足に対処するのに役立ちます。実際、UAE政府による100のトップジェンAIの使用例に関する報告書では、約50億人が話すアラビア語に関するさらなる研究が求められています。

良いニュースは、G42という地域のクラウドサービス会社を含む政府や大手企業がこの問題に資源を投入していることです。たとえば、Beyond Limitsは、G42からの多くの資金調達ラウンドによって、ドバイに地域本部を設立することができました。

Inceptionからの大きなサポート

これら3社は、NVIDIA Inceptionのメンバーです。これは、ジェネラティブAIなどの最先端技術に取り組むスタートアップを支援する無料のプログラムです。

Inceptionの一環として、Beyond LimitsはNVIDIA NeMoのライブラリにアクセスすることができました。これは、巨大なジェンAIモデルを構築するためのフレームワークであり、あるケースではトレーニング時間を5日から1日に短縮しました。

「NVIDIAのソフトウェアは私たちの仕事を大いに容易にし、私たちのクライアントもNVIDIAの技術を信頼しています」とAl-Natsheh氏は述べています。

Inceptionの一環として、MazzumaはクラウドGPUサービスにアクセスし、実験を加速させるための導入を受けました。

「それは本当に私たちに活力を与えてくれました。最高の人々やツールと一緒に仕事をすることからは、多くの保証があります」とGenfi氏は述べています。

パートナーへの配慮

一方、MetaDialogは、Databricksによって最近買収されたInceptionのメンバーであるMosaicMLが運営するサービスを使用して、440のNVIDIA A100 Tensor Core GPUでBaby LLMを訓練しました。

「私は多くのスタートアップを立ち上げましたが、NVIDIAほどパートナーを大切に扱う企業はありません」とLivshits氏は述べています。

上から下へ:Nii Osae、Hussein Al-Natsheh、Eli Braginskiy、Yakov Livshits、Kofi Genfi。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

JavaScriptを使用してOracleデータベース内からHugging Face AIを呼び出す方法

JavaScriptとオープンソースを使用して完全に無料でAIアーキテクチャを最適化し、SQL、JSON、またはRESTを使用して同じデータ...

機械学習

TaatikNet(ターティクネット):ヘブライ語の翻字のためのシーケンス・トゥ・シーケンス学習

この記事では、TaatikNetとseq2seqモデルの簡単な実装方法について説明していますコードとドキュメントについては、TaatikNet...

人工知能

最近の記録的な売上で.AIドメイン名の価値が急上昇しています

2023年には.aiドメイン名の取引価値が著しい増加を見ています元々、「.ai」はアンギラの国別コードトップレベルドメイン(ccT...

人工知能

無料のAI製品写真ツール

全てのビジネスオーナーの皆様へ:高額な商品写真家に二度とお金を払う必要はありません!

機械学習

ラストマイルAIは、AiConfigをリリースしました:オープンソースの構成駆動型、ソースコントロールに対応したAIアプリケーション開発フレームワーク

AIアプリケーション開発の進化する風景の中で、AI Configは、LastMile Ai から登場し、開発者がAIモデルを統合し、管理する方...

人工知能

「仕事の未来:スキルアップしないと取り残される」

AIの仕事への二重の影響、再スキル化の重要性、および労働者、企業、政府などに関連する倫理的な課題を探求してください