「生成AIの余波におけるオープンソースAIの戦い」

Battle of Open Source AI in the aftermath of Generative AI

オープンソースAIは、AIモデルとツールを組織にアクセス可能にすることによって、ソフトウェアエコシステムを急速に再構築しています。これには、イノベーションの加速、品質の向上、コストの削減など、多くの利点があります。

2023年のOpenLogicレポートによると、組織の80%が昨年の77%と比べてより多くのオープンソースソフトウェアを使用して最新のイノベーションにアクセスし、開発速度を向上させ、ベンダーロックインを削減し、ライセンスコストを最小化しています。

現在のオープンソースAIの状況はまだ進化中です。Google(Meena、Bard、PaLM)、Microsoft(Turing NLG)、Amazon Web Services(Amazon Lex)などのテックジャイアントは、AIイノベーションをリリースする際にはより慎重です。しかし、Metaやその他のAIベースの研究会社など、一部の組織は積極的にAIモデルをオープンソース化しています。

さらに、オープンソースAIについては、ビッグテックに挑戦する可能性についての激しい議論があります。この記事では、オープンソースAIの潜在的な利点について詳細な分析を提供し、前途に立ちはだかる課題を強調します。

先駆的な進展-オープンソースAIの可能性

多くの実践者は、オープンソースAIの台頭をAIをより透明で柔軟で責任あるものにし、手頃な価格でアクセス可能にするポジティブな進展と考えています。しかし、OpenAIやGoogleなどのテックジャイアントは、営利、プライバシー、安全上の懸念から、モデルをオープンソース化する際は非常に慎重です。オープンソース化することで、競争上の優位性を失う可能性があり、また、データやモデルのアーキテクチャに関する機密情報を提供しなければならなくなり、悪意のある者がモデルを悪用する可能性があります。

しかし、オープンソース化によるAIモデルの最大の利点は、より迅速なイノベーションです。オープンソースの協力を通じて、多くの注目すべきAIの進展が一般の人々にアクセス可能になりました。たとえば、MetaはLLMモデルLLaMAをオープンソース化することで画期的な進展を遂げました。

研究コミュニティがLLaMAにアクセスすることで、さらなるAIのブレークスルーが促進され、AlpacaやVicunaなどの派生モデルの開発につながりました。7月には、Stability AIがLLaMAとLLaMA 2を活用してBeluga 1とBeluga 2という2つのLLMを構築し、その当時の最先端モデルと比べて、推論、ドメイン固有の質問応答、言語の微妙なニュアンスの理解など、多くの言語タスクでより優れた結果を示しました。最近、MetaはLLaMA 2をベースにしたコーディング用のオープンソースAIツールであるCode LLaMAを導入しました。

Code LLaMAのパフォーマンス比較

研究者や実践者は、LLaMAの能力を向上させて独自のモデルと競合することも行っています。たとえば、Abacus AIのGiraffeやTogether AIのLlama-2-7B-32K-Instructなどのオープンソースモデルは、32Kの長い入力コンテキストを処理する能力を備えています。これは、かつてはGPT-4などのプロプライエタリLLMにしかなかった機能です。さらに、MosaicMLのオープンソースMPT 7Bや30Bモデルなどの業界の取り組みにより、研究者は独自の生成型AIモデルをゼロからトレーニングすることができるようになりました。

全体的に、この共同の取り組みにより、AIの風景が変わり、協力と知識共有が促進され、画期的な発見が続いています。

企業におけるオープンソースAIの利点

オープンソースAIは、人工知能の分野で魅力的なアプローチとなり、多くの利点を提供しています。透明性とコミュニティ主導の協力を受け入れることで、オープンソースAIはAIソリューションの開発と展開の方法を革新する可能性を秘めています。

以下は、オープンソースAIのいくつかの利点です:

  • 迅速な開発:オープンソースAIモデルは、既存のフレームワークやアーキテクチャを活用して開発者が新しいモデルの迅速な開発とイテレーションを行うことを可能にします。堅固な基盤を持つことで、開発者は車輪の再発明なしで新しいアプリケーションを作成することができます。
  • 透明性の向上:透明性はオープンソースの重要な特徴であり、基礎となるアルゴリズムやデータの明確な見える化を提供します。この可視性により、バイアスを減少させ、公平さを促進し、より公正なAI環境を実現できます。
  • 協力の増加:オープンソースAIはAIの開発を民主化し、さまざまな専門知識を持つ多様な貢献者のコミュニティを育成することで、協力を促進します。

オープンソースは多くの利点を提供しますが、それには潜在的なリスクもあることを認識することが重要です。以下はオープンソースAIに関連するいくつかの主要な懸念点です:

  • 規制上の課題:オープンソースAIモデルの台頭により、注意深い規制が求められる潜在的なリスクが存在します。AIのアクセシビリティと民主化の拡大により、悪意のある利用の可能性についての懸念が高まっています。SiliconAngleの最近のレポートによると、一部のオープンソースAIプロジェクトはセキュリティが弱い生成AIとLLMを使用しており、組織や消費者のリスクを引き起こしています。
  • 品質の低下:オープンソースAIモデルは透明性とコミュニティの共同作業をもたらしますが、時間の経過とともに品質の低下が起こることがあります。専任チームによって維持されるクローズドソースモデルとは異なり、保守の負担はしばしばコミュニティにかかります。これにより、放置されたり、時代遅れのモデルバージョンになる可能性があります。この低下は重要なアプリケーションを妨げ、ユーザーの信頼と全体的なAIの進歩を危険にさらす可能性があります。
  • AI規制の複雑さ:AIモデルをオープンソース化することで、AI規制者にとって新たなレベルの複雑さが生じます。機密データの保護方法、モデルの悪用防止方法、モデルの適切な保守が行われることの確認方法など、考慮すべき要素が多数あります。したがって、AI規制者にとって、オープンソースモデルが善用され、悪用されないようにすることは非常に困難です。

オープンソースAI論争の進化する性質

マーク・ザッカーバーグは、今年7月にLLaMA 2大規模言語モデルを発表した際、次のように述べています。「オープンソースは新しい技術を使って開発する多くの開発者を可能にするため、イノベーションを推進します。また、ソフトウェアがオープンであるため、より多くの人々がそれを検証して潜在的な問題を特定し修正することで、安全性とセキュリティを向上させます」

一方、マイクロソフトのバックアップを受けたOpenAIやGoogleのような主要なプレーヤーは、自社のAIシステムを閉じたままにしています。彼らは競争上の優位性を得て、AIの誤用のリスクを最小限に抑えることを目指しています。

OpenAIの共同創設者で主任科学者であるイリヤ・スツキーバーはThe Vergeに対して、「これらのモデルは非常に強力で、ますます強力になっています。ある時点で、これらのモデルを使用して大きな害を引き起こすことは非常に簡単になるでしょう。そして、能力が高くなるにつれて、それを公開したくないというのは理にかなっています」と語っています。したがって、人間が無視できないオープンソースAIモデルに関連する潜在的なリスクが存在します。

人間の破壊を引き起こすAIは数十年先のことかもしれませんが、オープンソースAIツールは既に誤用されています。例えば、最初のLLaMAモデルはAI研究の進展を目的としてリリースされました。しかし、悪意のある者はそれを使用して、人種差別的な発言やステレオタイプを広めるチャットボットを作成しました。

オープンAIの協力と責任あるガバナンスのバランスを保つことは重要です。これにより、AIの進歩が社会にとって有益なものであり続ける一方で、潜在的な被害から保護されます。技術コミュニティは、倫理的なAIの開発を促進するためのガイドラインとメカニズムを確立するために協力する必要があります。さらに重要なことは、誤用を防ぐための措置を講じることで、AI技術がポジティブな変化の力となることを可能にすることです。

AIの知識を向上させたいですか?Unite.aiの豊富なAIリソースカタログをナビゲートして、知識を高めましょう。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

3つの新しい方法、生成AIがあなたの検索に役立つ方法

今日から、私たちはSearch Labsで最初の実験の1つであるSGE(Search Generative Experience)へのアクセスを開始し始めます

データサイエンス

「機械学習におけるデータの重要性:AI革命の推進力」

マシンラーニングの進歩やAI革命を促進する上でデータの重要な役割を探求し、その意義を明らかにします

データサイエンス

2024年の予測17:RAG to RichesからBeatlemaniaとNational Treasuresへ

メリアム・ウェブスターの前に譲れ:今年、企業は年間のワードに追加するための多くの候補を見つけました。「生成的AI」と「...

人工知能

「ビジネスを拡大するための25のChatGPTプロンプト」

「25個のChatGPTテンプレートのプロンプトをコピーして貼り付けすることで、あなたのビジネス(および収入)を次のレベルに引...

人工知能

「人工知能の暗黒面」

この記事では、AIを恐れるべきなのか、あるいは有名人からの警告は根拠がないのかという問いについて探っています

機械学習

「機械に学習させ、そして彼らが私たちに再学習をさせる:AIの構築の再帰的性質」

「建築デザインの選択が集団の規範にどのように影響を与えるかを探索し、トレーニング技術がAIシステムを形作り、それが再帰...