OpenRAIL オープンで責任あるAIライセンスフレームワークに向けて

OpenRAILは、オープンで責任あるAIライセンスフレームワークの開発に取り組んでいます

オープン&レスポンシブAIライセンス(「OpenRAIL」)は、後者の責任ある使用を求めながら、AIアーティファクトのオープンアクセス、使用、配布を可能にするAI特有のライセンスです。 OpenRAILライセンスは、現在のオープンソフトウェアライセンスがコードに対して、およびクリエイティブコモンズが一般コンテンツに対して行っていることと同様に、オープンで責任あるMLに対する広範なコミュニティライセンスツールです。

機械学習と他のAI関連分野の進歩は、情報通信技術(ICT)セクターにおけるオープンソース文化の普及の一部によって、過去数年間で著しく発展してきました。これは、MLの研究開発ダイナミクスに浸透しています。イノベーションのための核としてのオープンさの利点にもかかわらず、(まだそうではない)最近の機械学習モデルの開発と使用に関する倫理的および社会経済的懸念に関連する出来事は明確なメッセージを広めています。オープンさだけでは十分ではありません。しかし、問題は、企業のプライベートAI開発プロセスの不透明性の下で問題が持続しているため、閉じたシステムも答えではありません。

オープンソースライセンスはすべてに適合しません

MLモデルのアクセス、開発、使用は、オープンソースライセンスのスキームに非常に影響を受けています。たとえば、ML開発者は、公式のオープンソースライセンスやその他のオープンソースソフトウェアまたはコンテンツライセンス(Creative Commonsなど)を添付して重みを利用可能にすると、非公式に「モデルのオープンソース化」と呼ぶことがあります。これは次の疑問を投げかけます:なぜ彼らはそれをやるのですか?MLアーティファクトとソースコードは本当に似ているのでしょうか?技術的な観点から十分に共有できるほど共有していますか(たとえば、Apache 2.0など)。

ほとんどの現在のモデル開発者はそう考えているようですが、公開されたモデルの大部分はオープンソースライセンスを持っています(例:Apache 2.0)。たとえば、Hugging Face Model HubやMuñoz Ferrandis & Duque Lizarralde(2022)を参照してください。

しかし、経験的な証拠は、オープンソース化と/またはフリーソフトウェアダイナミクスへの厳格なアプローチと、MLアーティファクトのリリースにおけるFreedom 0への公理的な信念が、MLモデルの使用における社会倫理的な歪みを生み出していることを示しています(Widder et al. (2022)参照)。より簡単に言えば、オープンソースライセンスは、モデルがソフトウェア/ソースコードとは異なるアーティファクトであることを考慮に入れず、MLモデルの責任ある使用を可能にするには適応されていないため、適応されていません。

モデルのドキュメンテーション、透明性、倫理的な使用に専念した特定の特別なプラクティスが既に存在し、日々改善されています(例:モデルカード、評価ベンチマーク)。なぜ、MLモデルに関するオープンライセンスのプラクティスも、MLモデルから生じる特定の能力と課題に適応されていないのでしょうか?

同様の懸念は、商業および政府のMLライセンスプラクティスでも浮上しています。Bowe & Martin(2022)の言葉によれば、「Anduril IndustriesのゼネラルカウンセルであるBabak Siavoshyは、コンピュータビジョンのオブジェクト検出に私的に開発されたAIアルゴリズムに適用すべきライセンス条項のタイプは何か尋ねました。それを軍事的なターゲット指定や脅威評価に適応させるためのものです。商用ソフトウェアライセンスも標準のDFARSデータ権利条項も、この質問に適切に答えることができず、開発者の利益を適切に保護することも、政府がシステムに洞察を得て責任を持って展開することもできません。」

実際にMLモデルとソフトウェア/ソースコードは異なるアーティファクトであるなら、なぜ前者はオープンソースライセンスの下でリリースされるのでしょうか?その答えは簡単です。オープンソースライセンスは、ソフトウェア関連の市場におけるコードのオープン共有のための事実上の標準になっています。この「オープンソース」アプローチによる共同ソフトウェア開発は、AI開発とライセンスのプラクティスに浸透し、影響を与え、巨大な利益をもたらしています。オープンソースとオープン&レスポンシブAIライセンス(「OpenRAIL」)の両方は、補完的なイニシアチブとなる可能性があります。

なぜ、オープンソースなどの運動に触発され、MLフィールドからのエビデンスに基づくアプローチに導かれたライセンスメカニズムのセットを設計しないのでしょうか? 実際に、Open & Responsible AI Licenses(OpenRAIL)は、オープンで責任あるMLの開発、使用、アクセスへの道となる新しいライセンスフレームワークです。

ライセンスのパラダイムの変化:OpenRAIL

RAILイニシアチブによって採用され、Hugging Faceによって支持されるOpenRAILアプローチは、BigScience、オープンソース、クリエイティブコモンズなどのイニシアチブによって情報を得ており、それに触発されています。 OpenRAILライセンスの2つの主な特徴は次のとおりです:

  • オープン:これらのライセンスは、ライセンスされた資料へのロイヤリティフリーアクセスと柔軟な下流利用および再配布、およびその派生物の配布を許可します。

  • 責任ある:OpenRAILライセンスは、特定の重要なシナリオでライセンスされたAIアーティファクトの使用に一定の制限を組み込んでいます。使用に基づく制限は、MLの開発と使用に関するエビデンスに基づくアプローチと使用制限によって情報提供され、開放ライセンスされたAIアーティファクトの悪用から生じる潜在的な社会的コストに対して広範なアクセスと使用を促進するという目的との間に線引きを強制します。したがって、MLモデルへのオープンアクセスの恩恵を受けながらも、ユーザーは指定された制限されたシナリオでモデルを使用することはできません。

使用に基づく制限節の統合により、オープンAIライセンスの発行元はAIアーティファクトの使用をより良く制御し、執行の能力を持つことができます。モデルの誤用が特定された場合、責任あるAIアーティファクトのリリースのための法的ツールについて考えるための出発点をライセンサーはどのように考えることができるでしょうか。OpenRAILとRAILは、倫理に基づいた行動制約を可能にするための最初のステップです。

そして執行について考える前に、使用に基づく制限節はモデルの誤用を防止するための抑止力として働くかもしれません(つまり、妨げる効果)。ただし、使用に基づく制限節の単なる存在だけでは、リリースされたAIアーティファクトの潜在的な誤用が発生しないことを保証するのに十分ではありません。これがOpenRAILが、AIアーティファクトの派生物や再配布による使用に基づく制限の採用を要求する理由です。これにより、派生物のユーザーは後者の誤用を防ぐ手段として、AIアーティファクトの使用に基づく制限を採用する必要があります。

コピーレフトスタイルの行動使用節の効果により、元のライセンサーはライセンスされたアーティファクトの責任ある使用に対する希望と信頼に要件を広げます。さらに、行動使用節の広範な採用により、ライセンスされたアーティファクトの派生バージョンの後続の配布者はそれの使用をよりよく制御する能力を持ちます。社会的な視点から見ると、OpenRAILは、制限とモデルのライセンサーが持つ価値を認識しながら、AIアーティファクトの共有のための明確で尊重された文化の確立を促進する手段です。

オープンRAILは、良い機械学習にとってオープンソフトウェアライセンスがコードにとっているものかもしれません

OpenRAILライセンスの3つの例は、最近リリースされたBigScience OpenRAIL-M、StableDiffusionのCreativeML OpenRAIL-M、および前述の2つの起源です:BigSicence BLOOM RAIL v1.0(こちらの記事とFAQを参照)。後者は、BigScienceの176BパラメータモデルであるBLOOM(および関連するチェックポイント)のオープンかつ責任あるアクセスと使用を促進するために特別に設計されました。このライセンスは、広範な使用に基づく制限節とともに許可的なライセンス条項を提案し、大規模な言語モデル(LLM)の潜在的な可能性、およびそれらの固有のリスクと検証された制限に基づいて、制限された使用の数を設定しています。RAILイニシアチブによって採用されたOpenRAILアプローチは、他のより制限のあるモデル(OPT-175やSEERなど)と並行して利用可能となります。

これらのライセンスは、ライセンス空間で2つの部分的に解決された課題に対するBigScienceの反応です:(i)「モデル」と「コード」が異なるものであること、(ii)モデルの責任ある使用。 BigScienceは、ライセンスを特定のケースシナリオとBigScienceのコミュニティの目標に重点を置いて本当に設計することによって、その追加ステップを踏みました。実際、提案された解決策はAIの領域では新しいもののようです。BigScienceは、モデルの責任ある使用を広範に行えるようにライセンスを設計しました(つまり、責任ある使用の促進)。なぜなら、モデルの再配布または派生物は、特定の使用に基づく制限に準拠する必要がありながら、ライセンスの残りに関して他のライセンス条項を提案することができるからです。

OpenRAILはまた、AIシステムの展開、使用、商業化に関するセクターごとの特定の規制提案とも一致しています。AIの規制傾向(例:EU AI法案、カナダのAI&データ法案)の登場により、AIの規制トレンドと倫理的な懸念に基づいた新しいオープンライセンスパラダイムが今後数年で大規模に採用される可能性があります。影響、使用、および文書化を十分に考慮せずにモデルをオープンソース化することは、新しいAIの規制トレンドの観点から懸念の源になるかもしれません。したがって、OpenRAILはAIのオープンかつ責任ある使用を可能にする唯一の解決策としてではなく、AIガバナンスツールの一部としてAIの規制トレンドと結びつく手段として構想されるべきです。

オープンライセンスは、AIイノベーションの基盤の一つです。ライセンスは社会的および法的な制度として、十分に注意を払う必要があります。それらは、負担となる法的技術的機構として考えるのではなく、ライセンスされたアーティファクトの使用方法についての共通のメッセージを共有することで、AIコミュニティを結びつけるコミュニケーション手段として捉えるべきです。

健全なオープンで責任あるAIライセンス文化に投資しましょう。AIイノベーションと影響の未来は、私たち全員、あなたにかかっています。

著者:Carlos Muñoz Ferrandis

ブログの謝辞:Yacine Jernite、Giada Pistilli、Irene Solaiman、Clementine Fourrier、Clément Délange

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「ElaiのCEO&共同創業者、Vitalii Romanchenkoについてのインタビューシリーズ」

ヴィタリー・ロマンチェンコは、ElaiのCEO兼共同創設者であり、マイク、カメラ、俳優、スタジオの必要なく、個人が一流のビデ...

データサイエンス

「Adam Ross Nelsonによる自信のあるデータサイエンスについて」

データサイエンスの中で新たな分野が現れ、研究内容が理解しにくい場合は、専門家や先駆者と話すのが最善です最近、私たちは...

人工知能

『DeepHowのCEO兼共同創業者、サム・ジェン氏によるインタビューシリーズ』

ディープハウのCEO兼共同創設者であるサム・ジェンは、著名な投資家から支持される急速に進化するスタートアップを率いていま...

人工知能

ジョシュ・フィースト、CogitoのCEO兼共同創業者 - インタビューシリーズ

ジョシュ・フィーストは、CogitoのCEO兼共同創業者であり、感情と会話AIを組み合わせた革新的なプラットフォームを提供するエ...

人工知能

「マーク・A・レムリー教授による生成AIと法律について」

データサイエンス内で新しい分野が現れ、研究内容が理解しにくい場合は、専門家やパイオニアと話すことが最善です最近、私た...

機械学習

「Prolificの機械学習エンジニア兼AIコンサルタント、ノラ・ペトロヴァ – インタビューシリーズ」

『Nora Petrovaは、Prolificの機械学習エンジニア兼AIコンサルタントですProlificは2014年に設立され、既にGoogle、スタンフ...