「PyGraftに会ってください:高度にカスタマイズされた、ドメインに依存しないスキーマと知識グラフを生成する、オープンソースのPythonベースのAIツール」
PyGraft an open-source Python-based AI tool for generating highly customized, domain-independent schemas and knowledge graphs.
データをグラフ構造で表現するための、ますます人気のある方法は、知識グラフ(KG)の使用です。KGは、s(主語)とo(目的語)という2つのグラフノード、およびそれらの間に存在する接続のタイプを記述する述語pからなるトリプル(s、p、o)のグループです。KGは、研究分野の主要なアイデアや関係性、およびこれらのアイデアや関係性がどのように相互作用するかを規定するスキーマ(オントロジーなど)によってしばしばサポートされます。KGが適用される多くの活動には、モデルのパフォーマンスを測定するための受け入れられた基準となるKGの数があります。
しかし、新たに提案されたモデルが一般化できるかどうかを判断するために、これら特定の主流のKGだけを使用することにはいくつかの問題があります。たとえば、ノードの分類において主流のデータセットは統計的特性、特に同質性を共有していることが示されています。そのため、同じ統計を持つデータセットが新しいモデルの評価に使用されます。その結果、共通のベンチマークデータセット以外では、パフォーマンスの向上への貢献は時折一貫性がありません。
同様に、既存のリンク予測データセットのいくつかはデータのバイアスを持っており、予測モデルが含めることができる多くの推論パターンを含んでいるため、楽観的すぎる評価パフォーマンスを示すことがあります。そのため、さまざまなデータセットが必要です。新しいモデルがさまざまなデータコンテキストでテストされるためには、研究者に異なるサイズと特性の架空のリアルなデータセットを作成する手段を提供することが重要です。一部のアプリケーションセクターでは、公にアクセス可能なKGが存在しないことが、わずかなKGに依存するよりも悪いです。
- 「コンピュータビジョンと言語モデルが見たものを理解する手助け」
- 「パインコーンベクトルデータベースの包括的なガイド」
- 「Seerの最高データオフィサーであるDr. Serafim Batzoglouによるインタビューシリーズ」
教育、法執行、医療などの分野では、現実の知識の収集や共有が不可能となるデータプライバシーの懸念が存在します。そのため、ドメイン指向のKGはこれらの地域ではほとんど利用できません。一方、エンジニア、実践者、研究者は通常、興味のある問題の特性について特定の考えを持っています。このような状況では、実際のKGの特性を模倣する合成KGを作成することが有利です。これら2つのコンポーネントはしばしば別々に扱われてきましたが、前述の問題がいくつかの試みを促し、スキーマとKGの合成ジェネレーターの構築に取り組んでいます。
ドメインニュートラルなKGは、確率ベースのジェネレーターによって生成することができます。これらのアプローチは、大規模なグラフを迅速に生成することでどれだけ効果的であるかに関わらず、データ生成の核心アイデアは基礎となる構造を考慮する必要があります。生成されたKGは、選択したアプリケーションセクターの実際のKGの特性を正確に模倣しない場合があります。一方、スキーマ駆動型のジェネレーターは、実世界のデータを反映したKGを作成することができます。ただし、彼らの知識によると、ほとんどの取り組みは既存のスキーマを使用して合成KGを作成することに焦点を当てています。スキーマとそれをサポートするKGの合成は、検討されていますが、まだ断片的な成功を収めていません。
彼らは、この問題を解決することを研究の目的としています。Université de LorraineとUniversité Côte d’Azurの研究者は、特に高度にカスタマイズ可能なドメインニュートラルなスキーマとKGを作成するためのPythonベースのツールであるPyGraftを紹介しています。彼らの研究の貢献は以下の通りです:彼らの知識によれば、PyGraftは、幅広いユーザー指定の基準に応じて非常に調整可能な新しいパイプラインでスキーマとKGを生成するために特に設計された唯一のジェネレーターです。特筆すべきは、作成されたリソースがドメインニュートラルであり、応用分野に関係なくベンチマークに適していることです。生成されたスキーマとKGは、拡張されたセットのRDFSとOWL要素を使用して構築され、DLリーズナーを使用してその論理的な整合性を保証します。これにより、詳細なリソースの記述と一般的なセマンティックウェブの標準に厳密に準拠することが可能となります。彼らは、使用の容易さのためにコードとドキュメント、および関連する例を公開しています。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles