「Cheat Sheetつきで始めるグラフデータベースクエリ」

「Cheat Sheet付きで始めるグラフデータベースクエリの基礎」

グラフデータベースは毎年勢いを増しています。彼らは関係データベースを完全に置き換えることはありませんし、そうするつもりもありません。しかし、彼らはデータレイクやデータウェアハウスが苦労している領域に進出し始めます。グラフデータベースは、イベントやリソース、人々のネットワークを分析するのにより速く、直感的な方法を提供します:

  • 複雑なパターンや時折の詐欺を含む金融取引
  • 患者、医療スタッフ、施設、機器間のヘルスケアの相互作用
  • 顧客、ベンダー、契約業者、製品の供給チェーンウェブ
  • 素材のためのレシピを含む製造の材料構成

このようなネットワーク関係は、関係データモデルや次元データモデルではモデリングや可視化が難しいです。グラフデータベースは、ビジネスのリアルワールドネットワークを模倣する構造を提供します。

グラフデータベースとクエリ言語を使用し始める際には、心のモデルが変わる準備が重要です。まず、SQLのような広く受け入れられた標準クエリ言語はまだありません。添付の資料に示されているように、競合する言語のグループと、一つのGQL標準に合意しようとする委員会が存在しています。今日の目的のために、私たちはデータベースのトップベンダーであるNeo4jが開発し推奨しているCypherクエリ言語を使用します。

グラフクエリでは、SQLから一部の構文を失い、他の構文を得ます。SELECTはMATCHに置き換えられました。FROMとJOINは廃止されました。ただし、WHEREとORDER BYのコマンドは同じ方法で使用されます。SUMやAVGなどの集計関数もありますが、GROUP BYは廃止されました。しかし、最も重要なのは、ノードの関係を使用してグラフ内のパターンをクエリできる能力を得ることです。添付のチートシートには、最も一般的に使用されるクエリアプローチの一覧が表示されています。

以下は、添付のチートシートで使用されるグラフモデルです:こちらをご覧ください

  

私は、ほとんどの人が一度は賃貸物件を借りたことがあるため、賃貸物件のグラフを選びました!明らかに、ノードごとの完全な物件リストを追加すれば、このグラフはより複雑になることができます。

次のステップは練習を行うことです。Kaggleなどのソースからサンプルデータセットをダウンロードするか、JanusGraphNeo4jなどのベンダーから入手できます。

もしあなたの雇用主や趣味のプロジェクトにネットワーク関係が組み込まれているデータセットがある場合、グラフデータベースを試してみてください。リレーショナルデータベースでは不自然なデータが、グラフの中で適切な場所に収まることに気づくでしょう!

チートシートを今すぐダウンロード! 

****[Stan Pugsley](https://www.linkedin.com/in/spugsley/)****さんは、ソルトレイクシティ、ユタ州を拠点とするフリーランスのデータエンジニアリングおよび分析コンサルタントです。彼はまた、ユタ大学エクルズビジネススクールで講師も務めています。作者にメールで連絡することができます。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more