「Cheat Sheetつきで始めるグラフデータベースクエリ」
「Cheat Sheet付きで始めるグラフデータベースクエリの基礎」
グラフデータベースは毎年勢いを増しています。彼らは関係データベースを完全に置き換えることはありませんし、そうするつもりもありません。しかし、彼らはデータレイクやデータウェアハウスが苦労している領域に進出し始めます。グラフデータベースは、イベントやリソース、人々のネットワークを分析するのにより速く、直感的な方法を提供します:
- 複雑なパターンや時折の詐欺を含む金融取引
- 患者、医療スタッフ、施設、機器間のヘルスケアの相互作用
- 顧客、ベンダー、契約業者、製品の供給チェーンウェブ
- 素材のためのレシピを含む製造の材料構成
このようなネットワーク関係は、関係データモデルや次元データモデルではモデリングや可視化が難しいです。グラフデータベースは、ビジネスのリアルワールドネットワークを模倣する構造を提供します。
グラフデータベースとクエリ言語を使用し始める際には、心のモデルが変わる準備が重要です。まず、SQLのような広く受け入れられた標準クエリ言語はまだありません。添付の資料に示されているように、競合する言語のグループと、一つのGQL標準に合意しようとする委員会が存在しています。今日の目的のために、私たちはデータベースのトップベンダーであるNeo4jが開発し推奨しているCypherクエリ言語を使用します。
グラフクエリでは、SQLから一部の構文を失い、他の構文を得ます。SELECTはMATCHに置き換えられました。FROMとJOINは廃止されました。ただし、WHEREとORDER BYのコマンドは同じ方法で使用されます。SUMやAVGなどの集計関数もありますが、GROUP BYは廃止されました。しかし、最も重要なのは、ノードの関係を使用してグラフ内のパターンをクエリできる能力を得ることです。添付のチートシートには、最も一般的に使用されるクエリアプローチの一覧が表示されています。
- 基礎に戻る週1:Pythonプログラミング&データサイエンスの基礎
- テキスト生成の新時代:RAG、LangChain、およびベクトルデータベース
- DB-GPT プロプライエタリLLMテクノロジーを使用して、データベースとのインターフェースを変革する
以下は、添付のチートシートで使用されるグラフモデルです:こちらをご覧ください
私は、ほとんどの人が一度は賃貸物件を借りたことがあるため、賃貸物件のグラフを選びました!明らかに、ノードごとの完全な物件リストを追加すれば、このグラフはより複雑になることができます。
次のステップは練習を行うことです。Kaggleなどのソースからサンプルデータセットをダウンロードするか、JanusGraphやNeo4jなどのベンダーから入手できます。
もしあなたの雇用主や趣味のプロジェクトにネットワーク関係が組み込まれているデータセットがある場合、グラフデータベースを試してみてください。リレーショナルデータベースでは不自然なデータが、グラフの中で適切な場所に収まることに気づくでしょう!
****[Stan Pugsley](https://www.linkedin.com/in/spugsley/)****さんは、ソルトレイクシティ、ユタ州を拠点とするフリーランスのデータエンジニアリングおよび分析コンサルタントです。彼はまた、ユタ大学エクルズビジネススクールで講師も務めています。作者にメールで連絡することができます。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- 「パンドラの箱をのぞいてみよう:『ホワッツインマイビッグデータ(WIMBD)』で言語モデルのデータセットの隠された複雑さを明らかにする」
- 実生活の例とPythonコードで説明される隠れマルコフモデル
- トゥギャザーエーアイは、トレーニング用の大規模な言語モデルに向けた30兆トークンを持つオープンデータセット、RedPajama v2をリリースしました
- ネットワーキングの下手さをやめてください!Spotifyのデータサイエンティストが教えるこれらの6つの必須ステップでデータサイエンスの求人市場で目立とう
- 「Pythonで簡単に実装するマルチクラスSVM」
- データロボットとAWS Hackathon 2023でGenAI CVスクリーナーを構築する
- イーロン・マスク氏とXAiチームがGrokを発表:人工知能(AI)の新たなフロンティア、ライブデータとChatGPTに対する最強の競合相手