データベーススキーマのレトロエンジニアリング:GPT vs. Bard vs. LLama2(エピソード2)

ビューティー&ファッションの情報発信に関するノウハウ:GPT vs. Bard vs. LLama2(エピソード2)

前の記事で、私はGPT-4モデルとBardを比較しましたが、今度はLlama-2が登場し、その競争相手に対してどのようにパフォーマンスを発揮するかを見る時です!

Dustin Humes氏による写真(Unsplash)

初期(および最終)データセット

この最初の記事で説明されているように、社員の情報を含む偽のAI生成データセットで始めます。

データベーススキーマのリバースエンジニアリングと品質チェック:GPT vs. Bard

LLMは統合データセットをリバースエンジニアリングし、元のデータベースを設計し、対応するデータを提案できますか…

towardsdatascience.com

元のテーブルは11列x7688行ですが、現在のLLMのトークン制限に合わせて、50行のサンプルに抽出を制限します。

元データのサンプル(作者による画像)

(注意:ノートブックとデータソースは記事の最後で入手できます)

データモデルのリバースエンジニアリング

ここでのアイデアは、各LLMにこのサンプルデータを分析して、初期データスキーマがどのように見えるかについての示唆を提供してもらうことです。

GPT-4とBardで使用したものと同じプロンプトを使用します:

データセット内のカテゴリカルなカラムと機密情報を特定すること- 機密データ用に別々のテーブルを作成することに注意して、データベーススキーマを提案すること- カテゴリカルデータを含むテーブルについては、その作成に使用するSQLスクリプトと内容(キーと値)を提供すること- 残りのテーブルについては、そのスキーマの作成に使用するスクリプトを提供すること- 各テーブルの各列について、いくつかのデータ品質チェックを提案すること

素晴らしい!…でも今度は「どこでLlama-2をテストできるのか?」という問題があります。

いくつかのオプションがあります:

  • 最も明らかなオプション(ただし複雑で高価な💸)は、専用サーバーにモデルをホストし、クラウドアーキテクチャに組み込むことです。通常は…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more