Search Results Snowflake

製造でのトピックモデリング

前回の記事では、ChatGPTを使ったトピックモデリングの方法と素晴らしい結果について話しましたタスクは、ホテルチェーンの顧客レビューを見て、言及されている主要なトピックを定義することでした...

「データプラットフォームから機械学習プラットフォームへ」

データ/機械学習は、私たちのテクノロジーの風景では最も人気のあるトピックです私はデータ/機械学習プラットフォームの理解と、それらのプラットフォームが基本的なものから複雑なものへと進化する方法を共有したいと思います最後に、最善を尽くします...

探索的なノートブックの使い方[ベストプラクティス]

「Jupyterノートブックは、データサイエンスコミュニティにおいて最も議論のあるツールの一つとなっています意見の異なる批評家もいますが、熱狂的なファンも存在しますそれにもかかわらず、多くのデータサイエンティストは、うまく使われれば本当に価値があると同意するでしょうそして、この記事では、それに焦点を当てていきます」

「7つの最高のクラウドデータベースプラットフォーム」

クラウドデータベースは、エンタープライズレベルのアプリケーションの開発をより簡単かつ低コストにし、柔軟性、利便性、そして標準的なデータベース機能を提供していますVoAGIがおすすめするものをご覧ください

Data Engineering

「SaaS AIの機能が堀や障壁なしでアプリケーションと出会う」

最近、いくつかのエンタープライズSaaS企業が創発型AI機能を発表しましたが、これは持続可能な競争上の優位性を欠いたAIスタートアップにとって直接的な脅威です

「Databricks SQL Serverless + DBT のテストから学んだ５つの教訓」

ダウンロードやダッシュボードの生成など、ビッグデータプロジェクトの構築および運用をサポートするために、美容とファッションの分野で豊富な知識を持つ美容とファッションの専門家です

GenAIにとっての重要なデータファブリックとしてのApache Kafka

ジェンAI、チャットボット、およびミッションクリティカルな展開での大規模言語モデルのリアルタイム機械学習インフラとしてのApache Kafka

「Amazon SageMaker Canvas UIとAutoML APIを使用して、時系列の予測を最大50%高速化しましょう」

私たちは、Amazon SageMaker Canvasがタイムシリーズ予測のための機械学習モデルをより迅速かつ使いやすい方法で作成できることをお知らせできることを嬉しく思っていますSageMaker Canvasは、ビジネスアナリストが正確な機械学習（ML）モデルを生成するためのビジュアルなポイントアンドクリックサービスであり、機械学習の経験がなくてもコードを一行も書かずに利用できますSageMaker [...]

『今日、企業が実装できる５つのジェネレーティブAIのユースケース』

様々な産業で、エグゼクティブたちはデータリーダーにAIを活用した製品を作り上げるよう求めていますそれにより時間の節約や収益の促進、競争上の優位性の獲得を目指していますまた、OpenAIのようなテックジャイアントも同様です…

生成AIのアシストを使用して複雑なSQLクエリを作成する

イントロダクション ChatGPTの登場は、AIの歴史において前例のない瞬間を迎えました。ChatGPTや他の多くの生成型AIツールは、驚異的な能力を持っており、私たちの働き方を劇的に変える可能性があります。AI革命に続いて、データサイエンスにおけるSQLの記述は既に変化しています。この記事では、自然言語を使用してSQLデータベースと接続し、対話する具体的な例を提供します。PythonのオープンソースパッケージであるVannaを使用します。ノートブックへのリンクはこちらです。Generative AIを使用して複雑なSQLクエリの作成方法をマスターしましょう。この洞察に富んだガイドでは、自然言語のプロンプトを使用してデータベースの相互作用を効率化する方法を学びます。学習目標この記事では、以下のことを学びます：データ駆動型プロジェクトにおいて、なぜSQLの記述が一般的な課題となるのか生成型AIがSQLをより簡単かつアクセスしやすくする可能性自然言語のプロンプトを使用してSQLを記述するためにLLMをどのように実装できるか PythonのパッケージであるVannaを使用してSQLデータベースと接続し、対話する方法 Vannaやより広範な意味でのLLMがSQLの記述において抱える制約この記事は、データサイエンスのブログマラソンの一環として公開されました。データ駆動型プロジェクトにおけるSQL：一般的な課題 SQLは最もポピュラーで広く使用されているプログラミング言語の一つです。ほとんどの現代企業は、エンタープライズデータの格納と分析にSQLアーキテクチャを採用しています。しかし、会社内の全員がそのデータを活用する能力を持っているわけではありません。技術的なスキルが不足しているか、データベースの構造やスキーマに馴染みがないかもしれません。どんな理由であれ、これはデータ駆動型プロジェクトにおいてしばしばボトルネックとなります。ビジネスの質問に答えるためには、SQLデータベースの使用方法を知っているごく少数の人々の存在に依存しています。会社の全員が、SQLの専門知識にかかわらず、一度にいつでもどこでもデータを活用できたら素晴らしいですよね？これは、生成型AIの助けを借りれば、近いうちに実現することができるかもしれません。開発者や研究者は、SQLの目的でトレーニングされた大規模言語モデル（LLM）の異なるアプローチを既にテストしています。たとえば、LLMベースのアプリケーションを開発するための人気フレームワークであるLangChainは、自然言語のプロンプトに基づいてSQLデータベースと接続し、対話することができます。しかし、これらのツールはまだ初期段階にあります。大規模で複雑なデータベースで作業する場合、精度の低い結果を返したり、いわゆるLLM幻覚を経験することがよくあります。また、非技術的なユーザーにとって直感的に理解しにくい場合もあります。したがって、改善の余地はまだ大いにあります。 Vannaの概要 Vannaは、SQLの使用を民主化するために設計されたAIエージェントです。OpenAIとGoogleのサードパーティLLMの組み合わせに基づいた事前学習モデルを元に、データベースに特化したカスタムモデルを微調整することができます。モデルが準備できたら、自然言語でビジネスの質問を投げかけると、モデルがそれをSQLクエリに変換します。また、クエリを対象のデータベースに対して実行したい場合もあります。モデルに尋ねるだけで、クエリと結果のpandas DataFrame、plotlyのチャート、および追加の質問のリストが返されます。カスタムモデルを作成するためには、VannaはSQLの例、データベースのドキュメント、およびデータベーススキーマ（データ定義言語（DDL））など、文脈に関連する情報をトレーニングデータとして使用する必要があります。モデルの精度は、トレーニングデータの品質と量に最終的に依存します。良いニュースは、モデルが使用されるたびに生成されたSQLクエリが自動的にトレーニングデータに追加されるため、モデルが以前のミスから学び、徐々に改善していくことです。全体のプロセスは、以下のイメージで示されています： LLMの技術的な詳細や他の種類のニューラルネットワークについて詳しくは、この記事をご覧ください。…

Learn more about Search Results Snowflake - Page 3