AIはデータ専門家の役割にどのような影響を与えるのか?
AIのデータ専門家への影響は?
編集者の注:アランは、この6月14日から15日にかけて開催されるODSC Europeのスピーカーです。彼のトーク「AIの時代のデータコミュニケーション」をぜひチェックしてください!
2023年のAIとLLM(Language Model)の潜在的な影響について書くことは、トラブルを招くことを意味します。予測は、アポカリプス的なもの(人類への存在の脅威についての有名な専門家からの公開書簡)と懐疑的なもの(興味深い可能性があるが、現在は欠陥があまりにも多い)まで幅広いです。
両極端のどちらかという現実がどこかに落ち着くと仮定しても、VoAGI(人間に近い一般人工知能)の用語では、生成型AIの雇用に対する影響は大きいでしょう。多くのセクターにわたる仕事への影響についての議論のほとんどは、作家、デザイナー、ソフトウェアエンジニア、研究者、弁護士、行政職員に焦点を当ててきました。データ関連の専門家自身についてはあまり言及されていません。
- Streamlitを使用して、Hugging Face Spacesにモデルとデータセットをホスティングする
- データ測定ツールのご紹介:データセットを見るためのインタラクティブツール
- 🤗データセットを使った画像検索
人間と機械
データサイエンティストやアナリストは、この技術が彼らの役割、プロセス、および他の関係者との関係にどのように影響を与えるかを認識する必要があります。ソーシャルメディアで頻繁に繰り返される警告には誰もが気付いています。AIはあなたの仕事を奪わないが、AIを使用する人が奪うでしょう。
明らかに、データの整理においてAIは優れた能力を持つでしょう。特徴と関係の特定、データのクリーニングと構造化の支援、巨大なデータセットの選別 – これらはすべて機械が特に優れている分野です。そして、これらの能力は既にデータ重視の製品やプロセスに組み込まれています。
しかし、AIの利用はさらに進むかもしれません。最終的に、データ関連の専門家は自分のビジネスや組織に価値を提供する必要があります。これには、他の人々との関係構築、概念の説明、非データの専門家との明確なコミュニケーションが含まれます。
ChatGPTなどのモデルが少なくとも人間のように振る舞うことができるため、肉体的な専門家により適したタスクをAIに委任することができるでしょう。
会話インターフェース
抽象化は、ユーザーに不要な詳細レベルを隠すために役立ちます。プログラマーは機械語での作業を希望しないため、プログラミング言語は人間と機械の間の読みやすい変換レイヤーを提供します。
会話インターフェースは、抽象化の一段上の段階と見なすことができます。たとえば、ビジネスユーザーは自然言語を使用してデータベースにクエリを行うことができます。ChatGPTは既に正しい構文でSQLクエリを出力するために使用されています。
これにより、「プロンプトエンジニアリング」という特定のスキルや役割が生まれるという考えが浮かびますが、これは少し本質を見逃しています。会話インターフェースでは、モデルは専門的なユーザーからの単一のプロンプトに頼る必要はありません。必要な情報を得るためにユーザーに質問を連続的に行うことができます。それを診断結果を返す前に患者に質問する医師のように考えてみてください。
モデルは、特定のユーザーに関する重要な情報(彼らの仕事に最も役立つデータのタイプ、文脈を提供する季節的またはデータ特有のビジネスサイクル、チャートやグラフの読み方のユーザーの好み)を記憶することもできます。
このような「パーソナルアシスタント」としての役割を果たすことで、例えばチーフマーケティングオフィサーが月曜日の朝にデスクに到着し、単に「今日知る必要があることは何ですか?」と尋ねることができるでしょう。その後、AIはこの特定のユーザーに重要なデータを予測し、取得し、視覚化することを試みることができます。
ユーザーのパーソナライズに加えて、モデルはより専門化されたものにするためにニッチなデータセットでトレーニングすることもできます。Bloomberg GPTは、金融情報の深いニッチを使用してトレーニングされた独自の5000万パラメータのLLMです。
自動データストーリーテリング
探索的データ分析プロセスの一環として、数行のコードで多くのチャートやグラフを生成することはすでに可能です。しかし、データ洞察を他の関係者に伝える際には、より困難なことになります。
プレゼンテーション、レポート、ダッシュボードの対象となる観客は、データリテラシーのレベルが異なります。彼らはまた、データの異なる部分に興味を持っています。特定の観客向けに複雑なデータセットを分解することは、まだ非常に人間のスキルです。セス・ゴディンの言葉によれば、「非科学者(または退屈な科学者)向けのプレゼンテーションでは、チャートやグラフの目的は、明確に1つのポイントを示すことです。」
ODSCが行った25,000のデータアナリストの求人募集要項の分析では、コミュニケーションとデータ可視化が役割のトップ10のスキルに含まれていました。さまざまな観客にデータの洞察を明確に伝える能力は需要があります。
AlteryxのMagic Documentsは、生成型AIを使用してこのストーリーテリングプロセスの少なくとも一部を自動化する例です。プレゼンテーションの一部としてデータを視覚化するだけでなく、そのAuto Insights機能は数値に文脈を追加するための記述的なナラティブを引き出すことができます。
モデルの説明
対話インターフェースと自動データストーリーテリングの両方は、簡略化に依存しています。ビジネスユーザーに特定の洞察を提供することは、信号をノイズからフィルタリングすることを前提としています。
しかし、データと直接取り組んでいる人々は、この簡略化プロセスが重要な注意点やニュアンスを失ってしまう可能性があることを知っています。AIによって生成される予測と洞察をどの程度信頼できるかを理解するためには、基礎データの品質を理解する必要があります。これまでのところ、ChatGPTや類似のモデルは「わからない」と言うことにはあまり得意ではありません。代わりに、彼らは答えをでっち上げたりします。ヒューマンデータの専門家は、モデルとデータの制約を説明するためにさらに重要な役割を果たすことになるでしょう。
トレーニングデータのバイアスに関しても同様です。データバイアスが潜在的な問題であることには一般的な認識がありますが、競争力のある優位性を見ると、熱狂的なエグゼクティブはしばしばこれを忘れてしまいます。データの専門家は、ソース素材を精査するための提唱者である必要があります。AIプロジェクトの粗削りな実験段階と本番環境への展開の間のどこかで、それらのデータセットは監査される必要があります。
素人ユーザーが自分自身の専門用語を使用してデータセットをクエリする場合、単純なデータポイントであっても、「現在の企業の従業員数」というようなデータは、質問者や計算方法によって異なる場合があります。財務部門は「フルタイム換算」の数を使用する傾向がありますが、人事は人数(文字通り、企業の人間の数)を数えます。
そして、データの役割にある人々は、モデルが生成する出力だけでなく、それがどのようにして生成されたのか、なぜ生成されたのかを説明する責任も増していくでしょう。これは単に倫理的な問題ではなく(ただし、AIプロジェクトには最初からそれが組み込まれる必要があります)、米国、EU、英国、および他の多くの国々は、AIモデルの展開を取り巻く法的および規制的枠組みに積極的に取り組んでいます。
将来のデータ専門家
データに焦点を当てた役割で働くことは、エキサイティングな時代です。他の職業におけるAIの影響を見る一方で、私たち自身の職業にどのような意味を持つかを考えるべきです。この新しいテクノロジーに最も深い理解を持つ人々として、私たちは可能性を創り出すことの伝道者であり、リスクを検証するための法医学的な批評家である必要があります。
データ専門家の役割がAI革命の潜在的な影響についてもっと知りたい場合は、ODSC Europeカンファレンスでの私の講演を聞きに来ていただければ嬉しいです。
著者について
Alan Rutterは、コンサルティング会社Fire Plus Algebraの創設者であり、データの視覚化、執筆、デザインを通じて複雑なテーマを伝える専門家です。彼は、ガーディアンマスタークラス、WIRED、Riskified、内務省、バイオテクノロジー・生物科学研究評議会、リバプール熱帯医学学校などのブランドと組織のために、ジャーナリスト、製品オーナー、トレーナーとして働いてきました。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles