ジェネラティブAI時代におけるデータキャリアの拡大

'ジェネラティブAI時代のデータキャリア拡大'

3つの基本的なデータの概念を学ぶことに関する認識の向上

データの専門家として、最近の生成AIの進展には驚かされています。

一部の人々はそれをハイプと呼び、ただのテクノロジートレンドとして軽視することを望む一方、他の人々はそれがゲームチェンジャーであると確信しています。

どちらの流れを支持するとしても、生成AIが教育や職場の将来にもたらす変革の可能性を無視するのは難しいです。

この声明を裏付けるためには、ハーバード大学が2023年秋にAIチャットボットを教室に導入し、一対一の教師対生徒の比率を近似するということを挙げるだけで十分です。学生たちはハーバードが開発したチャットボットを使用して、単純な回答ではなく解決策への案内を受けることになります。

私にとって、これはハーバードが新しい世代の学習、そしてそれに伴う働き方に変革の波を引き起こしていることを明確に示しています。

つまり、生成AIは一時的なトレンドに過ぎず、私たちは働く環境をそれに適応させる方法を見つけ始める必要があります。

生成AIに対する私の熱心な見方にもかかわらず、私はこれまでにそんなにFOMOを感じたことはありませんでした。

言い換えれば、過去12年間にさまざまなデータの役割を経験し、機械学習の概念を習得してきた私でも、生成AIの新しい進展についていくことができません。

新しい用語、プロンプトエンジニアリングの概念、新しい大規模言語モデルの開発、それらを基に構築された数多くのアプリやソリューション、新しいeラーニングコース、そしてこのトピックに関する投稿の数々 — これらすべてが 単純に圧倒的です。

さらに、私のデータスキルの一部が今では、まあ、時代遅れになったという不安を振り払うことができません。

私のビジネスの同僚たちが私が手に入れたクエリのスキルを数回のキーストロークで置き換えることが怖いです。

ただし、ふと考えてみると、私のスキルの一部が（一部だけですが）置き換えられることさえも気になりません。同じ繰り返しのビジネスの質問に答えるために毎週何度もアドホッククエリを実行するのは、私が好きではなかったことです。

その他にも、私が把握していることの一つは、私がデータウェアハウスに保存されたデータとビジネスインサイトの生成の間にいることが、意思決定プロセスを遅くしているということです。

もう一つ私が把握していることは、この移行、つまり私の代替が一夜にして起こるわけではないということです。

まず第一に、現在の開発環境を適応させる必要があります。つまり、「ビジネスユーザーフレンドリー」であり、「開発者フレンドリー」ではなくなる必要があります。

第二に、ビジネスユーザーは「中心」となるものの技術的な理解を得る必要があります。自然なテキスト入力から分析的なインサイトを生成する自由は、同じ問題を伴います。

遅いインサイトの生成、不正確なインサイトの生成、新しい入力（新しいデータソース）なしでのインサイトの充実、インサイトの品質チェックの技術的なプロセスなどの問題は依然として存在します。

そして、ビジネスユーザーのためにこれらの問題を処理し、「修正」する人がまだ必要とされるでしょう。

言い換えれば、生成AIは基本的なデータの知識を簡単に置き換えることはできません。

では、「基礎的な」データの知識とは具体的にどういう意味でしょうか？

上記の問題を裏付けるために、それは次の3つの核心的な概念に帰結します：

データアーキテクチャの構築

主張：特定の業界で適切なデータアーキテクチャを設計するための技術的な知識と理解は重要です。

例として、フィンテック業界から挙げてみましょう。

フィンテック業界では、PCIデータセキュリティ基準などの厳しい規制があり、データプラットフォームを構築する際に考慮する必要があります。これらの基準に加えて、時には市場に基づく基準も存在します。

たとえば、スイスでは、他の規制の中でも、データプラットフォーム、そしてそれに続くデータアーキテクチャが準拠するために考慮すべきFINMAの規制があります。

もちろん、規制は変更される可能性があり、それに合わせてデータアーキテクチャを追従する必要があります。そして、これは生成AIにとって真のチャレンジです。

生成AIは、特定のレベルまで建築の設計と開発をサポートすることができます。

しかし、規制が変わる産業では、カスタマイズ可能な建築ソリューションの設計はできません。

似たような歴史的な例に基づいてトレーニングされていない場合、特定の建築的な適応を適用する能力を持っていません。

2. データ品質管理

主張: 「ゴミを入れればゴミが出る」という言葉は常に有効であり、データの世界で働く人なら誰でも、データ入力の品質が悪い場合のコストを正確に知っています。

生成AIソリューションを使用すると、出力品質の低さによるコストはさらに高くなります。

たとえば、最近ガーディアンで読んだ記事に言及します。弁護士がChatGPTを使用して、以前の類似の法的なケースの例を提供しようとしていました。彼は、なぜ彼のクライアントが航空会社に対する訴訟を却下されるべきではないのかを主張するための根拠を示したかったのです。

おそらく、どのような話が展開されるかは想像できるでしょう：航空会社の弁護士たちは引用された判決と法的引用をチェックしたところ、それらは存在しなかったことがわかりました。つまり、ChatGPTは幻想を見ていたのです。

この記事から私の結論を導くと、品質の低いデータの出力はビジネスに損害を与え、プロジェクトの完全な停止やクライアントや評判の喪失につながる可能性があります。

したがって、データの専門家は、データの入力と出力の品質を管理するためにより忙しくなるでしょう。

3. データのプライバシーとセキュリティ

主張: データの専門家として、SQLインジェクションやデータベースのセキュリティの概念については理解しているはずです。

生成AIの発展とプロンプトの簡単な使用により、データウェアハウスへの攻撃やデータ漏洩のシナリオがこれまで以上に起こりやすくなりました。

テキストの入力ひとつで、誰かがデータベース全体を削除したり機密情報を取得したりする可能性があるプロンプトインジェクションの危険は、データのセキュリティの中心に置かれる必要があります。

つまり、データとITの専門家は、データを保護しセキュリティを確保する上で重要な役割を果たし続けるでしょう。

まとめると: 基礎的なデータの概念に知識を持つデータの専門家は、データを効率的に管理し、問題を特定し、準拠、安全、信頼性のあるソリューションを最適化するための「一定の存在」として職場に留まるでしょう。

これは、生成AIが簡単に置き換えることができない部分です。

ですから、生成AI時代にデータキャリアを成長させるためのアドバイスを求める若手の専門家であれば、まずは上記の基本的なデータの概念を学ぶことから始めてください。

信じてください：基礎的なデータの知識を習得するために時間とリソースを投資することは、長期的にはデータキャリアに還元されるでしょう。

生成AIは、これらの領域で学習曲線を加速し、作業のパフォーマンスを向上させますが、重要な作業はあなたとあなたの知識に委ねられます。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Career AdviceData ArchitectureData managementData scienceGenerative Ai Tools

Was this article helpful?

93 out of 132 found this helpful

ジェネラティブAI時代におけるデータキャリアの拡大

3つの基本的なデータの概念を学ぶことに関する認識の向上

Was this article helpful?

モデルの精度にだまされない方法

SAM-PTとは SAM（Segment Anything Model）の機能を拡張し、動画内の任意のオブジェクトのトラッキングとセグメンテーションを可能にする、新しいAIメソッドです

データサイエンス