データサイエンスをより速く学ぶために、ChatGPTの使い方もしも既に上級者であっても
ChatGPTの使い方を学ぶ際、データサイエンスの学習を効率化する
AI駆動の未来でのデータサイエンスの関連性について議論し、AIツールを活用してデータサイエンスを効果的に学ぶためのステップバイステップガイドを提供する
目次
• データサイエンスはまだ関連性があるのか?
• データサイエンスを学ぶためになぜAIを使用すべきか?
• 実際にAIを活用したデータサイエンスの学習方法
- ステップ1:ロードマップの作成
- ステップ2:私のチューターとしてChatGPTの設計
- ステップ3:学習計画の作成
- ステップ4:AutoGPTのような高度なツールの試用
- ステップ5:プロジェクトの実施
- 初心者向けプロジェクトの解説
- 上級者向けプロジェクトの解説
• 結論
- ToolQAとは 外部ツールを使用した質問応答のための大規模言語モデル(LLM)の能力を評価する新しいデータセット
- Pythonを使用してTenacityを使用してリトライを制御する:エンドツーエンドのチュートリアル
- Snowflake上でストリーミング半構造化データ分析プラットフォームを構築する方法
短期間ですべてが変わりました。ChatGPTやGPT-4などのAIツールは、教育と技術スキルの学習の風景を完全に変えています。私は、以下の重要なことについてこの記事を書く必要があると感じました:
- 人工知能の新時代において、データサイエンスを学ぶことはまだ重要なのか?
- もし重要なら、新しい技術を活用してこれらのスキルを学ぶための最良の方法は何か?そして、今すぐに再スタートする必要がある場合、どのようにすれば良いのか?
- データサイエンスの未来はどのようなものか?
データサイエンスはまだ関連性があるのか?
AIの進化に伴い、データサイエンティストは不要になるのか、それとも彼らの役割が今まで以上に重要になるのか?
個人的な視点からは、AIだけではなく、私はクライアントに対して付加価値を提供できると感じています。これらの新しいツールを利用して、私は少なくとも作業量を2倍にすることができました。現時点では、AIが私の仕事を奪い取ることはないと感じていますが、現実的には未来は今まで以上に不確定です。
仕事が消えてしまうことに恐れを抱く前に、以下のシナリオを考えてみましょう:将来のある時点で、AIが分析業務を行っている会社を経営しているとします。
AIを実行し、促進し、監督するのは誰が望ましいでしょうか?データサイエンスやソフトウェアエンジニアリングのバックグラウンドを持つ人物にプログラムを監督させるのか、未訓練の人物に任せるのか?
答えはかなり明白だと思います。データを扱う経験と知識を持った人物にAIシステムを監督させたいでしょう。
短期的には、このシナリオは仮想的なものであることを願います。しかし、私には、これらのスキルの一部は耐久性を持っているという自信が与えられます。
データサイエンティストがコーディングに関与する時間が減っても、この分野を学ぶことで開発するスキルは、AIとより密接に統合された世界で非常に有用だと感じています。AIはデータサイエンスに基づいており、あるレベルで私たちもこのシステムに統合されています。
さらに、AIはまだ幻覚を引き起こし、私たちはできるだけ多くの人々を持っていることが必要です。彼らは良い知識を持ち、フィードバックループとして機能します。
データサイエンティストの仕事の未来については不確実ですが、私は次のことに非常に確信を持っています:データ、分析、AIは今後ますます私たちの生活の一部となります。これらの領域を学んだ人々がより相対的な成功に向けて準備されると思いませんか?
データサイエンスを学ぶためになぜAIを使用すべきか?
この記事は、データサイエンスを学ぶ価値がないと思わなければここで終わっているでしょう。はっきり言って、私はまだ100%それが価値があると思っています。しかし、正直に言って、単にデータサイエンスを学ぶだけでは十分ではありません。新しいAIツールの使い方も学ぶ必要があります。
面白いことに、データサイエンスとこれらのAIツールの両方を学ぶ方が、単独でデータサイエンスを学ぶよりも簡単です。説明しましょう。
偶然にも、これらの2つの領域を一緒に学ぶのに最適な時期に入っています。
新しいAIツールを活用してデータサイエンスを学ぶことで、2つの利点が得られます:
- AIと一緒にデータドメインを学ぶことで、より個別化された反復的な学習体験を得ることができます。
- 同時にAIツールのスキルアップもできます。
計算が正しければ、働く量の半分で2倍の利益が得られます。
AIツールの使用能力が仕事を見つけるのに役立ち、より良い仕事をすることができるならば、それらと一緒に作業する方法を知ることは無視するよりも良いです。過去3ヶ月間で、私は過去3年間で学んだよりもデータサイエンスについて多くのことを学んだように感じます。これは主にChatGPTの使用によるものです。
では、どうすればこれを実現できるのでしょうか?実際にAIと一緒にデータサイエンスを学ぶにはどうすればよいのでしょうか?
AIを使って実際にデータサイエンスを学ぶ方法
これが私が利用可能なすべてのツールで最初からやり直す場合、私がすることです。
ステップ1:ロードマップを作成する
ロードマップを作成します。他のコースを見て、またはChatGPTとの会話を通じてこれを行うことができます。学習目標に基づいたデータサイエンスの学習ロードマップを作成するようにChatGPTに依頼することができます。
学習目標がない場合、それを作成するように依頼し、好きなものを見つけることもできます。
教育ロードマップの作成についての詳細情報が必要な場合は、この記事をチェックしてください。
ステップ2:ChatGPTを自分のチューターに設計する
私はChatGPTを私のチューターにするように設計します。お気に入りの機能であるGPT-4を使用してペルソナを作成することができます。以下のようなプロンプトを使用できます:
このシナリオでは、あなたは世界でも最高のデータサイエンスの教師の1人です。ドメインの最良の理解を開発するのに役立つように、私のデータサイエンスの質問に答えてください。沢山の実世界の例や実践的な例を使って、途中で関連性のある練習問題も教えてください。
ステップ3:学習コースを開発する
おそらく私は偏見があると思われますが、無料のコースや有料のコース(私のものなど)は、学習のための構造を作成するための良いオプションです。学習コースを進めるにつれて、ChatGPTチューターに例やトピックの拡張、練習問題を求めることができます。
ステップ4:AutoGPTのような高度なツールを試す
AIのフロントエンドで少し進んでいる場合、AutoGPTのようなツールを使用してコースのカリキュラムを生成することができます。これを試して結果を見てみるかもしれません。もし試す場合は、GitHubで共有します。また、私はGPT-4についての詳細情報を深く掘り下げたポッドキャストでインタビューもしています。
ステップ5:プロジェクトを行う
既にコーディングに慣れている場合は、プロジェクトを行うことができるでしょう。私は個人的に、ChatGPTとの同時作業で多くのことを学びました。これは、不動産のKaggleチャレンジで行いました。
最初のプロジェクトであれば、単にそれに何かをさせることを求めることも悪くありませんが、進めるにつれて、それをどのように意図的かつ対話的に使用するかについてもっと意識的になりたいと思うでしょう。
プロジェクトでの学習方法について、初心者と上級者のアプローチを比較してみましょう。
初心者のプロジェクトの手順
初心者のプロジェクトの手順の例は次のようになります:
- データの行と列に関する情報をChatGPTに入力します
- データのヌル値、外れ値、正規性を探索するための雛形コードを作成するように依頼します
- このデータに対してどのような質問をすべきかを尋ねます
- データをクリーニングし、従属変数に対して予測を行うためのモデルを構築するように依頼します
これはすべての作業をChatGPTにやってもらっているように見えるかもしれませんが、まだこのプロジェクトを自分の環境で実行する必要があります。また、進行しながら促すことや問題解決を行います。
他の誰かのプロジェクトをコピーするときのように動作する保証はないので、私はこれが参加度合いの良い学習の中間地点だと感じています。
上級者のプロジェクトの手順
さて、上級者がこれをどのように使用するかについて考えてみましょう:
1. 雛形コードを生成するための同じ手順に従うこともできますが、それ以上に展開する必要があります。データのハンズオンな探索や仮説の検証を試してみたり、データと記述統計を使用して解答したい質問を1つまたは2つ選んで分析を始めることができます。
2. 数プロジェクトを行ったことがある人には、一部のコードを自分で生成することをお勧めします。例えば、plotlyでシンプルな棒グラフを作成した場合、それを入力してChatGPTに書式を変更したり、色やスケールを変更するように依頼することができます。
これにより、視覚化を素早く反復することができ、コードのさまざまな微調整がグラフにどのように影響するかをリアルタイムで確認することができます。この即時フィードバックは学習に非常に役立ちます。
3. また、これらの変更内容を確認し、どのように行われたかを調べることも重要だと思います。また、何か分からないことがあれば、ChatGPTに直接質問して説明を拡大してもらうことができます。
4. 上級者は、データエンジニアリングやコードのプロダクション化のためのパイプラインにも重点を置くべきです。これらはまだかなりハンズオンで行う必要がある作業です。ChatGPTは私をある程度のところまで導いてくれましたが、デバッグ作業もたくさん必要でした。
5. その後、AIにアルゴリズムを実行させ、パラメータの調整を行うことができるかもしれません。正直なところ、私はこれが最も速く自動化されるデータサイエンスの部分だと思います。パラメータのチューニングは、通常の実践者には限られた効果しかもたらさないかもしれませんが、最高レベルのKagglerには適用されないかもしれません。
6. 時間をかけて特徴エンジニアリングと特徴作成に集中すべきです。これもAIモデルが助けることができるが、完全に習得することはできません。まずまともなモデルを作成した後、結果を向上させるために追加できるデータや作成できる特徴、行える変換などを見つけてみましょう。
これらの先進的なAIツールが存在する世界では、プロジェクトを実施することがより重要になっていると思います。何かを構築し、自分の作業を共有する必要があります。幸いにも、これらのAIツールを使用すれば、それが簡単になります。ウェブアプリを作成することも簡単になりました。以前に使用したことのない新しいパッケージと一緒に作業することも簡単になりました。
データサイエンスの仕事で実世界への影響と具体的な成果を創出することを強くお勧めします。他の人々もこれらのツールを使って学び、構築する中で差別化する新しい方法になるでしょう。
結論
世界は変わりつつあり、データサイエンスも同様です。あなたはプロジェクトで現実世界に影響を与えるためのチャレンジを受け入れる準備ができていますか?
前述したように、私たち全員の働き方が変わっていると思います。データサイエンスを含むすべての分野にとって不確実な時代だと思います。
一方で、私はデータサイエンスが技術的なスキルと問題解決能力の優れた組み合わせであり、ほぼすべての新しい世界や分野に適用できると考えています。
私は自分のポッドキャストでデータサイエンスが純粋な起業精神に近い分野の1つだと話してきました。AIによって変わった世界では、できるだけ起業家精神を活用する必要があると思います。
この記事が気に入ったら、VoAGIで私をフォローして、このようなコンテンツをもっとご覧いただくか、メールで購読してください。また、データサイエンスに興味のあるネットワークにこの記事を共有、お勧めいただけます。
データサイエンス、機械学習、AIに関する楽しくて有益なビデオが好きなら、私のYouTubeチャンネルをチェックしてください。そこでは解説、チュートリアル、その他の教育ビデオを提供しています。
データサイエンス業界の私のコンテンツ作成と追加の学習リソースに関する週次更新を受け取るには、ニュースレター「データドリブル」に登録してください。
さらに、数千人のライターと私をサポートするために、メンバーシップにサインアップしてみてください。
私の紹介リンクでVoAGIに参加 – Ken Jee
VoAGIメンバーとして、会員費の一部があなたが読むライターに還元され、すべてのストーリーに完全アクセスできます…
VoAGI.com
次回まで、データサイエンスの道で幸運を祈ります!
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles