マシンラーニングのロードマップ:コミュニティの推奨事項2023
マシンラーニングのロードマップ2023
ロードマップ
前回の記事、このロードマップの第1部では、機械学習の出発点と方向について簡単に説明しました。初心者が堅固な基盤を築くのに役立つ簡単な計画について話しました。これについて話した後、記事の最後で、LinkedInでいくつかのアンケートを実施して、コミュニティからの新参者への提案を調査していました。
例えば、私はLinkedIn上の機械学習グループに、初心者がどこから始めるべきか、機械学習理論や線形代数、統計などの最良の学習リソース、そして初心者に最適な出発点について質問しました。これらの結果をまとめるために時間をかけた後、ついにこの記事を通じてそれらを発表します。それでは、時間を無駄にせずに記事に入っていきましょう。
旅の始め方
前回のロードマップでは、Pythonプログラミングで始めて、数学を進めていくことを提案しました(基本的な数学をすでに知っている場合)。ただし、どこから始めるのが良いかについても知りたかったので、良い出発点を尋ねました。Pythonプログラミングのコアではなく、機械学習コースについて尋ねたのは、それがより良いと考えたためです。
- 「生成的なAIアプリケーションと3D仮想世界の構築方法」
- 「メーカーに会う:開発者がAI搭載ピットドロイドの背後にNVIDIA Jetsonを使う」
- 「チューリングテストと中国の部屋の議論に基づく大規模言語モデル」
最初の質問として、どこから旅が始まったのか、どのリソースを参考にしたのか、どの領域に焦点を当てたのか、基礎の数学から始めたのか、直接機械学習やディープラーニングに取り組んだのか、経験と洞察を得た今、新たに始めたい人々に何をお勧めしますか、と尋ねました。
もっと話す前に、アンケートの結果を見てみましょう。
アンケートの結果を見ると、ほとんどの人がオンラインまたは対面のクラスを受講して始めたことがわかります。それは普通であり、2番目のアンケートも同じだと思いました。しかし、人々に提案してもらったところ、プロジェクトを行うことから始めることを提案されました。
また、同じくらいの人数が数学から始めるべきだと言っています。これを見ると、いくつかの理由とコミュニティの意見を考え出しました。以下に、MLクラスではなくプロジェクトから始めることをおすすめしない理由のいくつかを挙げます。
- プロジェクトは初心者に実践的なトレーニングを提供し、彼らのミスから学び、特にKaggleのようなサイトでの協力作業を容易にします。
- コースは依然として明確なスタート地点を提供していますが、ほとんどのコースはあいまいすぎるか学術的すぎて、現在の需要に合わせて更新する必要があります。
- 数学のバックグラウンドを持たない学生は、フードの裏側で何が起こっているのかを理解するために、整理された数学と基本的な統計が必要です。
- 評価には多肢選択問題とライブプロジェクトが含まれるべきです。
これ以外にも、さまざまな理由が考えられます。ただし、これらのポイントが最も多くの理由に貢献しています。
Pythonの学習を始める場所
では、描いたロードマップに戻りましょう。そのロードマップでは、Python、数学、SQLの水平な重要性が示されています。Pythonから始め、次のレベルの概念に進む前に、それぞれの側面を詳しく調べていきます。
Pythonは、機械学習愛好家にとって最もおすすめの出発点の一つであり、幅広い柔軟性を提供します。Pythonでは、データをスクレイピングし、データをクリーンアップして前処理し、クリーンアップされたデータでモデルをトレーニングし、Webアプリケーションにデプロイし、デプロイされたアプリケーションの状態をカスタムダッシュボードで監視することができます。Pythonだけでプロジェクトを終始まで取り組むことができます。
柔軟性に加えて、Pythonは理解するのが比較的簡単な言語の一つです。覚えておく必要があるのはコロン(:)とインデントだけで、それからあなたは始めることができます。
Pythonがおすすめの理由についてはすでに話しましたので、始めるためのおすすめのものについて考えてみましょう。
初心者に最もおすすめされているのは、ミシガン大学のPython for Everybody Specializationです。これはCourseraの5コースのスペシャリゼーションで、購入またはオーディットすることができます。私自身もチャールズ・セヴェランス教授のDjangoコースを受講しましたが、彼の教え方については迷うことはありません。コースの詳細はこちらでご確認いただけます。
これに加えて、CodeWithHarry、CodeBasics、Codanics、Corey Schafer、Teluskoなどのさまざまなチャンネルのお気に入りのYouTubeプレイリストや、DataCamp、ハーバード大学のCS50、Packtおよび他の出版社から発行されたPythonの書籍などが人々におすすめされました。
数学を学ぶにはどこがいいですか?
数学は幅広い領域の1つです。私たちは3つの側面に焦点を当てています:線形代数、微積分、統計学です。初心者レベルの線形代数と統計学についてさらに詳しく聞きましたが、高校レベルの微積分(特に連鎖律)は旅の初めのほとんどの部分には十分です。
線形代数
機械学習のほとんどは線形代数と統計学の組み合わせです。私たちが機械学習で行うことのほとんどは、高次元データを解釈可能な低次元に変換することです。私たちは線形代数を使用して、この高次元データを視覚化し操作します。
以下は、機械学習愛好家からのおすすめです。
詳細な線形代数の学習に関しては、MIT OCWの18.06線形代数(Gilbert Strang教授)が主なおすすめです。ただし、このコースの深さはまだMLの旅を始めたばかりの人々には適していません。投票結果からは、初心者にはKhan AcademyやDeepLearning.aiのコースがより適したスタート地点として反映されています。
これらに加えて、線形代数のための最も一般的なおすすめの一つは、3Blue1Brownチャンネルのプレイリストです。時間が少ない場合は、3Blue1Brownをおすすめします。線形代数に関しては、これがよりおすすめのリソースの一つです。
確率と統計
確率と統計は機械学習とMLのプロフェッショナルのキャリアにおいて基礎的なものです。初期段階では深い知識は必要ありませんが、長期的には統計の壁に直面することになります(マネジャーの役割ではなく、技術的なMLの分野で働くことを前提としています)。したがって、基本的な基礎を築き、各モデルの統計的な視点を理解することは、この分野を進むにあたって重要な要素の一つです。
では、コミュニティがおすすめするものを見てみましょう。
コミュニティのおすすめに基づいて、StatQuestとDeepLearning.AIの確率統計コースの投票数が同じです。Courseraのスペシャリゼーションについてはすでに話しましたので、StatQuestのプレイリストを見てみましょう。
このプレイリストの最も重要なハイライトは、ジョシュ・スターマーが教える方法のシンプルさです。彼はトピックを小さな一口サイズのピースに分割し、簡略化されたスタイルで説明します。これにより、あなたの学習の旅がよりモジュール化され、便利になります。
Statquestを推奨する理由についてもっと知りたい場合は、以下のRedditのディスカッションを参照してください。以下は会話の一部です。
ストラクチャードクエリ言語(SQL)
SQLはデータサイエンティストにとって論争の的となるトピックの一つです。働く場所やドメインによっては、数ヶ月間SQLを全く使わないこともあります。詳細に入ると、画像、ビデオ、音声などのサンプルに重点を置いたチームに配属された場合、SQLはほとんど使用しないでしょう。ただし、レコメンデーションシステムやその他のアプリケーションの一部では、SQLを使用する必要があるかもしれません。したがって、アプリケーションに依存します。(これはデータサイエンスやデータエンジニアリングよりも機械学習に焦点を当てたロードマップです。したがって、この議論は短くなります)。
しかし、面接では必ずSQLについて話すことになるでしょう。そのため、基本的なアイデアを持っている方が良いです。以下はコミュニティからの推奨事項です。
推奨事項は非常に明確であり、ほとんどの人がCourseraの「Data Science向けSQLコース」をおすすめしており、少数派の人がコメントでDataCampから始めることを勧めています。私はSQLにはDataCampを使用したので、このコースや推奨事項について正確な意見を述べることはできません。私の推奨事項について詳しく知りたい場合は、このロードマップのパート1を参照してください。
最後に…機械学習。
おそらくこのセクションについては紹介の必要はありません。おそらく機械学習のロードマップを見るためにこの記事をクリックしたでしょう。したがって、機械学習の旅を始めるための推奨事項を見てみましょう。
ここで混乱する必要はありません。機械学習を始めたい人で、複雑な数学と統計を含む高度に理論的な方法を進む気がない場合は、直接Courseraの「機械学習専門化コース」を始めることができます。これは最高のスタート地点の一つであり、なぜこれが最高なのかを誰でも説明できます。
学習の旅の後半では、もっと理論的な導入が必要な場合は、Prof. Andrew NgのYouTubeのCS229プレイリストが役立ちます。したがって、周りを見回す必要はありません。さらに情報が欲しい場合は、さまざまなリソースを確認するか、再びこのシリーズのパート1をチェックしてください。
ボーナス:就職 vs 機械学習における大学院の選択肢?
最近卒業した学生として、この決断に困りました。Mlまたはデータサイエンスの修士号を選ぶか、仕事をして実践的に学ぶか、完全に混乱していました。そして実際には、これはMLで働く多くの学生の混乱です。したがって、これは複数の人の意見が必要な質問の一つだと思いました。(この投票の回答は非常に大きく、調査終了時点で約500人の専門家が投票しました)。では、専門家たちは最終的にどのような推奨をしましたか?
ここから、人々は高等教育を追求するよりも働くことを推奨されることがわかります。ただし、それにはデメリットもあります。学士号を取得した後の就職は非常に困難です、特に修士号を持つ人々も同じポジションに応募するからです(昨年の面接で同じ理由で私も不採用になりました)。逆に、修士号を取得した後に専門領域に入る人は、より学術的な環境に慣れているため、生産環境に適応するのにより多くの時間が必要です。したがって、どちらが自分にとってより良いかを考慮し、評価した上で決断をする必要があります。
これで、ロードマップのすべての分野をカバーしました。これらの調査を行い、複数の調査結果をまとめるのに3週間かかりました。この記事が役立つと思われる場合は、世界中のウェブ上でさらに興味深い記事が投稿されたときに通知を受け取るためにサインアップしてください。
一方で、私はNLPの専門化を始め、興味深いプロジェクトに取り組んでいます。学んだことに基づいて、NLPに関する記事シリーズを作成する予定です(すでにやりました!)。それらを直接メールボックスに受け取るために、サイトに登録することを忘れないでください。
私の機械学習とデータサイエンスの旅の最新情報を入手するには、LinkedInとInstagramで私をフォローしてください!最後まで読んでくれてありがとう。あなたは素晴らしいです!✌️
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- 「GPTCacheとは:LLMクエリセマンティックキャッシュの開発に役立つライブラリを紹介します」
- Amazon SageMakerとAmazon Rekognitionを使用して、画像内の車の位置を検出するためのコンピュータビジョンモデルを構築してトレーニングする
- 「機械学習の未来:新興トレンドと機会」
- 「マッキンゼー・レポートからの5つの重要な洞察:創発的AIの未来への影響」
- このAI論文は、大規模なビジョン・ランゲージ・ナビゲーション(VLN)トレーニングのための効果的なパラダイムを提案し、パイプライン内の各コンポーネントの影響を定量的に評価しています
- AIシステム:発見されたバイアスと真の公正性への魅力的な探求
- GoogleのSymbol Tuningは、LLM(Language Learning Models)におけるIn-Context Learningを行う新しいFine-Tuningテクニックです