マシンラーニングのロードマップ:コミュニティの推奨事項2023

マシンラーニングのロードマップ2023

機械学習のロードマップ。著者による画像生成。

ロードマップ

前回の記事、このロードマップの第1部では、機械学習の出発点と方向について簡単に説明しました。初心者が堅固な基盤を築くのに役立つ簡単な計画について話しました。これについて話した後、記事の最後で、LinkedInでいくつかのアンケートを実施して、コミュニティからの新参者への提案を調査していました。

初心者のための基本的なフローチャート。著者による画像作成。

例えば、私はLinkedIn上の機械学習グループに、初心者がどこから始めるべきか、機械学習理論や線形代数、統計などの最良の学習リソース、そして初心者に最適な出発点について質問しました。これらの結果をまとめるために時間をかけた後、ついにこの記事を通じてそれらを発表します。それでは、時間を無駄にせずに記事に入っていきましょう。

旅の始め方

前回のロードマップでは、Pythonプログラミングで始めて、数学を進めていくことを提案しました(基本的な数学をすでに知っている場合)。ただし、どこから始めるのが良いかについても知りたかったので、良い出発点を尋ねました。Pythonプログラミングのコアではなく、機械学習コースについて尋ねたのは、それがより良いと考えたためです。

最初の質問として、どこから旅が始まったのか、どのリソースを参考にしたのか、どの領域に焦点を当てたのか、基礎の数学から始めたのか、直接機械学習やディープラーニングに取り組んだのか、経験と洞察を得た今、新たに始めたい人々に何をお勧めしますか、と尋ねました。

もっと話す前に、アンケートの結果を見てみましょう。

初心者のための基本的なフローチャート。著者による画像作成。

アンケートの結果を見ると、ほとんどの人がオンラインまたは対面のクラスを受講して始めたことがわかります。それは普通であり、2番目のアンケートも同じだと思いました。しかし、人々に提案してもらったところ、プロジェクトを行うことから始めることを提案されました。

また、同じくらいの人数が数学から始めるべきだと言っています。これを見ると、いくつかの理由とコミュニティの意見を考え出しました。以下に、MLクラスではなくプロジェクトから始めることをおすすめしない理由のいくつかを挙げます。

  • プロジェクトは初心者に実践的なトレーニングを提供し、彼らのミスから学び、特にKaggleのようなサイトでの協力作業を容易にします。
  • コースは依然として明確なスタート地点を提供していますが、ほとんどのコースはあいまいすぎるか学術的すぎて、現在の需要に合わせて更新する必要があります。
  • 数学のバックグラウンドを持たない学生は、フードの裏側で何が起こっているのかを理解するために、整理された数学と基本的な統計が必要です。
  • 評価には多肢選択問題とライブプロジェクトが含まれるべきです。

これ以外にも、さまざまな理由が考えられます。ただし、これらのポイントが最も多くの理由に貢献しています。

Pythonの学習を始める場所

では、描いたロードマップに戻りましょう。そのロードマップでは、Python、数学、SQLの水平な重要性が示されています。Pythonから始め、次のレベルの概念に進む前に、それぞれの側面を詳しく調べていきます。

Pythonは、機械学習愛好家にとって最もおすすめの出発点の一つであり、幅広い柔軟性を提供します。Pythonでは、データをスクレイピングし、データをクリーンアップして前処理し、クリーンアップされたデータでモデルをトレーニングし、Webアプリケーションにデプロイし、デプロイされたアプリケーションの状態をカスタムダッシュボードで監視することができます。Pythonだけでプロジェクトを終始まで取り組むことができます。

柔軟性に加えて、Pythonは理解するのが比較的簡単な言語の一つです。覚えておく必要があるのはコロン(:)とインデントだけで、それからあなたは始めることができます。

Pythonがおすすめの理由についてはすでに話しましたので、始めるためのおすすめのものについて考えてみましょう。

Pythonコースのコミュニティのおすすめ。著者による生成された画像。

初心者に最もおすすめされているのは、ミシガン大学のPython for Everybody Specializationです。これはCourseraの5コースのスペシャリゼーションで、購入またはオーディットすることができます。私自身もチャールズ・セヴェランス教授のDjangoコースを受講しましたが、彼の教え方については迷うことはありません。コースの詳細はこちらでご確認いただけます。

Python for Everybody Specialization, Coursera. Coursera.orgから取得した画像

これに加えて、CodeWithHarry、CodeBasics、Codanics、Corey Schafer、Teluskoなどのさまざまなチャンネルのお気に入りのYouTubeプレイリストや、DataCamp、ハーバード大学のCS50、Packtおよび他の出版社から発行されたPythonの書籍などが人々におすすめされました。

数学を学ぶにはどこがいいですか?

数学は幅広い領域の1つです。私たちは3つの側面に焦点を当てています:線形代数、微積分、統計学です。初心者レベルの線形代数と統計学についてさらに詳しく聞きましたが、高校レベルの微積分(特に連鎖律)は旅の初めのほとんどの部分には十分です。

線形代数

機械学習のほとんどは線形代数と統計学の組み合わせです。私たちが機械学習で行うことのほとんどは、高次元データを解釈可能な低次元に変換することです。私たちは線形代数を使用して、この高次元データを視覚化し操作します。

以下は、機械学習愛好家からのおすすめです。

線形代数の投票結果。著者による生成された画像。

詳細な線形代数の学習に関しては、MIT OCWの18.06線形代数(Gilbert Strang教授)が主なおすすめです。ただし、このコースの深さはまだMLの旅を始めたばかりの人々には適していません。投票結果からは、初心者にはKhan AcademyやDeepLearning.aiのコースがより適したスタート地点として反映されています。

これらに加えて、線形代数のための最も一般的なおすすめの一つは、3Blue1Brownチャンネルのプレイリストです。時間が少ない場合は、3Blue1Brownをおすすめします。線形代数に関しては、これがよりおすすめのリソースの一つです。

確率と統計

確率と統計は機械学習とMLのプロフェッショナルのキャリアにおいて基礎的なものです。初期段階では深い知識は必要ありませんが、長期的には統計の壁に直面することになります(マネジャーの役割ではなく、技術的なMLの分野で働くことを前提としています)。したがって、基本的な基礎を築き、各モデルの統計的な視点を理解することは、この分野を進むにあたって重要な要素の一つです。

では、コミュニティがおすすめするものを見てみましょう。

統計のスタート地点に関するコミュニティのおすすめ。著者による生成された画像。

コミュニティのおすすめに基づいて、StatQuestとDeepLearning.AIの確率統計コースの投票数が同じです。Courseraのスペシャリゼーションについてはすでに話しましたので、StatQuestのプレイリストを見てみましょう。

このプレイリストの最も重要なハイライトは、ジョシュ・スターマーが教える方法のシンプルさです。彼はトピックを小さな一口サイズのピースに分割し、簡略化されたスタイルで説明します。これにより、あなたの学習の旅がよりモジュール化され、便利になります。

Statquestを推奨する理由についてもっと知りたい場合は、以下のRedditのディスカッションを参照してください。以下は会話の一部です。

StatQuestに関する意見の一部、Reddit.comからのスクリーンショット

ストラクチャードクエリ言語(SQL)

SQLはデータサイエンティストにとって論争の的となるトピックの一つです。働く場所やドメインによっては、数ヶ月間SQLを全く使わないこともあります。詳細に入ると、画像、ビデオ、音声などのサンプルに重点を置いたチームに配属された場合、SQLはほとんど使用しないでしょう。ただし、レコメンデーションシステムやその他のアプリケーションの一部では、SQLを使用する必要があるかもしれません。したがって、アプリケーションに依存します。(これはデータサイエンスやデータエンジニアリングよりも機械学習に焦点を当てたロードマップです。したがって、この議論は短くなります)。

しかし、面接では必ずSQLについて話すことになるでしょう。そのため、基本的なアイデアを持っている方が良いです。以下はコミュニティからの推奨事項です。

初心者向けのSQLのおすすめ。画像は筆者によって作成されました。

推奨事項は非常に明確であり、ほとんどの人がCourseraの「Data Science向けSQLコース」をおすすめしており、少数派の人がコメントでDataCampから始めることを勧めています。私はSQLにはDataCampを使用したので、このコースや推奨事項について正確な意見を述べることはできません。私の推奨事項について詳しく知りたい場合は、このロードマップのパート1を参照してください。

最後に…機械学習。

おそらくこのセクションについては紹介の必要はありません。おそらく機械学習のロードマップを見るためにこの記事をクリックしたでしょう。したがって、機械学習の旅を始めるための推奨事項を見てみましょう。

LinkedInコミュニティによる初心者向けの機械学習のおすすめ。画像は筆者によって生成されました。

ここで混乱する必要はありません。機械学習を始めたい人で、複雑な数学と統計を含む高度に理論的な方法を進む気がない場合は、直接Courseraの「機械学習専門化コース」を始めることができます。これは最高のスタート地点の一つであり、なぜこれが最高なのかを誰でも説明できます。

学習の旅の後半では、もっと理論的な導入が必要な場合は、Prof. Andrew NgのYouTubeのCS229プレイリストが役立ちます。したがって、周りを見回す必要はありません。さらに情報が欲しい場合は、さまざまなリソースを確認するか、再びこのシリーズのパート1をチェックしてください。

ボーナス:就職 vs 機械学習における大学院の選択肢?

最近卒業した学生として、この決断に困りました。Mlまたはデータサイエンスの修士号を選ぶか、仕事をして実践的に学ぶか、完全に混乱していました。そして実際には、これはMLで働く多くの学生の混乱です。したがって、これは複数の人の意見が必要な質問の一つだと思いました。(この投票の回答は非常に大きく、調査終了時点で約500人の専門家が投票しました)。では、専門家たちは最終的にどのような推奨をしましたか?

ML愛好家向けの修士号 vs 就職の推奨事項。画像は筆者によって生成されました。

ここから、人々は高等教育を追求するよりも働くことを推奨されることがわかります。ただし、それにはデメリットもあります。学士号を取得した後の就職は非常に困難です、特に修士号を持つ人々も同じポジションに応募するからです(昨年の面接で同じ理由で私も不採用になりました)。逆に、修士号を取得した後に専門領域に入る人は、より学術的な環境に慣れているため、生産環境に適応するのにより多くの時間が必要です。したがって、どちらが自分にとってより良いかを考慮し、評価した上で決断をする必要があります。

これで、ロードマップのすべての分野をカバーしました。これらの調査を行い、複数の調査結果をまとめるのに3週間かかりました。この記事が役立つと思われる場合は、世界中のウェブ上でさらに興味深い記事が投稿されたときに通知を受け取るためにサインアップしてください。

一方で、私はNLPの専門化を始め、興味深いプロジェクトに取り組んでいます。学んだことに基づいて、NLPに関する記事シリーズを作成する予定です(すでにやりました!)。それらを直接メールボックスに受け取るために、サイトに登録することを忘れないでください。

私の機械学習とデータサイエンスの旅の最新情報を入手するには、LinkedInとInstagramで私をフォローしてください!最後まで読んでくれてありがとう。あなたは素晴らしいです!✌️

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

韓国のこの人工知能(AI)論文では、FFNeRVという新しいフレーム単位のビデオ表現が提案されていますフレーム単位のフローマップと多重解像度の時空グリッドを使用しています

最近では、ニューラルネットワークを用いて座標を数量(スカラーまたはベクトル)にマッピングして信号を表すニューラルフィ...

機械学習

「ビジュアルAIがカナダ最大かつ最も賑やかな空港で飛躍する」

カナダのオンタリオ州にあるトロントピアソン国際空港は、年間約5000万人の旅客にサービスを提供する国内最大かつ最も混雑し...

データサイエンス

「データサイエンス、機械学習、コンピュータビジョンプロジェクトを強化する 効果的なプロジェクト管理のための必須ツール」

「機械学習またはデータサイエンスのプロジェクトは非常に大規模であり、多くの種類のファイルや多様なアーキテクチャを含ん...

データサイエンス

「スコア!チームNVIDIAが推薦システムでトロフィーを獲得」

4つの大陸に広がる5人の機械学習のエキスパートで構成されるクラックチームが、最先端の推薦システムを構築するための激しい...

人工知能

「2023年に試してみることができるChatGPTのトップ22の代替品(無料および有料)」

ChatGPTは、さまざまなタスクにおいて最も有名で一般的に使用されているAIツールです。さまざまなコースや教材があり、その潜...

データサイエンス

「EU AI Actについて今日関心を持つべき理由」

「MLおよびAI業界で働く私たちのほとんどは、新しい規制に関する見出しを見て流し読みするでしょう新しい規制は『法律用語』...