「機械学習の謎を解く」
解く謎
伝統と変革:振り返りと展望
従来、コンピュータは明示的な一連の命令に従っていました。たとえば、2つの数を足すという簡単なタスクをコンピュータに実行させたい場合、すべてのステップを明示する必要がありました。しかし、データがより複雑になるにつれて、各状況に対して命令を与える手動のアプローチは不十分となりました。
ここで、機械学習がゲームチェンジャーとして登場します。私たちは、私たちが経験から学ぶように、コンピュータにも例から学ぶことを望みました。自転車に乗る方法を子供に教えると想像してみてください。数回見せてから落として、それを理解し、自分自身で学ぶようにします。それが機械学習のアイデアです。このイノベーションは、産業を変革するだけでなく、今日の世界では不可欠な必要性となりました。
基礎の学習
では、”Machine learning”という用語の基本的な理解ができたところで、いくつかの基本的な用語について理解を深めましょう:
データ
データは、機械学習の命を与えるものです。コンピュータが学ぶために使用する情報を指します。この情報は、数字、画像、またはコンピュータが理解できるその他のものです。これは以下の2つのカテゴリにさらに分けられます:
- トレーニングデータ:このデータは、コンピュータに教えるために使用する例です。
- テストデータ:学習後、テストデータと呼ばれる新しい見えないデータを使用してコンピュータのパフォーマンスをテストします。
ラベルと特徴
異なる動物を識別する方法を子供に教えていると想像してください。動物の名前(犬、猫など)がラベルであり、それらを識別するために役立つ特徴(足の数、毛など)が特徴です。
モデル
これは機械学習プロセスの結果です。データ内のパターンと関係の数学的な表現です。新しい場所を探索した後に地図を作成するようなものです。
機械学習の種類
機械学習には主に4つの主要なタイプがあります:
教師あり機械学習
これはガイド付き学習とも呼ばれます。正しい出力が既にわかっているラベル付きのデータセットを機械学習アルゴリズムに提供します。これらの例に基づいて、データ内の隠れたパターンを学び、新しいデータを予測または正しく分類することができます。教師あり学習内の一般的なカテゴリは以下の通りです:
- 分類:例えば、写真を猫や犬、メールをスパムまたは非スパムなどの異なるカテゴリに分類することです。
- 回帰:特定の特徴に基づいて家の価格、GPA、または売上の数などを予測することです。
教師なし機械学習
ここでは、事前のヒントなしにラベルのないデータがコンピュータに提供され、コンピュータが自分自身で隠れたパターンを探索します。パズルのピースの箱があり、絵がなく、似た絵をグループ化して完全な絵を作るというタスクを考えてみてください。クラスタリングは、教師なし学習の最も一般的なタイプです。似たようなデータポイントをグループ化します。たとえば、クラスタリングを使用して、似たような種類のソーシャルメディアの投稿をグループ化し、ユーザーは興味のあるサブトピックをフォローできます。
半教師あり機械学習
半教師あり学習は、ラベル付きとラベルのないデータセットの組み合わせを含み、ラベル付きのデータセットがデータ内のパターンを特定するためのガイドとして機能します。たとえば、シェフに使用する主要な材料のリストを提供しますが、完全なレシピは提供しません。レシピはないかもしれませんが、スタートするのに役立つヒントがいくつかあります。
強化学習
強化学習は、学習することによってもたらされるとも呼ばれます。環境と対話し、行動のペナルティとして報酬を得ます。時間の経過とともに、報酬を最大化し、良いパフォーマンスを発揮する方法を学びます。子犬のトレーニングをしていると想像してください。良い行動をしたときに報酬を与えて肯定的なフィードバックを行い、報酬を与えることで否定的なフィードバックを行います。時間の経過とともに、子犬は報酬につながる行動と、報酬につながらない行動を学びます。
高レベルの機械学習のプロセス
機械学習は、料理の芸術と同様に、生の異なる要素を深い洞察に変える魔法の能力を持っています。熟練したシェフがさまざまな材料を巧みに組み合わせておいしい料理を作るように、機械学習タスクを実行するために使用される6つの基本的な手順があります。
1. データの収集
データは重要なリソースであり、その品質は非常に重要です。多様な、より関連性の高いデータはより良い結果を生み出します。これはシェフが異なる市場からさまざまな材料を集めることと同様です。
2. データの前処理
ほとんどのデータは望ましい形式ではありません。洗浄、刻み、料理の前に材料を準備するように、データの前処理は学習プロセスのためにデータをクリーニングし整理する作業です。欠損データ、外れ値、不正な形式など、一般的な問題に直面することがあります。
3. アルゴリズムの選択
特定の料理にレシピを選ぶのと同様に、解決しようとしている問題に基づいてアルゴリズムを選択します。この選択は、利用可能なデータの種類にも影響される場合があります。
4. モデルのトレーニング
味が混ざり合うまで待つ料理のプロセスのように、モデルはトレーニングデータから学習します。学習率という重要な概念もここで重要な役割を果たします。学習率は、モデルが各トレーニングのイテレーションでどれだけ大きなステップを踏むかを決定します。一度にあまりにも多くの塩やスパイスを加えると、料理が強すぎるかもしれません。逆に、少なすぎると風味が十分に発揮されないかもしれません。学習率は、徐々に風味を引き出すための完璧なバランスを見つけます。
5. テストと評価
学習プロセスが終了したら、特別なテストデータを使用してテストします。まるで料理を味わい、見た目を検査してから他の人と共有するかのようです。一般的な評価指標には、精度、適合率、再現率、F1スコアなどがあります。問題に応じて適切な評価指標を選択します。
6. チューニングと繰り返し
料理を完成させるために調味料や材料を調整するように、より多くの変数を導入したり、異なる学習アルゴリズムを選択したり、パラメータや学習率を調整することでモデルを最適化します。
まとめ
基本的な機械学習の探求を終えるにあたり、コンピュータに最小限の人間の介入で学習し、意思決定を行う力を与えることが重要であることを忘れないでください。好奇心を持ち続け、次の記事に注目してください。そこでは、さまざまなタイプの機械学習アルゴリズムについてより詳しく掘り下げます。さらに探求するための初心者向けのリソースをいくつかご紹介します:
- Introduction to Machine Learning with Python
- Machine Learning For Absolute Beginners
- Machine Learning — Coursera
- Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow
Kanwal Mehreenは、医学の分野でのデータサイエンスとAIの応用に関心を持つ、将来有望なソフトウェア開発者です。Kanwalは、APAC地域のGoogle Generation Scholar 2022に選ばれました。Kanwalはトレンドのあるトピックに関する記事を執筆することで技術的な知識を共有することが好きで、テック業界における女性の表現力向上に情熱を持っています。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles