『AI入門』

Introduction to AI

AI プロジェクトの始め方

Vackground on Unsplash

背景

ここでは、AI の学習方法についての私の前の記事を読んでいることを前提としています。念のため、ML の学習には、ドキュメント以外の複数のリソース(教科書など)を参照することを強くおすすめします。特に、自分の学習レベル(初心者/中級/上級)に合わせた教科書を使用することをおすすめします。

AI エンジニアリングとは

AI エンジニアリングは、人工知能を現実の状況で応用するためのツール、システム、プロセスの開発に重点を置いた新しい学問分野です [1]。要するに、AI エンジニアリングは、AI 分野におけるソフトウェアエンジニアリングのベストプラクティスを応用することです。

AI vs. ML vs. DL

人工知能(AI)は、問題を創造的に解決するための知的なプログラムや機械の構築方法の研究です。これは常に人間の特権と考えられてきました。

機械学習(ML)は、明示的にプログラムされることなく、経験から自動的に学習し改善する能力をコンピュータシステムに提供するAIのサブセットです。MLでは、さまざまなアルゴリズムが問題の解決に役立ちます。

ディープラーニング(DL)は、人間の神経系に似た構造を持つニューラルネットワークを使用する機械学習のサブセットです。

しばしば人工知能と機械学習の用語の間で混乱が生じることがあり、これについては「AI プロセス」で議論されています。

大学院では、AIの授業では通常、コアとなる機械学習の概念(以前の授業でカバーされたもの)の簡単な復習を行い、その後、探索アルゴリズム、ゲーム理論、ベイジアンネットワーク、マルコフ決定過程(MDP)、強化学習などをカバーします。

MITによるAIとMLの概要

Source: Toward Data Science

プロジェクトの定義

AI プロジェクトの最初のステップは、問題の定義です。

以下を数文で説明してください:

  • 目標は何ですか? 分類、予測、検出、翻訳など。
  • データセットを説明してください。 入力特徴量と目標変数を含めて。
  • データの要約統計量、離散的またはカテゴリカルな特徴量および目標変数のカウントを含めて。
  • データセット全体を共有する意思があるかどうか。 データセットを共有できない場合は、SlackやDiscordなどのオープンなディスカッションフォーラムの使用を避けるべきです。

モデルの選び方

新しい AI エンジニアは、問題にどのモデルを使用するかを決める必要があることに気付くでしょう。

選択肢はたくさんありますが、通常は回帰モデルを分類モデルに変更したり、その逆を行うためにわずかな変更が必要です。

AI プロセスは、ほとんどの AI 問題に適用できる AI エンジニアリングプロセスを説明しています。

アルゴリズムの理解

特定の問題に対して使用可能なアルゴリズム、それらの動作方法、およびそれらを最大限に活用する方法を知る必要があります。ただし、アルゴリズムをゼロからコーディングする必要はありません。実際の世界の問題を解決するために、scikit-learn や TensorFlow などの堅牢なソフトウェアライブラリやフレームワークの使用方法を知ることがより重要です。

任意の有能なソフトウェアエンジニアは任意のアルゴリズムを実装できます。

経験豊富な AI/ML エンジニアであっても、データセット/問題に対するより単純なモデルのパフォーマンスを知っておく必要があります。

実際、AI アルゴリズムの動作方法やそれらを実装する方法を知ることよりも重要な概念が多数存在します(AI の学習方法のコアコンセプトを参照してください)。

追加のリソース

私は AI/ML のさまざまなトピックに関するノートやリンクが多数含まれる GitHub リポジトリ LearnAI を持っています。また、AI 学習リソースに関する VoAGI の記事もあります。

参考文献

[1] 人工知能エンジニアリング

[2] J. Brownlee, “Applied Machine Learning Process,” Machine Learning Mastery, 2014年2月12日.

[3] J. Brownlee, “How to Evaluate Machine Learning Algorithms,” Machine Learning Mastery, 2020年8月16日.

[4] Y. Hosni, “Brief Guide for Machine Learning Model Selection,” MLearning.ai, 2021年12月4日.

[5] M. LeGro, “Interpreting Confusing Multiple Linear Regression Results,” Towards Data Science, 2021年9月12日.

[6] E. Alpaydin, Introduction to Machine Learning, 第3版, MIT Press, ISBN: 978–0262028189, 2014年.

[7] S. Russell and P. Norvig, Artificial Intelligence: A Modern Approach, 第4版, Upper Saddle River, NJ: Prentice Hall, ISBN: 978–0–13–604259–4, 2021年.

[8] P. Bourque and R. E. Fairley, Guide to the Software Engineering Body of Knowledge, v. 3, IEEE, 2014年.

S. Raschka. and V. Mirjalili, Python Machine Learning, 第2版, Packt, ISBN: 978–1787125933, 2017年.

W. McKinney, Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython, 第2版, O’Reilly Media, ISBN: 978–1491957660, 2017年.

S. Bird, E. Klein, and E. Loper. Natural Language Processing with Python — Analyzing Text with the Natural Language Toolkit.

D. Jurafsky and J. H. Martin. 2008 (第2版). Speech and Language Processing. Prentice Hall. ISBN: 978–0131873216.

Y. Hosni, “End-to-End Machine Learning Workflow (Part 1),” MLearning.ai, 2021年12月11日.

Y. Hosni, “End-to-End Machine Learning Workflow (Part 2),” MLearning.ai, 2021年12月25日.

I. Kilic, “Data Science Terminology — AI / ML / DL,” VoAGI, 2021年12月31日.

C. Gulmez, “How to Become an AI Developer,” VoAGI, 2022年1月1日.

D. Gong, “Practical Guide to Linear Regression,” Towards Data Science, 2021年9月18日.

Y. Sandeepa, “Regression for Classification,” Towards Data Science, 2021年9月13日.

A. Iglesias Moreno, “End-to-end machine learning project: Telco customer churn,” Towards Data Science, 2021年11月23日.

M. Di Pietro, “Deep Learning with Python: Neural Networks (complete tutorial),” Towards Data Science, 2021年12月17日.

D. Poulopoulos, “How to start contributing to open-source projects,” Towards Data Science, 2021年10月30日.

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AIニュース

「AIのための機会の議題」

今日は、できる限り多くの人々に利益をもたらすための具体的な政策提言を提供するためのAI機会アジェンダを共有しています

機械学習

このAI論文は、概念関連伝播(CRP)を用いて、「どこ」や「何」を解き明かすための深層学習モデルの理解に新たなアプローチを提案しています

“`html 機械学習と人工知能の分野は非常に重要になっています。日々進歩している新たな技術があります。この領域はあら...

人工知能

「ビジネスを拡大するための25のChatGPTプロンプト」

「25個のChatGPTテンプレートのプロンプトをコピーして貼り付けすることで、あなたのビジネス(および収入)を次のレベルに引...

機械学習

トゥギャザーアイは、ShortおよびLongコンテキストの評価で最高のオープンソーストランスフォーマーに対抗する、StripedHyena-7Bという代替人工知能モデルを紹介します

AIと共に、シーケンスモデリングアーキテクチャへの大きな貢献を果たし、StripedHyenaモデルを導入しました。従来のトランス...

AI研究

このAI論文は、MITが化学研究のために深層学習モデルのスケーリングを探究しています

MITの研究者は、化学のための生成的事前トレーニングモデル(ChemGPT)とグラフニューラルネットワークフォースフィールド(G...

機械学習

マイクロソフトAIがLLMLinguaを発表:大型言語モデル(LLM)の高速推論のためのユニークなクイック圧縮テクニックでプロンプトを圧縮

大規模言語モデル(LLM)は、その高い一般化能力と推論能力により、人工知能(AI)コミュニティを大きく押し上げています。こ...