「線形代数からディープラーニングまで 7冊の本(2023年冬のアップデート)」

「線形代数からディープラーニングまで 7冊の本(2023年冬の最新情報)」

私のお気に入りの機械学習の本7冊

Photo by Laura Kapfer on Unsplash

2019年、Towards Data Scienceの初めてのブログ投稿で、私は私のお気に入りの機械学習の本5冊について書きました。これらの本は、基本的な線形代数から現代のディープラーニングまで、あらゆる側面をカバーしています。

それらは以下のものでした:

  • Linear Algebra Done Right by Sheldon Axler
  • Mathematical Statistics and Data Analysis by John A. Rice
  • Elements of Statistical Learning by Trevor Hastie et al.
  • Neural Networks and Deep Learning by Michael Nielsen
  • Deep Learning by Ian Goodfellow et al.

5冊の本で線形代数からディープラーニングへ

機械学習を学ぶための私のお気に入りの本

towardsdatascience.com

これらの5冊の本は、それぞれ独自の理由で非常に素晴らしいと思います。特に、私が学部生だった頃にデータサイエンスに興味を持たせたのは『Elements of Statistical Learning』でした。実際に、これらの5冊の本は私にたくさんのことを教えてくれましたし、彼らなしでは今の私とは異なる存在にはなっていなかったでしょう。

しかしこれらは私のお気に入りのデータサイエンスと機械学習の本の一部に過ぎませんでした。なので、この記事では7冊の本を紹介し、これらも同じく素晴らしく、仮想の本棚に追加する価値があると考えています。それぞれの本について、なぜそれらが素晴らしいか、私がそれらから学んだこと、読む際のアドバイスなどを紹介します。

さらに、これらの多くの本は最近アップデートされましたので、前のバージョンをすでに知っている場合には、新しいバージョンで何を期待できるかもお伝えします。

前回の記事と同様に、私が選んだ本は難易度が異なるため、まずは基本的な概念に焦点を当て、その後に進んで高度な機械学習の文献の領域に踏み込んでいきます。

それでは始めましょう…

Introduction to Statistical Learning by Trevor Hastie et al.

私の元のブログ投稿では、『Elements of Statistical Learning』という本を紹介しました。これはクラシックであり、最も影響力があり素晴らしい機械学習の本の一つと考えられています。

進行中の高度なトピックを網羅しているため、かなりアクセスしやすいといえますが、一般的には数学、特に統計のしっかりとした理解を前提としています。

そのため、同じ著者が『Introduction to Statistical Learning』も出版しました。これは『Elements of Statistical Learning』のよりアクセスしやすいバージョンであり、ほぼ同じトピックを扱っています(大部分)。「アクセスしやすい」と言っても、数学と統計の基礎的な要素は必要に応じて取り上げられているものの、本の主な焦点は読者の直感を養い、機械学習の統計的な手法がどのように機能するのかを理解することです。

私の意見では、これはデータサイエンスと機械学習を学ぶための最高の本です。データサイエンスを学び始める場合には絶対に読む必要があります。また、この本は世界中の大学で最高の入門データサイエンスコースの基礎となっています。

この本から学んだこと: 私の機械学習に対する多くの直感は、ESLとISLの読書から得られています。これほどこれらの概念をよく理解できる他の本はありません。特にクロスバリデーションやサポートベクターマシンなどのより高度な概念については、最初に理解するのが難しいかもしれません。

この本を読む際のアドバイス: データサイエンスに初めて触れる方は、順番に読んでください。各章で基礎的な要素を理解することが重要です。チャレンジが必要な場合は、対応するESLの章とISLRを並行して読むことができます。これによって、トピックを理解するだけでなく、エキスパートレベルの理解に瞬時に飛躍することができます。

この本には、練習問題を簡単に練習できるように R ライブラリ全体が付属しており、素晴らしい教育資源です。

最新版の新機能: この本のアップデートされた第二版が昨年リリースされました。前のバージョンに含まれていなかった完全に新しい章も含まれています。それらは主にディープラーニング、生存解析、および多重検定などの高度なトピックです。

さらに、今年になってもう一つのバージョンの本がリリースされましたが、今度は公式のPythonバージョンであり、元のバージョンは既に R を使用していることに触れました。

統計学習への入門

データ収集の規模と範囲がほぼすべての分野で増加し続ける中、統計学習は…

www.statlearning.com

Hadley Wickham らによるデータ科学のための R

R for Data Science という本もまた、非常に貴重なオープンソースの本です。データサイエンスの「全ゲーム」を学ぶことができます。データの取り込みからデータのクリーニング、モデルのトレーニング、結果の伝達まで、すべてがこの本で学べます。

この本はコーディングやデータサイエンスの事前知識を必要としません。ISLR(上記の本)と比較して、R for Data Science のアプローチはより実践的です。各章には多くのコードが含まれています。

また、この本では tidyverse を紹介し、重要に依存しています。tidyverse はデータサイエンスにおいてデザインが美しい R ライブラリのコレクションであり、もし Python から来て R でどのようにデータサイエンスを行うかを学びたい場合にも、素晴らしい(おそらく最高の)ガイドです。

この本から学んだこと: この本は R がデータサイエンスを行うための素晴らしい言語であり、学ぶための言語であることを証明しています。これは非常に実践的で、手を動かすことができるガイドです。特にデータ整形に重点を置いており、他の本(例えば ISLR)では取り上げられていない場合が多いです。私は今でもこの本から得たデータ整形の知識に頼っています。

この本の読み方: 最初から最後まで読んで、新たな知識や技術を驚くほど学ぶことができます。データサイエンスが初めての方には、間違いなくおすすめします。ただし、私にとっては最初のデータサイエンスの本ではなかったため、少し違うやり方で進めました。興味のあるトピックを選んで、対応する章を読むという風にしました。もしある程度のデータサイエンスの経験がある場合(たとえば Python の経験がある場合)、同じようにできます – 学びたいトピックを選び、対応する章を読むことで知識を深めることができます。各セクションは比較的独立しているため、簡単にできます。

最新バージョンの新機能: 今年、本の第二版がリリースされ、すべてのコード例が改訂されました。tidyverse はここ数年で急速に発展しているため、この本の改訂が必要でした。

R for Data Science(第2版)

これは「R for Data Science」の改訂中の第2版のウェブサイトです。この本でどのようにデータサイエンスを行うかを学ぶことができます。

r4ds.hadley.nz

(現在は完了しているはずの第2版にリンクしていますが、元の第1版はこちらで入手できます。)

機械学習のための数学 – Marc Peter Deisenroth et al.

機械学習に必要な数学を網羅的に学ぶための包括的な書籍をお探しの場合、「機械学習のための数学」は素晴らしい選択肢です。

機械学習は、線形代数、統計学、確率論、最適化など、数学のさまざまなサブフィールドに基づいています。したがって、すべてを学ぶためにはさまざまな教科書を参照することが一般的です。

この本を書く際の動機はまさにそれです – 機械学習に一般的に必要なすべての数学を一つの本にまとめることです。

この本から学んだこと: これは現代の数学の教科書なので、私は大学で関連するコースを取る際に参考にしました。主要な教科書ではありませんでしたが、いくつかの章は同じトピックをカバーしていたため、関連する章を読むことで理解を深めることができました。この本は良い説明がされており、汎用的な数学の教科書とは異なり、常に機械学習の概念と関連付けられています。また、アイデアを理解するのに役立つ素敵な可視化も含まれています。

この本の読み方:この本は数学の教科書ですので、数学の教科書として扱うのが最善です。線形代数、確率、統計、または数学に基づく機械学習のクラスを受講している場合、この本は追加のリソースとして役に立つでしょう。コースに合わせて章を選び、本が自分の学習に役立つかどうかを確認してみてください。

機械学習のための数学

mml-book.github.io

Andriy BurkovによるThe Hundred-Page Machine Learning Book

第一に、実際には100ページではなく多少多いです。しかし、それは本が約束したとおり、機械学習の主要な概念やメソッドの簡潔で包括的な概要ですので、そこには気にする必要はありません。

そのため、この本はデータサイエンスをゼロから学ぶためのリソースではなく、非常に実用的とは言えません。むしろ、重要な概念の簡潔な説明とそれらの背後にある数学と理論を提供することが目的です。

ですので、ある概念やメソッドを深く理解する必要がある場合には、素早くこの本でそれについて読むことができる、素晴らしい参考書です。

この本から学んだこと:私にとって、この本は時々自己確認の役割を果たしました。概念が最小限の説明から理解できる場合、そのトピックについての理解が十分にあると考えました。それがこの本の持つ意義だと思います。この本はデータサイエンスや機械学習をゼロから教えるわけではありませんが、心理的には、本を読んで概念やメソッドを要約することで、理解を固めることができるでしょう。

この本の読み方:この本は、機械学習の概念を簡潔にまとめた最高の要約の一つですので、私と同様に、この本を使用してトピックや概念の理解を確かめることをお勧めします。概念を理解できれば完璧です。そうでない場合は、より詳細に概念を説明する他の本(例:ISLRやESL)に戻る必要があるかもしれません。

The Hundred-Page Machine Learning Book by Andriy Burkov

Machine Learningについて知るために必要なすべてを百ページで学びましょう。教師あり学習と教師なし学習、サポートベクトル…

themlbook.com

Kevin MurphyによるMachine Learning: A Probabilistic Perspective

これはより高度な機械学習の書籍の一つです。Machine Learning: A Probabilistic Perspectiveはベイズ(確率論的)の視点から機械学習を取り扱っており、古典的で頻度論的な視点とは対照的です。

ベイズの機械学習は、事前知識と不確実性を学習プロセスに組み込む点で異なっています。その大きな利点の一つは、単一の点推定ではなく確率的な予測を生成できることです。

この本では、ガウス過程や変分推論など、他の書籍では説明されない高度なトピックにも触れています。これは、機械学習の知識をさらに高めるための素晴らしい本であり、異なる視点から機械学習を見ることができるでしょう。

この本から学んだこと:私は大学でベイズ機械学習のクラスを受けた際、これは参考文献の一部でした。例えば、ベイズ版の線形回帰やロジスティック回帰について学びました。また、本には期待最大化アルゴリズムについての素晴らしい章もあります。今でも、確率的な視点から手法を理解する必要がある場合には、この本に頼ることがあります。

この本の読み方:再度言いますが、これは古典的な教科書ですので、おそらくはコースの一部として遭遇するでしょう。しかし、教室の外でも、この本を使用してESLなどの他の書籍が教える多くの同じ機械学習手法を異なる視点で学ぶことができます。さらに、確率的なフレームワークでのみ意味をなす追加の手法も含まれています。これが初めてベイズ機械学習について学ぶ場合、この有益なトピックの本当の意義を理解するために、まずは序文を読むことをお勧めします。

機械学習

2013年デグルート賞受賞、国際ベイジアン分析学会授与 1104ページ、8インチ x 9インチ、300色…

mitpress.mit.edu

新しいバージョンの本の新機能:著者のケビン・マーフィさんは、2冊の追加の機械学習の本に取り組んでいます。ひとつは、確率的機械学習入門で、ディープラーニングに焦点を当てています。もうひとつは、そのもっと高度なバージョンで、確率的機械学習:応用範囲という題名です。

Pythonによるディープラーニング(フランソワ・ショレ)

Pythonによるディープラーニングは、ニューラルネットワークを理解(ただし単に学ぶだけでなく)し、Pythonを使って実装するための素晴らしい本です。

この本は、TensorFlowの上に位置するディープラーニングフレームワークKerasの作者であるフランソワ・ショレさんによって書かれています。ショレさんは傑出した著者であり、これは私の言葉ではなく、多くの人が同じように評価しています。彼はディープラーニングの様々な概念のメカニクスを説明する上で驚くべき仕事をしており、それらがどのように組み合わさって現在世界中で話題となっている分野の基礎を形成しているかを示しています(ChatGPTを思い浮かべてください)。

この本から学んだこと:この本では、ディープラーニングの考え方について学ぶために使いました。私は主にKerasについて学ぶためにこの本を使用しましたが、他の多くの部分(畳み込みニューラルネットワーク、ベストプラクティスなど)も何度も読み直すことがありました。私は既にこれらのトピックのほとんどを知っていたのですが、それらが見逃せないほど良かったので、深い学びの理解をさらに補強することができました。

本の読み方:ディープラーニングにまだ初めて取り組んでいる場合は、フランソワさんが非常に優れた著者であり、概念のモチベーションを説明する上で素晴らしい仕事をしているため、おそらく前から後ろに向かって読む本です。ディープラーニングにすでに経験がある場合は、特定のトピックの理解を向上させるために1つの章を選択することもできます。

第2版の新機能:今年の初めに第2版が発売されました。ディープラーニングは非常に速く進化しているため、本にはいくつかの更新が必要でした。また、新しい章やトピックも含まれています。たとえば、言語モデルやテキスト生成の最近の進歩をカバーするための新しいコンテンツが含まれています。また、Kerasも年々変わっているため、本も適応する必要がありました。

Pythonによるディープラーニング、第2版

前の版の電子書籍コピーが追加費用なしで付属しています。自動的に追加されます…

www.manning.com

(TensorFlow/Kerasではなく、PyTorchに焦点を当てた非常に似た本もあります。)

強化学習:入門(リチャード・サットン、アンドリュー・バートー)

確かに、この本はここではひときわ異なっていますが、最後のひとつとしては間違いなく価値があります。強化学習(RL)は、上記の本たちが教える機械学習に補完する絶対に魅力的な分野です。

もしもご存知でない場合、強化学習は、実世界またはシミュレーションされた世界と相互作用しながら学習することを目的とした、自律エージェントと意思決定に関するAIの分野です。

この本は、RLのクラスでの標準的な教科書であり、それについて学びたい場合には最も優れたもののひとつです。機械学習の知識は強化学習でも中心的な役割を果たすため、この本をケーキの上のチェリーと考えてください。

この本から学んだこと:たくさんあります。実際、これは私の大学の授業の1つのための本でもありました。実際、私はモンテカルロ木探索に関するコースプロジェクトを行い、MSc論文をコンテキスチュアルバンディットに関して行いました。どちらもこの本で非常によく説明されています。これらは非常に興味深くて強力なRL(強化学習)手法です。

この本の読み方:おそらくこれも前から後ろへと読む本です。なぜなら、章は非常に連続的に展開されているからです。重要なことは、この本を読む前に機械学習やディープラーニングに非常に良い理解を持っていることです。なぜなら、RLの多くの概念はそれらに基づいているからです。

まだこの本の新版はありませんが、私に尋ねるならば、もうそろそろ新版を出して欲しいです。この分野では過去数年間で多くの変化があり、それは最新の言語モデルに影響を与えています(例えば、人間のフィードバックやRLHFからの強化学習を通じて)。その本を最初に読むのは確かであります。

強化学習:イントロダクション | MIT Press eBooks | IEEE Xplore

強化学習は、人工知能の最も活発な研究分野の一つであり、計算機によるアプローチです…

ieeexplore.ieee.org

概要

これらの7冊の書籍は、元のブログ投稿から追加された5冊と共に、この分野で見つけることのできる最高のものの一部です。私は(仮想の)本棚の選定に多くの時間を費やしているので、自信を持って言えます。最良な部分は、ほとんどの書籍がオンラインで無料で入手できることです。

私はこの分野が非常にオープンで知識に自由かつ容易にアクセスできることに感謝しています。これは十分に語られず、時には当然と考えられているかもしれませんが、そうではありません。

最後に私から1つのヒントがあるとすれば、私は常に同じ概念を学ぶために複数の情報源を使用することが好きです。異なる本(またはコース、ビデオ、チュートリアルなど)は、トピックを教えるためにわずかに異なるアプローチを取る場合があります。それは複数の教師がいるようなもので、1人があなたの頭で理解できるようにしてくれます。そして、それが起こると、他の人たちが言っていたことも理解することができます。それによって非常に深い理解を得ることができると思います。

読んでくださってありがとうございます。私は本投稿をお楽しみいただけたし、本が学習のどの段階にあるかに関係なく役立つと思います。

もし考えや質問があれば、コメントまたはLinkedInでお気軽にお問い合わせください。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more