【読書】「 機械学習のエッセンス 実装しながら学ぶPython、数学、アルゴリズム」の感想
「 機械学習のエッセンス 実装しながら学ぶPython、数学、アルゴリズム」を読みました。
本書は、機械学習の理論をPythonを実装しながら学ぶ本です。
機械学習やディープラーニングに数年触れてきながらも、理論はあまり理解していませんでした。理論を知らなくてもライブラリを使えば、ある程度何とかなってしまいます。
しかしながら、数多ある機械学習手法の違いが今一つ分からないため、少しは理論も理解しておきたいと思い、本書を手に取りました。
https://www.amazon.co.jp/gp/product/B07GYS3RG7www.amazon.co.jp
対象読者
- 機械学習の理論を勉強したい人
- 高校数学まで理解している人
本書は、ライブラリを使うだけでは満足できずその中身を理解したいという人に向けて書かれました
と、冒頭にも書かれています。 機械学習の中身を理解するにあたり数学が一番のボトルネックになることが多いと述べており、数学的な解説に紙面を多く割いています。
数学は、機械学習で使用する線形代数と微積分を主に扱っています。後半では大学レベルの線形代数が登場するため、数学が苦手な方には辛い内容でしょう。
本書の良かった点
その数学が何のために使われるのかが明確
本書は第1〜3章はPythonや数学の説明で、第4,5章からプログラムを書くことになりますが、第4,5章が良かったです。
数学好きな人には分からないかもしれないですが、数学って難しい割に何のために使うが分かりづらいんですよね。本書だと、説明されている数学は何のために使うのかが明確なのが良い点です。
手を動かしながら理論を学べる
「手を動かしながら」っていうのが大事です。数学って読んでるだけだと眠くなってくるのは、私だけでは無いはずです。
プログラムを動かしながら学べるというのは良いですね。理論が今一つ分からなくても、プログラムを実行してデータの中身を出力したりすると、理解できることもあります。
私は高校数学の成績はそれなりに良くて、大学でも数学は受講していましたが、本書の数学は難しく感じました。そのため、ネットで調べたりもしつつ読み進めました。そのため、読むのに時間はかかりましたが、そのぶん読んだ内容が身についたと感じています。
この本が扱っていないこと
本書の冒頭でも書かれていますが、実用例やライブラリを使ったテクニックには触れていません。
機械学習で今すぐ成果を上げたい人には向いていないと言えるでしょう。 また、プログラミングを一から始める方にもオススメできません。Pythonの環境構築・基本的な実装方法も記載されていますが、Pythonの入門書では無いので手取り足取り書かれているわけではありません。
終わりに
本記事では「 機械学習のエッセンス 実装しながら学ぶPython、数学、アルゴリズム」について書きました。
機械学習のアルゴリズム、特に数学を理解したい人向けに焦点を絞った本であり、私としては期待通りの内容でした。
扱わないことを冒頭で述べている時点で、この本良さそうだなと思いました。読み始めたあとに、自身はその本が対象とする読者ではなかったということは起こりがちです。ネットのレビューなどである程度は分かるのですけど、冒頭で述べてくれているとありがたいですよね。
機械学習をこれから本格的にやる人で、ライブラリは駆使できるけど仕組みはあまり理解していない、という方にオススメの本でした。
*1:Csaba NagyによるPixabayからの画像
【読書】「Kaggleで勝つデータ分析の技術」の感想
<「Kaggleで勝つデータ分析の技術」の感想>*1
※ 2020/08/30にQrunchで書いた記事を移行しました。
データコンペの1つであるKaggleの実践方法について書かれた「Kaggleで勝つデータ分析の技術」を読みました。
自分は趣味で機械学習周りのことに触れている身なのですが、Kaggleって何か面白そうだなと思い本書を購入しました。結果的に、Kaggle自体はチュートリアル以外あまり触れずで終わったのですが、本書は機械学習を行う上で色々と参考になりました。
https://www.amazon.co.jp/Kaggle%E3%81%A7%E5%8B%9D%E3%81%A4%E3%83%87%E3%83%BC%E3%82%BF%E5%88%86%E6%9E%90%E3%81%AE%E6%8A%80%E8%A1%93-%E9%96%80%E8%84%87-%E5%A4%A7%E8%BC%94-ebook/dp/B07YTDBC3Zwww.amazon.co.jp
良かった点
- Kaggleで役立つことに焦点を絞っている
- 網羅的でボリュームが多い
- ソースコードが載っている
目次を見て分かる通り、Kaggleの実践方法を体系的かつ広範囲に網羅しています。
理論は薄いのですが、その反面、具体的な実践方法に焦点を絞っています。Kaggleで勝つためのテクニックを教える、というコンセプトが明確で良いですね。
各節に簡単なソースコードが載っている点も分かりやすくて良かったです。
個人的に役に立ったのは、「第2章 タスクと評価指標」と「第3章 特徴量の作成」です。 これらは機械学習の精度を向上させるために重要なことなので、Kaggleに依らず参考になることが多かったです。
対象読者
本書の冒頭にも書いてありましたが「分析コンペに参加している人」「これから参加しようとする人」です。
理論やPythonの基礎的なことは割愛しているため、機械学習の心得が多少なりともある人が対象者です。なので、これから機械学習をゼロから勉強したいという人にはあまり向かないでしょう。
これからKaggleを始めたい機械学習経験者、Kaggle参加経験有りで更に上位を目指したい人にとってオススメの本です。
*1:Perfecto_CapucineによるPixabayからの画像