著者による序文
本書は、私が臨床研究で統計学者として働いていたときに、サイドプロジェクトとして始めたものです。 週に4日働き、「休みの日」にはサイドプロジェクトに取り組んでいました。 最終的に解釈可能な機械学習は私のサイドプロジェクトの1つになりました。 最初は本を書くつもりはありませんでした。 その代わり、私は単に解釈可能な機械学習についてもっと理解したいと思っていて、学ぶための良いリソースを探していました。 機械学習の成功と解釈可能性の重要性を考えると、このトピックに関する書籍やチュートリアルはたくさんあるだろうと予想していました。 しかし、私が見つけたのは関連する研究論文と、インターネット上に散らばっているわずかなブログ記事だけで、概要がよくわかるものはありませんでした。 本、チュートリアル、概要の論文は何もありませんでした。 このギャップに触発されて、この本を書き始めました。 私は結局、解釈可能な機械学習の研究を始めたときに利用できることを願っていた本を書くことになりました。 私がこの本を書いた意図は2つあります。それは自分自身のために学ぶためと、この新しい知識を他の人と共有するためです。
私はドイツのミュンヘン大学(LMU Munich)で統計学の学士号と修士号を取得しました。 機械学習に関する私の知識のほとんどは、オンラインコース、コンペティション、サイドプロジェクト、専門的な活動を通じて独学で習得しました。 私の統計学のバックグラウンドは、機械学習、特に解釈可能性の分野に入るための優れた基礎となりました。 統計学では、解釈可能な回帰モデルを構築することに主に焦点を当てています。 統計学の修士号を取得した後、私は博士号を取得しないことにしました。 修士論文を書くのが好きではなかったからです。 書くことがものすごくストレスだったのです。 そこで私は、Fintechのスタートアップ企業でデータサイエンティストとして、また臨床研究の統計学者として仕事をしました。 この3年間の業界での仕事の後、私はこの本を書き始め、数ヶ月後には解釈可能な機械学習の博士号を取得しました。 この本を書き始めることで、書くことの楽しさを取り戻し、研究への情熱をもつことができるようになりました。
本書は、解釈可能な機械学習の多くの手法を網羅しています。 最初の章では、解釈可能性の概念を紹介し、なぜ解釈可能性が必要なのかを動機付けています。 ショートストーリーもあります! この本では、説明の性質の違いや、人間が考える良い説明とは何かを論じています。 そして、本質的に解釈可能な機械学習モデル、例えば回帰モデルや決定木などについて論じます。 この本の主な焦点は、モデル非依存(model-agnostic)な解釈手法です。 モデル非依存な方法とは、どのような機械学習モデルにも適用可能であり、モデルが訓練された後に適用可能です。 モデルの独立は、モデル非依存な手法を非常に柔軟で強力なものにします。 いくつかの手法では、Local interpretable model-agnostic explanations(LIME)やシャープレイ値のように、個々の予測がどのように行われたかを説明します。 他の手法は、データセット全体のモデルの平均的な振る舞いを説明します。 ここでは、partial dependence plot, accumulated local effects, permutation feature importanceをはじめ、その他多くの手法についても学びます。 特別なカテゴリとして、データ点を説明として生成する例示による説明手法があります。 対事実的説明(Counterfactual explanations)、プロトタイプ(prototypes)、influential instances、敵対的サンプル(adversarial examples)が、本書で紹介されている例示による説明手法です。 本書は、解釈可能な機械学習の将来がどのようなものになるかについての考察で締めくくられています。
最初から最後まで読まなくても、行ったり来たりしながら、自分が最も興味を持った手法に集中して読むことができます。 私がお勧めするのは、序章と解釈可能性の章から始めることだけです。 ほとんどの章は似たような構成で、1つの解釈手法に焦点を当てています。 最初の段落でその手法を要約します。 そして、数式に頼らず、その方法を直感的に説明するようにしています。 それから、その手法の理論を見て、その方法がどのように働くのかを深く理解します。 理論には数式が含まれているでしょうから、ここでは惜しむことはありません。 私は、新しい方法は例を使って理解するのが一番だと考えています。 そのため、それぞれの手法を実際のデータに当てはめていきます。 統計学者は非常に批判的な人だと言う人がいます。 私にとっては、各章にそれぞれの解釈法の長所と短所について批判的な議論が含まれているので、その通りだと思います。 本書は手法の宣伝ではありませんが、ある手法があなたの応用に適しているかどうかの判断材料にはなるはずです。 各章の最後のセクションでは、利用可能なソフトウェアの実装が議論されています。
機械学習は、研究や産業界の多くの人々から大きな注目を集めています。 機械学習はメディアで過剰に宣伝されることもありますが、実際には影響力のあるアプリケーションがたくさんあります。 機械学習は、製品、研究、自動化のための強力な技術です。 近年では、機械学習は、例えば、詐欺的な金融取引を検出したり、視聴する映画をおすすめしたり、画像を分類したりするために使用されています。 そこで、機械学習モデルが解釈可能であることは非常に重要です。 解釈可能性は、開発者がモデルをデバッグして改善したり、モデルの信頼性を向上させたり、モデルの予測を正当化し、洞察を得るために役立ちます。 機械学習の解釈可能性の必要性が高まっているのは、機械学習の利用が増えたことによる自然な結果です。 本書は多くの人にとって貴重なリソースとなっています。 講師の方は、生徒に解釈可能な機械学習の概念を紹介するために本書を使えます。 私は、様々な修士課程や博士課程の学生から、この本が論文の出発点であり、最も重要な参考文献であることを教えてくれるメールを受け取りました。 この本は、生態学、金融、心理学などの分野で機械学習を使ってデータを理解しようとする応用研究者に役立ってきました。 産業界のデータサイエンティストは、『解釈可能な機械学習』の本を仕事に使っていて、同僚にも勧めていると話してくれました。 多くの人がこの本の恩恵を受け、モデル解釈の専門家になれることを嬉しく思います。
機械学習モデルをより解釈しやすくするための技術の概要を知りたい実務家の方にお勧めしたい一冊です。 また、このトピックに興味を持っている学生や研究者(他の誰にでも)にもお勧めします。 本書の恩恵を受けるためには、機械学習の基本的な理解をすでに持っている必要があります。 加えて、本書の理論と公式を理解できるように、大学入学レベルの数学的素養を持っている必要があります。 しかし、各章の冒頭にある手法の直感的な説明は数学なしで理解できるはずです。
ぜひ本書をお楽しみください。