Chapter 6 例示に基づいた説明手法

例示に基づいた説明手法では、データセットにおける特定のインスタンスを用いることで、機械学習モデルの振る舞いや、データの分布を説明できます。

例示に基づいた説明手法の大部分は、任意の機械学習モデルをさらに解釈可能なものにできるため、モデル非依存の手法と言えます。モデル非依存の手法 (model-agnostic methods) で紹介したものと異なる部分は、例示による方法は、feature importance や partial dependence のように特徴量の要約をするものではなく、データセットにおけるいくつかのインスタンスを選択することでモデルを説明するという点です。例示に基づいた説明手法は、データのインスタンスを人間が理解できる方法で表現できる場合のみ効果があります。この手法は、直接表示できるため、画像に対して有効です。一般的には、例示に基づいた手法は画像や文章のように、特徴量がより多くの文脈を持つ場合、すなわちデータが何らかの構造を持つ場合、有効な手段となります。非常に多くの、かつ構造を持たない特徴量から構成されるような表形式のデータを表現することはより難しくなります。 1つの要素を表現するのに全ての特徴量を用いることは多くの場合効果的な手段ではありません。この手法は、データを表現する特徴量が少ししかない場合や、要素を何らかの方法で要約できる場合に上手く機能します。

例示に基づいた説明手法は、人間が機械学習モデル及び機械学習モデルが学習するデータを想像するのに役立ちます。特に、複雑なデータ分布を理解するときに有益です。しかし、例示に基づいた説明手法というのは具体的にはどのようなことなのでしょうか。実は、私たちはこれらの手法を日々の仕事や生活の中でよく使っています。まず例をいくつか考えてみましょう。⁵⁰

ある医師が普通ではない咳と微熱の症状のある患者を診察している場合を考えましょう。患者の症状から、医師は数年前診察した同様の症状をもつ患者を思い出しました。そこで、医師は目の前にいる患者が同じ病気であることを疑い、この病気を検査するための血液検査をしました。

次に、あるデータサイエンティストが自身の顧客の新しいプロジェクトに取り組む場合を考えます。そのプロジェクトは、キーボードを生産する機器の誤作動に繋がるリスク要因を分析するというものです。このデータサイエンティストは似たようなプロジェクトに取り組んだことがあることを覚えており、同様の分析を顧客が望んでいると考えて前のプロジェクトのプログラムを一部再利用しました。

最後に、とある子猫が燃えさかる無人の家の窓枠に座っている状況を考えましょう。消防隊は既に到着しており、そのうちの一人が子猫を助けるため危険を犯して建物に入るべきだろうかと考えをめぐらせました。しかし、この消防士は今までの経験で似たような状況に出会ったことがあったことを思い出します。古い木造の家はしばらくの間ゆっくりと燃えた後、多くの場合不安定になり最終的に倒壊してしまっていたのです。これらの状況を照らし合わせ、この消防士は家が崩れる危険性が高すぎると考え、家に入らないことにしました。幸運にも子猫は窓から飛び出してきて上手く着地し、この火事により被害を受けた人はいませんでした。ハッピーエンドです。

これらの例は人間がどのように例やアナロジーを考えるかを示しています。例示に基づいた説明手法は、基本的に「BはAと似ており、AはYの原因であるから、Bも同様にYを引き起こすと予測する」という考えを用いています。暗黙のうちに、いくつかの機械学習の手法は、これに基づいて動作しています。決定木は予測のために重要な特徴量の類似性に基づいて、データをノードに分割していきます。決定木は、新しいインスタンスに対して、似たインスタンス(同じ終端ノードに属する)を発見し、それらの平均値を予測値として返すという動作をします。また、k近傍法（knn）は、まさに、例示に基づく予測方法です。新しいインスタンスにたいして、knn は k 個の最近傍を求め (例えば、k=3 のインスタンス)、それらの平均を予測値として返すように動作します。 knn の予測は、k 近傍を返すことで説明可能です。ただし、個々のインスタンスを表現する良い方法がある場合のみ、有効な手段になります。

この章では、以下の例示に基づく説明手法について説明します。

反事実的説明(Counterfactual explanations)では、あるインスタンスの予測を大きく変化させるためには、どのように変更する必要があるかを示します。反事実的なインスタンスを作成することによって、モデルがどのように予測するかが分かり、個々の予測を説明できるようになります。
敵対的サンプル(Adversarial examples)は、機械学習モデルを騙すために用いられる反事実です。これは、予測を説明することが目的ではなく、間違った予測をさせることが目的となります。
プロトタイプ(Prototypes)は、データから選択された代表的なインスタンスの集合であり、クリティシズム(criticism)は、それらのプロトタイプではうまく表現できないインスタンスのことを言います。⁵¹
Influential instancesとは、予測モデルのパラメータや予測そのものに最も影響を与えた学習データのインスタンスを指します。Influential instance は、データそのものの問題の発見や、モデルのデバッグ、モデルの振る舞いをより解釈可能なものとするために役立ちます。
k近傍モデル：例示に基づいた（解釈可能な）機械学習モデル

Aamodt, Agnar, and Enric Plaza. "Case-based reasoning: Foundational issues, methodological variations, and system approaches." AI communications 7.1 (1994): 39-59.↩
Kim, Been, Rajiv Khanna, and Oluwasanmi O. Koyejo. "Examples are not enough, learn to criticize! Criticism for interpretability." Advances in Neural Information Processing Systems (2016).↩