8.1 機械学習の未来

機械学習がなければ、解釈可能な機械学習はあり得ません。 それゆえ、解釈性について語る前に、機械学習がどの方向へ向かっていくか推測する必要があります。

機械学習(もしくはAI)は非常に有望であり、多くの期待が持たれています。 ですが、あまり楽観的ではない事柄から始めましょう。 科学は多くの魅力的な機械学習ツールを開発していますが、私の経験上、それらを既存のプロセスやプロダクトに組み込むことは非常に困難です。 その理由としては、不可能ではないにしても、企業や機関がキャッチアップするのに多くの時間がかかるからです。 現在AI全盛期のさなかで、企業は「AI研究所」「機械学習部門」を開設し、「データサイエンティスト」「機械学習エキスパート」「AIエンジニア」などを雇っていますが、私の経験上現実は甘くはありません。 しばしば、企業は要求された形でのデータを持ってすらおらず、データサイエンティストは数か月もの間待ちぼうけの状態であったりします。 時には、データサイエンティストが決して応えられないようなAIやデータサイエンスに対する期待がメディアによって創り出されてきました。 そして、多くの場合、データサイエンティストを既存の構造やその他多くの問題にどのように組み込めばいいのか誰も知らないのです。 これにより、私の第一の予測が導かれます。

機械学習はゆっくりだが着実に成長していくでしょう。

デジタル化は先進的で、自動化への誘惑は常に我々を引っ張っていきます。 たとえ機械学習の適用への道のりが遅く、石のように不動であったとしても、機械学習は科学からビジネスプロセスや製品、実世界への応用に常にシフトしていきます。

どのタイプの問題が機械学習の問題として形式化できるのかを非専門家にわかりやすく説明する必要があるでしょう。 私は機械学習を適用するのではなく、レポートやSQLクエリを用いたExcel計算や古典的なビジネスインテリジェンスを行う高給取りのデータサイエンティストを多く知っています。 しかし、すでにいくつかの企業が機械学習の活用に成功しており、インターネットの大手企業が最前線で活躍しています。 機械学習をプロセスやプロダクトに取り込み、人々を訓練し、使いやすい機械学習ツールを開発するより良い方法を見つける必要があります。 機械学習はもっと使いやすくなると私は信じています。 私たちはすでに、機械学習が、例えばクラウドサービス(「サービスとしての機械学習」 - いくつかのバズワードを投げかけるだけ)を介して、より身近なものになってきていることを見ることができます。 機械学習が成熟したら - そしてすでにそのはじめの一歩を踏みだしていますが - 私の次の予測はこうです。

機械学習によって様々な物事がたきつけられるでしょう。

「自動化できる物は何であれ自動化されるであろう」という原則に基づき、可能な時はいつでもタスクは予測問題として定式化され、機械学習によって解決されるだろうと確信しています。 機械学習は自動化の1つの形であるか、少なくともその一部となり得ます。 現在人間の手によって行われてきた多くのタスクは機械学習に置き換えられています。 ここでは、機械学習を使って部分的に自動化を行うタスクの例を紹介します。

  • 分類 / 意思決定 / 文書の完成(例えば、保険会社、法律分野、コンサル企業)
  • 与信取引申請書などのデータ主導の意思決定
  • 新薬開発
  • 流れ作業の品質管理
  • 自動運転
  • 病気診断
  • 翻訳 この本においては、私はディープニューラルネットワークを搭載した (DeepL) という翻訳サービスを使って、英語からドイツ語に翻訳し、英語に戻すことで文章を改善しました。
  • ...

機械学習のブレイクスルーはより良いコンピューター / より多くのデータ / より良いソフトウェアだけでなく次のことによっても実現します。

解釈可能なツールによって機械学習の採用が触媒されること。

機械学習モデルの目標を完全には指定できないという前提に基づいて、誤って指定された目標と実際の目標の間のギャップを埋めるために、解釈可能な機械学習が必要であるということになります。 多くの分野やセクターで、解釈可能性が機械学習の採用のきっかけになるでしょう。 いくつかの逸話的な証拠があります。 私が話したことのある人の中には、他者にモデルを説明できないからと言って、機械学習を用いない人が多くいます。 解釈可能性によってこの問題に対処でき、機械学習は透明性を必要とする機関や人々にとって魅力的なものになっていくでしょう。 問題の誤った仕様に加えて、多くの業界では、法的な理由であれ、リスク回避のためであれ、根本的なタスクの洞察力を得るためであれ、解釈可能性が求められています。 機械学習によってモデル化プロセスは自動化され、人類はデータと根底にある問題から少しだけ離れた場所に行くことができます。 これによって、実験デザイン、学習データ分布の選択、サンプリング、データエンコーディング、特徴量エンジニアリングなどの問題が発生するリスクは大きくなります。 解釈ツールを使用することで、これらの問題点を簡単に特定できます。