【ニュース解説】 AIで大腸がん見逃し防ぐ
最終更新日: 2017/09/16 5:07pm
こんにちは。経理の小高です。
昨日の朝、ニュースで「AIで大腸がんの見逃しを防ぐ」という記事が詳解されていました。
内視鏡検査で24%程度(!!)見逃すリスクがあるところ、国立がん研究センターとNECが共同で開発を進めているこのシステムでは98%の確率で発見できたとのこと。
上の記事では5000例をサンプルにしたと書いてありますが、テレビのニュースでは14万枚の内視鏡画像を読み込ませたといっていました。
「AIで」という気になる部分について解説するのが今回のブログの目的です。
この「AIで」という部分は「深層学習というアルゴリズムを使って」と同じ意味です。注目されているAI技術(画像認識、音声認識、自動操縦、アルファ碁などなど)は、大抵が深層学習(ディープラーニング)というアルゴリズムを用いています。
世界中の研究者やコンピュータ技術者が寄ってたかって改良を繰り返しているため、深層学習について一般論を論じることはできないのですが、以下の図ような中間層をもつニューラルネットワークをディープニューラルネットワーク、このネットワークを学習する(ネットワークのパラメータを推定する)ことを深層学習(ディープラーニング)といいます。
図1:ディープニューラルネットワーク
ここで「ニューラルネットワーク」という言葉は、脳の神経を表す「ニューロン」と「そのネットワーク」という意味です。つまり、ニューラルネットワークは脳をモデル化したものです。上の図でノードと書いた丸とそこから伸びる矢印が1つのニューロンを表しています。
理化学研究所のウェブサイトによれば、ニューロンは脳全体で千数百億個もあるそうです。
「計算可能な範囲でできるだけ脳の似せたモデルを作ろう」というのがニューラルネットワーク、ディープニューラルネットワークです。ここで「計算が可能な」というのは「アルゴリズムが作成できる」、「許容できる時間内にコンピュータで計算できる」という意味です。
「ニューラルネットワーク」は私が学生時代(90年前後)に第2次ブームがあり、現在のブームが第3次ブームと言われています。アクセスできるデータが増えた(ビッグデータ)こと、CPUやGPUの発展でコンピュータの処理能力が指数関数的に上昇してきたこと(ムーアの法則)、そして、ディープニューラルネットワークを計算するアルゴリズムにブレークスルーがあったこと。これらが第3次ブームを引き起こしました。
第3次ブームのきっかけとしてよく引き合いにだされるのが、2012年のILSVRC(ImageNet Large-Scale Visual Recognition Challenge)コンペティションです。
このコンペは、画像に移っている対象物のカテゴリーを判別することを競うもので毎年開催されています。
図2:画像分類 出典:Krizhevsky, et al. (2012) ImageNet Classification with Deep Convolutional Neural Networks
アルゴリズムとプログラム(とコンピュータ)を持ち寄って、1000カテゴリーの画像(各カテゴリーに1000枚)でモデルを学習し、学習したモデルで新たな画像のカテゴリーを予測し、誤判別の少なさを競います。誤判別は「コンピュータが予測するトップ5のカテゴリーに正解がなかった(Top5エラー)」、「コンピュータが予測するトップのカテゴリーが正解ではなかった(Top1エラー)」によって競います。上は予測のサンプルです。画像の下に正解のカテゴリー、下にコンピュータの予測する5つのカテゴリーが併記されています。右上画像の正解はレパードなのですが、コンピュータも(ジャガーがチータやスノーレパード)を抑えてトップにレパードを挙げています。
ILSVRCに持ち寄るアルゴリズムやモデルには手法的な制約がないのですが、2012年のコンペで、ディープニューラルネットワークを使ったチームが2位に10ポイント(誤判別率で10%)以上の差をつけてぶっちぎりで優勝しました。(Top5エラーが15.3%)
このときのモデルはAlexNetと呼ばれ以下のような構造をしています。(複雑に見えますが、本質的には図1のネットワークと同じです)
図3:AlexNet 出典:Krizhevsky, et al. (2012) ImageNet Classification with Deep Convolutional Neural Networks
その後もモデルが様々に改良され、2015年ではマイクロソフトのチーム(ResNet)が優勝し、その誤判別率は3.6%だったとのこと。
図2をよくみると、犬の写っている写真はどう見てもダルメシアンの写真ですが、正解はサクランボです。ILSVRCにはこういう出題も含まれてますから、画像認識の世界ではすでに「人間よりコンピュータの方が間違いが少ない」とまで言われています。
なお、著名なモデルについては、以下のウェブサイトに詳しく掲載されています。
The 9 Deep Learning Papers You Need To Know About
ここまでで、ディープニューラルネットワーク(ディープラーニング)は「画像認識ととても相性の良いアルゴリズム」であることがお伝え出来たかと思います。
「AIで大腸がんを見つける」事例は、5000例(14,000枚)の画像でディープニューラルネットワークを学習し、学習したモデルで新しい患者さんの内視鏡画像を判定するものです。98%というのは驚異的な正答率とは思いますが、画像にILSVRCほどの多様性はないと思われるので、実現可能な数値かもしれません。
←「第1回AI人工知能EXPOに行ってきました。」前の記事へ 次の記事へ「平成29年8月 夏季休業のお知らせ」→