share-knowledge’s diary

英語論文やニュース等で私が面白いと思ったものをアップしていきます。

畳み込みニューラルネットワーク

畳み込みニューラルネットワーク(Convolutional Neural Network)は生物の視覚野から発想を得たものでで、画像内の特徴を抽出して物体の認識を行います。例えば、私たちは犬の特徴、ネコの特徴等を無意識に認識して、犬の画像を見たときに、これが犬であることを認識します。単純な特徴としては、4本足で爪がある・・とかです。ただ、4本足で爪がある動物はたくさんいるため、より細かい特徴でもって、私たちはこれが犬だとか猫だとか認識するわけです。コンピュータも同様で、より細かい特徴(体の曲線等々)を見つけていくことで、画像を認識します。その仕組みを単純化すると、CNNでは、多くのフィルターを用いて、元の画像を3次元構造のデータに変換します。このデータにはフィルターにより抽象化された多様な特徴量が含まれています。このデータをニューラルネットワークに入力することにより、多数の特徴を踏まえて、この画像の物体が何であるかを確率として算出することができます。例えば、犬の画像をCNNで計算した結果、犬の確率95%、ネコの確率3%、ライオンの確率1%・・・・といった形で確率が算出され、犬と認識されるわけです。