さあ!AIに「眼」を与えよう。~プーリング層について~
皆さん。こんにちは!
今日も張り切っていきましょう!
ここ最近のブログでは主にCNNについて説明していて前回は「畳み込み層」について
お話ししました。一言で復習すると
畳み込み層は画像の局所性を利用し特徴量を抽出している
そんなところでしょうかね
畳み込み層の知識を使うので 畳み込み層を確認しておきたい人は
こちらを参照していただければなと思います。
今日のブログでは「プーリング層」について説明していきます
〜今日の内容と参考文献〜
プーリング層って?+大事なこと
プーリング層は畳み込み層の次に配置される層で畳み込み層から得られた画像を
各領域に区切って領域内の特徴量の最大値や平均値を求め、それらを並べて
新たな画像を作るところです。
区切った領域内の特徴量の最大値を求めることを
MAXプーリングといい
特徴量の平均値を求めることを
平均プーリングといいます。
プーリング層において大事なことは
MAXプーリングや平均プーリングを用いて領域内から特徴量を選出しています。
このため
多少画像がズレたり変化しても結果が同じになる
ところです。これは位置に対しての感度が低いということなので
視覚の役割を持つ眼の複雑型細胞と同じような性能がある
とも言えます。
視覚についてのブログが上がってますので、見ていない方はぜひそちらを参考にして見て下さい。
次にプーリング実例を見ていきましょう
プーリング層が新たな画像を生成するまで
この例では畳み込み層から得られた6x6の画像を
2x2の領域に分けプーリングしているので3x3
の画像が生成されています。
ここではMAXプーリングで抽出していていますね。
皆さんお気づきかと思いますがプーリング層でも画像は縮小されていますね。
これにより計算量を減少させることが可能になります
さらに畳み込み層の様にチャンネルごとに分解させたり合流もありません。
なので
最初のチャンネル数=出力のチャンネル数
となります。
チャンネル数はあまり気にしなくても大丈夫そうです。
参考文献・サイト
はじめてのディープラーニング -Pythonで学ぶニューラルネットワークとバックプロパゲーション- (Machine Learning)
- 作者: 我妻幸長
- 出版社/メーカー: SBクリエイティブ
- 発売日: 2018/08/28
- メディア: 単行本
- この商品を含むブログを見る
次回もぜひ見て下さい。
それでは