In der Bildverarbeitung ist ein Kernel, eine Faltungsmatrix oder eine Maske eine kleine Matrix. Sie wird zum Weichzeichnen, Schärfen, Prägen, zur Kantenerkennung und mehr verwendet. Dies wird durch eine Faltung zwischen einem Kernel und einem Bild erreicht.
In diesem Artikel werden einige Konventionen befolgt –
- Wir beziehen uns speziell auf 2D-Faltungen, die normalerweise auf 2-Matrix-Objekte wie Bilder angewendet werden. Diese Konzepte gelten auch für 1D- und 3D-Faltungen, sind aber möglicherweise nicht direkt korreliert.
- Während 2D-Faltungen wie 3X3-Faltungen auf Bilder angewendet werden, hat ein 3X3-Faltungsfilter im Allgemeinen immer eine dritte Dimension in der Größe. Dieser Filter hängt von der Anzahl der Kanäle des Eingangsbildes ab (und ist gleich). Wir wenden also einen 3X3X1-Faltungsfilter auf Graustufenbilder an (Anzahl der Kanäle = 1), während wir einen 3X3X3-Faltungsfilter auf ein farbiges Bild anwenden (Anzahl der Kanäle = 3).
- Wir werden uns auf alle Faltungen mit ihren ersten beiden Dimensionen beziehen, unabhängig von den Kanälen. (
Ein Faltungsfilter durchläuft alle Pixel des Bildes in der Weise, dass wir zu einem bestimmten Zeitpunkt das „Punktprodukt“ des Faltungsfilters und der Bildpixel nehmen, um einen Endwert zu erhalten. Wir tun dies in der Hoffnung, dass die Gewichte (oder Werte) im Faltungsfilter, wenn sie mit den entsprechenden Bildpixeln multipliziert werden, einen Wert ergeben, der diese Bildpixel am besten repräsentiert. Man kann sich vorstellen, dass jeder Faltungsfilter eine Art von Merkmal aus dem Bild extrahiert.
Daher werden Faltungen in der Regel unter Berücksichtigung dieser beiden Dinge durchgeführt –
- Die meisten Merkmale in einem Bild sind normalerweise lokal. Daher ist es sinnvoll, einige lokale Pixel auf einmal zu nehmen und Faltungen anzuwenden.
- Die meisten Merkmale können an mehr als einer Stelle in einem Bild zu finden sein. Das bedeutet, dass es sinnvoll ist, einen einzigen Kernel im gesamten Bild zu verwenden, in der Hoffnung, das Merkmal in verschiedenen Teilen des Bildes zu extrahieren.
Nun, da wir Faltungsfiltergrößen als einen der Hyperparameter zur Auswahl haben. Die Wahl kann zwischen einer kleineren oder größeren Filtergröße getroffen werden.
Bei der Wahl der Faltungsfiltergrößen sind einige Dinge zu beachten – http://bit.ly/2w2Mcf2