En traitement d’images, un noyau, une matrice de convolution ou un masque est une petite matrice. Il est utilisé pour le flou, la netteté, le gaufrage, la détection des bords, et plus encore. Ceci est accompli en faisant une convolution entre un noyau et une image.
Dans cet article, voici quelques conventions que nous suivons –
- Nous faisons spécifiquement référence aux convolutions 2D qui sont généralement appliquées sur des objets à 2 matrices tels que les images. Ces concepts s’appliquent également aux convolutions 1D et 3D, mais peuvent ne pas être en corrélation directe.
- En appliquant des convolutions 2D comme des convolutions 3X3 sur des images, un filtre de convolution 3X3, en général aura toujours une troisième dimension en taille. Ce filtre dépend du (et est égal au) nombre de canaux de l’image d’entrée. Ainsi, nous appliquons un filtre de convolution 3X3X1 sur des images en niveaux de gris (le nombre de canaux = 1) alors que, nous appliquons un filtre de convolution 3X3X3 sur une image colorée (le nombre de canaux = 3).
- Nous désignerons toutes les convolutions par leurs deux premières dimensions, indépendamment des canaux. (Nous observons l’hypothèse d’un remplissage nul).
Un filtre de convolution passe sur tous les pixels de l’image de telle manière qu’à un moment donné, nous prenons le ‘produit scalaire’ du filtre de convolution et des pixels de l’image pour obtenir une valeur finale en sortie. Nous faisons cela en espérant que les poids (ou valeurs) du filtre de convolution, lorsqu’ils sont multipliés par les pixels de l’image correspondants, nous donnent une valeur qui représente au mieux ces pixels de l’image. Nous pouvons penser à chaque filtre de convolution comme extrayant une sorte de caractéristique de l’image.
C’est pourquoi les convolutions sont faites habituellement en gardant ces deux choses à l’esprit –
- La plupart des caractéristiques dans une image sont généralement locales. Par conséquent, il est logique de prendre quelques pixels locaux à la fois et d’appliquer des convolutions.
- La plupart des caractéristiques peuvent être trouvées à plus d’un endroit dans une image. Cela signifie qu’il est logique d’utiliser un seul noyau sur toute l’image, en espérant extraire cette caractéristique dans différentes parties de l’image.
Maintenant que nous avons les tailles des filtres de convolution comme l’un des hyper-paramètres à choisir. Le choix est peut être fait entre une taille de filtre plus petite ou plus grande.
Voici certaines choses à considérer lors du choix des tailles de filtre de convolution – http://bit.ly/2w2Mcf2
.