Filtri di convoluzione 3×3 – Una scelta popolare

Nell’elaborazione delle immagini, un kernel, matrice di convoluzione o maschera è una piccola matrice. Viene usata per la sfocatura, la nitidezza, il rilievo, il rilevamento dei bordi e altro. Questo viene realizzato facendo una convoluzione tra un kernel e un’immagine.

In questo articolo, ecco alcune convenzioni che stiamo seguendo –

  • Si tratta specificamente di convoluzioni 2D che vengono solitamente applicate su oggetti a 2 matrici come le immagini. Questi concetti si applicano anche alle convoluzioni 1D e 3D, ma possono non essere direttamente correlati.
  • Applicando le convoluzioni 2D come le convoluzioni 3X3 sulle immagini, un filtro di convoluzione 3X3, in generale avrà sempre una terza dimensione in dimensione. Questo filtro dipende (ed è uguale) al numero di canali dell’immagine in ingresso. Così, applichiamo un filtro di convoluzione 3X3X1 su immagini in scala di grigi (il numero di canali = 1) mentre, applichiamo un filtro di convoluzione 3X3X3 su un’immagine colorata (il numero di canali = 3).
  • Ci riferiremo a tutte le convoluzioni con le loro prime due dimensioni, indipendentemente dai canali. (Osserviamo l’assunzione di zero padding).

Un filtro di convoluzione passa su tutti i pixel dell’immagine in modo tale che, in un dato momento, si prende il ‘prodotto di punti’ del filtro di convoluzione e i pixel dell’immagine per ottenere un valore finale in uscita. Facciamo questo sperando che i pesi (o valori) nel filtro di convoluzione, quando vengono moltiplicati per i pixel dell’immagine corrispondenti, ci danno un valore che rappresenta meglio quei pixel dell’immagine. Possiamo pensare ad ogni filtro di convoluzione come all’estrazione di qualche tipo di caratteristica dall’immagine.

Quindi, le convoluzioni sono fatte di solito tenendo queste due cose in mente –

  • La maggior parte delle caratteristiche in un’immagine sono di solito locali. Pertanto, ha senso prendere pochi pixel locali in una volta sola e applicare le convoluzioni.
  • La maggior parte delle caratteristiche può essere trovata in più di un posto in un’immagine. Questo significa che ha senso usare un singolo kernel in tutta l’immagine, sperando di estrarre quella caratteristica in diverse parti dell’immagine.

Ora che abbiamo le dimensioni del filtro di convoluzione come uno degli iper-parametri da scegliere. La scelta può essere fatta tra una dimensione del filtro più piccola o più grande.

Ecco alcune cose da considerare mentre si scelgono le dimensioni del filtro di convoluzione – http://bit.ly/2w2Mcf2

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.